現在無論是aspose/itextsharp/spire等都是將pdf一整頁的內容讀取下來,而且沒有分段,或者每行就是一段,達不到需求。
先需求將pdf檔案按照段落讀取文本。
請問各位大神有無辦法可以實作?萬分感謝。
uj5u.com熱心網友回復:
整頁讀取內容后,按換行判斷是否是段落?uj5u.com熱心網友回復:
問題就是讀取整頁后,每一行末尾都是換行符。
uj5u.com熱心網友回復:
現在我找到的辦法是aspose.pdf 18.1以上版本中,ParagraphAbsorber這個物件,據說可以實作讀取pdf段落,然而這個aspose需要破解版才能用,目前沒找到最新的破解版。uj5u.com熱心網友回復:
是不是這個https://blog.csdn.net/weirtang/article/details/89367345
uj5u.com熱心網友回復:
感覺不對呢。這個強簽名問題,前提得有破解版。
uj5u.com熱心網友回復:
現在我找到的辦法是aspose.pdf 18.1以上版本中,ParagraphAbsorber這個物件,據說可以實作讀取pdf段落,然而這個aspose需要破解版才能用,目前沒找到最新的破解版。
是不是這個https://blog.csdn.net/weirtang/article/details/89367345
感覺不對呢。這個強簽名問題,前提得有破解版。
不是有源碼??下載看看
uj5u.com熱心網友回復:
現在我找到的辦法是aspose.pdf 18.1以上版本中,ParagraphAbsorber這個物件,據說可以實作讀取pdf段落,然而這個aspose需要破解版才能用,目前沒找到最新的破解版。
是不是這個https://blog.csdn.net/weirtang/article/details/89367345
感覺不對呢。這個強簽名問題,前提得有破解版。
不是有源碼??下載看看
沒找到可以用的Aspose.PDF 18版本以上的源。
uj5u.com熱心網友回復:
Spire.PDF可以實作讀取指定范圍內的文本,不過需要對文本位置進行一定計算,你看看能不能實作你的需求
這個我知道,取PDF頁面中一部分矩形框,但是我現在的PDF檔案位置都是未知的,不知道段落在哪里起止,所以定位扣出來的辦法不可用。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/135077.html
標籤:C#
上一篇:Bad Request - Invalid Header
下一篇:delphi轉c#
