.NET 按段落讀取PDF檔案-有解無憂

現在無論是aspose/itextsharp/spire等都是將pdf一整頁的內容讀取下來，而且沒有分段，或者每行就是一段，達不到需求。
先需求將pdf檔案按照段落讀取文本。
請問各位大神有無辦法可以實作？萬分感謝。

uj5u.com熱心網友回復：

整頁讀取內容后，按換行判斷是否是段落？

uj5u.com熱心網友回復：

參考 1 樓娃都會打醬油了的回復:

整頁讀取內容后，按換行判斷是否是段落？

問題就是讀取整頁后，每一行末尾都是換行符。

uj5u.com熱心網友回復：

現在我找到的辦法是aspose.pdf 18.1以上版本中，ParagraphAbsorber這個物件，據說可以實作讀取pdf段落，然而這個aspose需要破解版才能用，目前沒找到最新的破解版。

uj5u.com熱心網友回復：

參考 3 樓 zmahcool 的回復:

現在我找到的辦法是aspose.pdf 18.1以上版本中，ParagraphAbsorber這個物件，據說可以實作讀取pdf段落，然而這個aspose需要破解版才能用，目前沒找到最新的破解版。

是不是這個https://blog.csdn.net/weirtang/article/details/89367345

uj5u.com熱心網友回復：

參考 4 樓 ManBOyyy 的回復:

Quote: 參考 3 樓 zmahcool 的回復:

現在我找到的辦法是aspose.pdf 18.1以上版本中，ParagraphAbsorber這個物件，據說可以實作讀取pdf段落，然而這個aspose需要破解版才能用，目前沒找到最新的破解版。

是不是這個https://blog.csdn.net/weirtang/article/details/89367345

感覺不對呢。這個強簽名問題，前提得有破解版。

uj5u.com熱心網友回復：

參考 5 樓 zmahcool 的回復:

Quote: 參考 4 樓 ManBOyyy 的回復:

Quote: 參考 3 樓 zmahcool 的回復:

現在我找到的辦法是aspose.pdf 18.1以上版本中，ParagraphAbsorber這個物件，據說可以實作讀取pdf段落，然而這個aspose需要破解版才能用，目前沒找到最新的破解版。

是不是這個https://blog.csdn.net/weirtang/article/details/89367345

感覺不對呢。這個強簽名問題，前提得有破解版。

不是有源碼？？下載看看

uj5u.com熱心網友回復：

參考 6 樓 ManBOyyy 的回復:

Quote: 參考 5 樓 zmahcool 的回復:

Quote: 參考 4 樓 ManBOyyy 的回復:

Quote: 參考 3 樓 zmahcool 的回復:

現在我找到的辦法是aspose.pdf 18.1以上版本中，ParagraphAbsorber這個物件，據說可以實作讀取pdf段落，然而這個aspose需要破解版才能用，目前沒找到最新的破解版。

是不是這個https://blog.csdn.net/weirtang/article/details/89367345

感覺不對呢。這個強簽名問題，前提得有破解版。

不是有源碼？？下載看看

沒找到可以用的Aspose.PDF 18版本以上的源。

uj5u.com熱心網友回復：

參考 7 樓 Miaonly 的回復:

Spire.PDF可以實作讀取指定范圍內的文本，不過需要對文本位置進行一定計算，你看看能不能實作你的需求

這個我知道，取PDF頁面中一部分矩形框，但是我現在的PDF檔案位置都是未知的，不知道段落在哪里起止，所以定位扣出來的辦法不可用。

轉載請註明出處，本文鏈接：https://www.uj5u.com/net/135077.html

標籤：C#

上一篇：Bad Request - Invalid Header

下一篇：delphi轉c#