我試圖從 PDF 中提取復選框值,我可以在下面的代碼的幫助下提取復選框值,我從 stackoverflow 中的一個執行緒中找到該代碼,它由@Fabian 提供。
Python:PDF:如何從帶有單選按鈕的表單中讀取
filename = 'Accordd1.pdf'
fp = open(filename, 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
fields = resolve1(doc.catalog['AcroForm'])['Fields']
for i in fields:
field = resolve1(i)
name = str(field.get('T'),'utf-8')
value = field.get('V')
if value != None:
value = str(value)
if value[0] == r"/":
value = value[2:-1]
value = str(value)
print (f'{name}: {value}')
以下是我得到的輸出:
Check Box47: None
Check Box48: None
Check Box49: None
Check Box50: None
Check Box51: None
Check Box52: None
Check Box53: None
Check Box54: None
Check Box55: None
Text56: None
我對 Python 編程非常陌生,無法將此輸出轉換為 DataFrame,因為我想將其匯出到 Excel 中 - 我嘗試將資料附加到一個空白串列中,但它沒有給我正確的結果。任何幫助將非常感激。
非常感謝您!
uj5u.com熱心網友回復:
IUC:
import pandas as pd
data = []
for i in fields:
#Rest of logic
print (f'{name}: {value}')
data.append([name, value])
df = pd.DataFrame(data, columns=['name', 'value'])
df.to_excel("output.xlsx", index=False)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/390992.html
上一篇:用戶鍵鍵盤輸入
下一篇:將資料幀的兩列轉換為多索引
