當我運行這個腳本時,我可以驗證它是否遍歷所有值,但并非所有值都傳遞到我的字典中
file = open('path', 'rb')
readFile = PyPDF2.PdfFileReader(file)
lineData = {}
totalPages = readFile.numPages
for i in range(totalPages):
pageObj = readFile.getPage(i)
pageText = pageObj.extractText
newTrans = re.compile(r'Jan \d{2,}')
for line in pageText(pageObj).split('\n'):
if newTrans.match(line):
newValue = re.split(r'Jan \d{2,}', line)
newValueStr = ' '.join(newValue)
newKey = newTrans.findall(line)
newKeyStr = ' '.join(newKey)
print(newKeyStr newValueStr)
lineData[newKeyStr] = newValueStr
print(len(lineData))
有 80 多個資料對,但是當我運行這個時,dict 只得到 37
uj5u.com熱心網友回復:
好吧,重復鍵,也許?嘗試制作 lineData = [] 并在此處追加: lineData.append({newKeyStr:newValueStr} 然后檢查您獲得了多少條記錄。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/528183.html
