我正在嘗試做一些相當簡單的事情:將每個文本框存盤在一個 powerpoint 檔案中,作為一個巨大的 python 串列中的一個元素。這段代碼應該讓我得到這個結果:
text_array = []
for eachfile in glob.glob("master_folder\*.pptx"):
prs = Presentation(eachfile)
#print(eachfile)
#print("----------------------")
for slide in prs.slides:
for shape in slide.shapes:
if hasattr(shape, "text"):
text_array.append(shape.text)
但是,就像其他一些關于 SO ( PPTX Package not Found ) 的問題一樣,我收到了錯誤:
PackageNotFoundError:在“master_folder\April_2020.pptx”中找不到包
我試過的:
- 仔細檢查我的版本/依賴項:一切似乎都井井有條/兼容
- 從檔案和目錄中洗掉所有空格
但是,錯誤仍然存??在。
問題
有使用這個庫經驗的人能否為我指出正確的方向來完成抓取檔案內文本并將其存盤在本機 python 串列中的簡單任務(如我的代碼中所示)?
uj5u.com熱心網友回復:
- 檔案不存在
- 檔案不是有效的 pptx(解壓縮檔案并檢查檔案夾和檔案結構)
- 檔案已損壞(在 MS Office 中打開、更改、保存可能會修復)
- python沒有訪問權限
- 檔案被鎖定,例如被 MS Office 打開
如果你找不到任何東西,可以提供一個不起作用的示例 pptx。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/415236.html
標籤:
