對于 CSV 檔案,我有時會使用nrows=引數進行除錯并“加速”讀取 XLSX 檔案。
pandas.read_excel()我通過讀取超過 400k 行的 excel 檔案測驗了相同的引數。但無論我nrows=10是否使用nrows.
結果當然只有 10 行。
我認為這是因為 Excel 檔案格式在閱讀時無法物理跳過/忽略行?
uj5u.com熱心網友回復:
決議 XLSX 檔案涉及打開 ZIP(OOXML檔案是 XML 檔案的 zip),決議一些 XML 以找出存在哪些作業表,然后決議特定作業表的 XML 并解釋內容以找出每個單元格的內容等。
這不像打開一個文本檔案并且只讀取十行那么簡單。
我可能會建議將 XLS(X) 檔案讀入一次資料幀,然后例如腌制該資料幀以供后續使用。如果您喜歡,您可以撰寫一個無形地為您執行此操作的函式(嘗試查找檔案的“快取”腌制版本)。
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/503704.html
下一篇:按類別映射excel值
