我嘗試.parq使用以下腳本讀取存盤在 GitHub 專案中的 parquet () 檔案:
import pandas as pd
import numpy as np
import ipywidgets as widgets
import datetime
from ipywidgets import interactive
from IPython.display import display, Javascript
import warnings
warnings.filterwarnings('ignore')
parquet_file = r'https://github.com/smaanan/sev.en_commodities/blob/main/random_deals.parq'
df = pd.read_parquet(parquet_file, engine='auto')
它給了我這個錯誤:
ArrowInvalid:無法打開 Parquet 輸入源“”:在頁腳中找不到 Parquet 魔術位元組。檔案已損壞,或者這不是鑲木地板檔案。
有誰知道此錯誤訊息的含義以及如何將檔案加載到我的 GitHub 存盤庫中?先感謝您。
uj5u.com熱心網友回復:
您應該使用域下的 URL raw.githubusercontent.com。
至于你的例子:
parquet_file = 'https://raw.githubusercontent.com/smaanan/sev.en_commodities/main/random_deals.parq'
df = pd.read_parquet(parquet_file, engine='auto')
uj5u.com熱心網友回復:
您可以像這樣直接從 Web URL 讀取鑲木地板檔案。但是,從 git 存盤庫中讀取資料檔案時,您需要確保它是原始檔案 url:
url = 'https://github.com/smaanan/sev.en_commodities/blob/main/random_deals.parq?raw=true'
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/482859.html
