我有多個 csv 檔案,我可以使用關鍵字將它們作為資料框加載到字典中
# reading files into dataframes
csvDict = {}
for index, rows in keywords.iterrows():
eachKey = rows.Keyword
csvFile = "SRT21" eachKey ".csv"
csvDict[eachKey] = pd.read_csv(csvFile)
現在我有其他功能可以應用于每個資料框的特定列。
在單個資料幀上,代碼將是這樣的
df['Cat_Frames'] = df['Cat_Frames'].apply(process)
df['Cat_Frames'] = df['Cat_Frames'].apply(cleandata)
df['Cat_Frames'] = df['Cat_Frames'].fillna(' ')
我的問題是如何遍歷字典中的每個資料框來應用這些功能?
我努力了
for item in csvDict.items():
df = pd.DataFrame(item)
df
它給了我空的結果
任何解決方案或建議?
uj5u.com熱心網友回復:
您可以apply像這樣鏈接 s:
for key, df in csvDict.items():
df['Cat_Frames'] = df['Cat_Frames'].apply(process).apply(cleandata).fillna(' ')
uj5u.com熱心網友回復:
Items 回傳一個鍵/值元組,所以你應該讓你的 for 回圈實際上說:
for key, value in csvDict.items():
print(df)
如果您不在 jupyter 中,您還需要列印 df
uj5u.com熱心網友回復:
for key, value in csvDict.items():
df = pd.DataFrame(value)
df
我認為這就是您應該遍歷字典的方式。
uj5u.com熱心網友回復:
當沒有處理來自一個資料集/框架的資料涉及另一個資料集時,不要收集資料集。
只需處理當前的,然后繼續下一個。
接收“未打包值”的變數的常規名稱不會被使用_:
for _, df in csvDict.items():
df['Cat_Frames'] = df['Cat_Frames'].apply(process).apply(…
- 但為什么要鑰匙忽略它們呢?迭代值:
for df in csvDict.values():
df['Cat_Frames'] = df['Cat_Frames'].apply(process).apply(…
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/438552.html
