我有一個包含四列的 csv 檔案。前兩列是單個字串,后兩列是多值串列。使用熊貓資料框拉入列,我正在嘗試制作一系列字典。第一個很簡單——
df = pd.read_csv('data.csv')
dict1 = dict(zip(df[col_1],df[col_2]))
- 但是現在,我正在嘗試制作
{col_1: col_3}and{col_1: col_4},其中 col_3 和 col_4 每個都有多個值,我發現更難讓 pandas/python 生成我正在尋找的東西。
我的 csv 資料結構如下:
col_1, col_2, col_3, col_4
John Doe, A4w, "22,35,67", "45,78,99"
我想要的輸出是一個字典,其中 col_1 中的條目是鍵,值是 col_3 中每個單獨專案的串列(然后是另一個以相同方式構建的 col_4 字典)。
到目前為止,我已經能夠讓熊貓給我,{John Doe:"22,35,67"}但我想要的是{John Doe:['22','35','67']}. (我需要能夠稍后遍歷串列)。如何在此處將“多個值”更改為“串列”?
uj5u.com熱心網友回復:
我相信在這種情況下,您必須.str.split(',')在要轉換為串列的列中使用 ,例如:
df = pd.DataFrame({'col1' : 'John Doe', 'col2' : 'A4w', 'col3' : "22,35,67", 'col4' : "45,78,99"}, index = [0])
print(dict(zip(df['col1'], df['col3'].str.split(','))))
# {'John Doe': ['22', '35', '67']}
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/360836.html
上一篇:修復不匹配的矩陣
下一篇:如何在字串串列中查找字母序列?
