如何從字典創建不同的資料框-有解無憂

我有一個資料框，其中包含保存在兩列下的字典：

Name    Trust_Value                 Affordability_Value
0   J.  {'J.': 0.25, 'M.': 0.23}    {'Z.': 0.024, 'M.': 0.34}
1   M.  {'M.': 0.12, 'S.': 0.14}    {'S.': 0.017, 'B.': 0.21}
1   C.  {'S.': 0.21, 'N.': 0.13}    {'D.': 0.015, 'B.': 0.22}

對于每個名稱，我希望有單獨的資料框，包括Name感興趣的資料框Trust_Value（單獨列中的Affordability_Value鍵和值）和（單獨列中的鍵和值）：

df1 (J.):
Name Trust_Key      Trust_Value         Affordability_Key      Affordability_Value
0   J.  J.             0.25                    Z.                      0.024
        M.             0.23                    M.                      0.34

df2 (M.):
    Name Trust_Key      Trust_Value         Affordability_Key      Affordability_Value
    0   M.  M.             0.12                    S.                      0.017
            S.             0.14                    B.                      0.021


df3 (C.):
    Name Trust_Key      Trust_Value         Affordability_Key      Affordability_Value
    0   M.  S.             0.21                    D.                      0.015
            N.             0.13                    B.                      0.22

我在拆分鍵值對方面沒有任何困難：我的困難在于生成可以將這些值包含在不同列中的不同資料幀。

df.head().to_dict() 的輸出如下（我只取了前三個元素）：

{'Name': {0: 'J.',
  1: 'M.',
  2: 'C.',
  },
 'Trust_Value': {0: {'J.': 0.25,
   'M.': 0.23, 'D.': 0.22, 'S.':0.12,'N.':0.12}, 1: {'M.': 0.12, 'S.': 0.14, 'C.': 0.12, 'D.': 0.12}, 2: {'S.': 0.21, 'N.': 0.13, 'C.':0.34, 'D.':0.12, 'T.':0.42}}, 'Affordability_Value':{0: {'Z.': 0.024,
   'M.': 0.34, 'D.': 0.21, 'X.':0.23,'N.':0.15}, 1: {'S.': 0.51, 'B.': 0.21, 'C.': 0.29, 'D.': 0.12}, 2: {'D.': 0.26, 'B.': 0.26, 'C.':0.38, 'D2.':0.25, 'T.':0.42}}}

uj5u.com熱心網友回復：

你首先需要explode你的字典：

df2 = (df.assign(Trust_Key=df['Trust_Value'].apply(lambda d: d.values()),
                 Affordability_Key=df['Affordability_Value'].apply(lambda d: d.values())
                )
         .set_index('Name')
         .apply(pd.Series.explode)
         .reset_index()
      )

輸出：

   Name Trust_Value Affordability_Value Trust_Key Affordability_Key
0    J.          J.                  Z.      0.25             0.024
1    J.          M.                  M.      0.23              0.34
2    J.          D.                  D.      0.22              0.21
3    J.          S.                  X.      0.12              0.23
4    J.          N.                  N.      0.12              0.15
5    M.          M.                  S.      0.12              0.51
6    M.          S.                  B.      0.14              0.21
7    M.          C.                  C.      0.12              0.29
8    M.          D.                  D.      0.12              0.12
...

然后您可以使用groupby以下方法拆分新資料框：

for name, d in df2.groupby('Name'):
    print(name)
    print(d)
    # you can save to CSV instead
    # d.to_csv(f'{name}.csv')

輸出：

C.
   Name Trust_Value Affordability_Value Trust_Key Affordability_Key
9    C.          S.                  D.      0.21              0.26
10   C.          N.                  B.      0.13              0.26
11   C.          C.                  C.      0.34              0.38
12   C.          D.                 D2.      0.12              0.25
13   C.          T.                  T.      0.42              0.42
...

uj5u.com熱心網友回復：

要重新格式化 DataFrame，您可以保存不同列的鍵和值，然后用它重新創建一個新的 DataFrame。

然后，為了保存未知數量的新資料幀，可以將它們保存到字典中，并通過它們的名稱訪問它們。

import pandas as pd

df = pd.DataFrame({'Name': {0: 'J.', 1: 'M.', 2: 'C.', },
                   'Trust_Value': {0: {'J.': 0.25, 'M.': 0.23, 'D.': 0.22, 'S.':0.12,'N.':0.12}, 1: {'M.': 0.12, 'S.': 0.14, 'C.': 0.12, 'D.': 0.12}, 2: {'S.': 0.21, 'N.': 0.13, 'C.':0.34, 'D.':0.12, 'T.':0.42}},
                   'Affordability_Value':{0: {'Z.': 0.024, 'M.': 0.34, 'D.': 0.21, 'X.':0.23,'N.':0.15}, 1: {'S.': 0.51, 'B.': 0.21, 'C.': 0.29, 'D.': 0.12}, 2: {'D.': 0.26, 'B.': 0.26, 'C.':0.38, 'D.':0.25, 'T.':0.42}}})

dict_df = {}
                   
for index, row in df.iterrows():
    #Get Name
    Name = row["Name"]
    
    #Get Trust_Key & Trust_Value
    Trust_Keys = row["Trust_Value"].keys()
    Trust_Values = row["Trust_Value"].values()

    #Get Affordability_Key & Affordability_Value
    Affordability_Keys = row["Affordability_Value"].keys()
    Affordability_Values = row["Affordability_Value"].values()
    
    dfx = pd.DataFrame(list(zip(Trust_Keys, Trust_Values, Affordability_Keys, Affordability_Values)),
                       columns=["Trust_Key", "Trust_Value", "Affordability_Key", "Affordability_Value"])
    
    dict_df[f"df{Name}"] = dfx
    

#Acces the differents dataframes
for df_name in dict_df:
    print(dict_df[df_name])

希望這能回答你的問題！

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/365130.html

標籤：Python 熊猫数据框

上一篇：Python-在另一個串列中查找串列的所有出現？[復制]

下一篇：解包集合時記憶體中會發生什么？