有沒有辦法通過lambda函式來參考字典理解中的資料幀？-有解無憂

我試圖仿效存在的R行為mutate(across())有Pandas，而且做起來的一個班輪方式是通過字典決議。例如，如果我有一個如下所示的 DataFrame：

df.head()

>>>            jam_cpi_eop  bah_cpi_eop
>>> 1980-01-01       3.038       38.714
>>> 1981-01-01       3.183       42.193
>>> 1982-01-01       3.406       44.115
>>> 1983-01-01       3.974       45.653
>>> 1984-01-01       5.212       47.748

我想一次性獲取我的 DataFrame的np.log()ofjam_cpi_eop和bah_cpi_eop列，我可以撰寫以下代碼：

df1 = df.assign(
        **{f'l{col.name}': np.log(col) for col in [df.jam_cpi_eop, df.bah_cpi_eop]}
    )

df1.head()
>>>             jam_cpi_eop    bah_cpi_eop  ljam_cpi_eop    lbah_cpi_eop
>>> 1980-01-01        3.038         38.714      1.111199        3.656201
>>> 1981-01-01        3.183         42.193      1.157824        3.742254
>>> 1982-01-01        3.406         44.115      1.225539        3.786800
>>> 1983-01-01        3.974         45.653      1.379773        3.821069
>>> 1984-01-01        5.212         47.748      1.650964        3.865937

問題是，如果我需要對新創建的列ljam_cpi_eop和進行更多操作lbah_cpi_eop，我就不能再df用作參考了。有沒有辦法將 lambda 函式傳遞給字典理解中的串列？

我希望類似以下幾行，但它不起作用。

### DOESN'T WORK!
df1 = df.assign(
        **{f'l{col.name}': np.log(col) for col in [lambda x: x.jam_cpi_eop, x.bah_cpi_eop]})

編輯：

我需要的是在第二步中獲取日志的差異。例如，以下代碼有效：

df1 = df.assign(
        **{f'd{col.name}': col - col.shift(1) for col in [df.jam_cpi_eop, df.bah_cpi_eop]})

但我想采用我在第一步中創建的日志變數的差異，而不是原始列的差異。

我知道我可以通過分配一個中間資料幀來做到這一點，但我有興趣知道是否有辦法在不創建中間資料幀的情況下做到這一點。

uj5u.com熱心網友回復：

不要使用回圈，只需應用向量操作：

df1_log = np.log(df1)

輸出：

            jam_cpi_eop  bah_cpi_eop
1980-01-01     1.111199     3.656201
1981-01-01     1.157824     3.742254
1982-01-01     1.225539     3.786800
1983-01-01     1.379773     3.821069
1984-01-01     1.650964     3.865937

合并兩個資料幀：

df1_combined = df1.join(np.log(df1).add_prefix('l'))

輸出：

            jam_cpi_eop  bah_cpi_eop  ljam_cpi_eop  lbah_cpi_eop
1980-01-01        3.038       38.714      1.111199      3.656201
1981-01-01        3.183       42.193      1.157824      3.742254
1982-01-01        3.406       44.115      1.225539      3.786800
1983-01-01        3.974       45.653      1.379773      3.821069
1984-01-01        5.212       47.748      1.650964      3.865937

如果您有其他不想影響的列：

# columns on which to apply the transform
cols = ['jam_cpi_eop', 'bah_cpi_eop']

# apply transform on subset and combine
df1_combined = df1.join(np.log(df1[cols]).add_prefix('l'))

uj5u.com熱心網友回復：

有沒有辦法將 lambda 函式傳遞給字典理解中的串列？

實作這一目標的一種方法是使用 DataFrame.pipe

df = (df
 .pipe(lambda x: x.assign(**{f'l{col.name}': np.log(col) for col in [x.jam_cpi_eop, x.bah_cpi_eop]}))
 .pipe(lambda x: x.assign(**{f'l{col.name}': col - col.shift(1) for col in [x.ljam_cpi_eop, x.lbah_cpi_eop]}))
)

結果：

              jam_cpi_eop  bah_cpi_eop  ljam_cpi_eop  lbah_cpi_eop  lljam_cpi_eop  llbah_cpi_eop
1980-01-01        3.038       38.714      1.111199      3.656201            NaN            NaN
1981-01-01        3.183       42.193      1.157824      3.742254       0.046625       0.086053
1982-01-01        3.406       44.115      1.225539      3.786800       0.067714       0.044546
1983-01-01        3.974       45.653      1.379773      3.821069       0.154235       0.034269
1984-01-01        5.212       47.748      1.650964      3.865937       0.271191       0.044868

uj5u.com熱心網友回復：

將其拆分使其更干凈；我覺得您正在跨語法擴展 mutate（這是我的個人觀點）：

step1 = df.pipe(np.log).add_prefix('l')
step2 = step1.sub(step1.shift()).add_prefix('d')
df.assign(**step1, **step2)
 
            jam_cpi_eop  bah_cpi_eop  ljam_cpi_eop  lbah_cpi_eop  dljam_cpi_eop  dlbah_cpi_eop
1980-01-01        3.038       38.714      1.111199      3.656201            NaN            NaN
1981-01-01        3.183       42.193      1.157824      3.742254       0.046625       0.086053
1982-01-01        3.406       44.115      1.225539      3.786800       0.067714       0.044546
1983-01-01        3.974       45.653      1.379773      3.821069       0.154235       0.034269
1984-01-01        5.212       47.748      1.650964      3.865937       0.271191       0.044868

如果您想使用鏈接方法來復制 mutate...cross，分配和管道與解包的組合可能會有所幫助（我覺得它會降低可讀性）：

(df.assign(**df.pipe(np.log).add_prefix('l'))
   .pipe(lambda df: df.assign(**df.filter(like='l').sub(df.filter(like='l')
                                  .shift())
                                  .add_prefix('d'))
                             )
)

            jam_cpi_eop  bah_cpi_eop  ljam_cpi_eop  lbah_cpi_eop  dljam_cpi_eop  dlbah_cpi_eop
1980-01-01        3.038       38.714      1.111199      3.656201            NaN            NaN
1981-01-01        3.183       42.193      1.157824      3.742254       0.046625       0.086053
1982-01-01        3.406       44.115      1.225539      3.786800       0.067714       0.044546
1983-01-01        3.974       45.653      1.379773      3.821069       0.154235       0.034269
1984-01-01        5.212       47.748      1.650964      3.865937       0.271191       0.044868

轉載請註明出處，本文鏈接：https://www.uj5u.com/qiye/315286.html

標籤：Python 熊猫数据框拉姆达字典理解

上一篇：根據上一個值在資料框中創建下一行

下一篇：如何在Julia資料幀中轉換紀元/Unix時間？