通過比較當前行的值和Pandas中的前一個值來創建新列-有解無憂

給定一個虛擬資料集df如下：

   year   v1   v2
0  2017  0.3  0.1
1  2018  0.1  0.1
2  2019 -0.2  0.5
3  2020  NaN -0.3
4  2021  0.8  0.0

或者：

[{'year': 2017, 'v1': 0.3, 'v2': 0.1},
 {'year': 2018, 'v1': 0.1, 'v2': 0.1},
 {'year': 2019, 'v1': -0.2, 'v2': 0.5},
 {'year': 2020, 'v1': nan, 'v2': -0.3},
 {'year': 2021, 'v1': 0.8, 'v2': 0.0}]

我需要創建兩列trend_v1，并trend_v2根據v1與v2分別。

創建新列的邏輯是這樣的：對于每一列，如果當前值大于前一列，則趨勢值為increase，如果當前值小于前一列，則趨勢值為decrease，如果當前值等于前一個，趨勢值為equal，如果當前或前一個值為NaN，趨勢也為NaN。

   year   v1   v2  trend_v1  trend_v2
0  2017  0.3  0.1       NaN       NaN
1  2018  0.1  0.1  decrease     equal
2  2019 -0.2  0.5  decrease  increase
3  2020  NaN -0.3       NaN  decrease
4  2021  0.8  0.0       NaN  increase

我怎么能在 Pandas 中做到這一點？提前感謝您的幫助。

uj5u.com熱心網友回復：

您可以通過將移位值與過濾后的缺失值進行比較來指定測驗趨勢的列：

cols = ['v1','v2']
arr = np.where(df[cols] < df[cols].shift(),'decrease',
      np.where(df[cols] > df[cols].shift(),'increase',
      np.where(df[cols].isna() | df[cols].shift().isna(), None, 'equal')))

df = df.join(pd.DataFrame(arr, columns=cols, index=df.index).add_prefix('trend_'))
print (df)
   year   v1   v2  trend_v1  trend_v2
0  2017  0.3  0.1      None      None
1  2018  0.1  0.1  decrease     equal
2  2019 -0.2  0.5  decrease  increase
3  2020  NaN -0.3      None  decrease
4  2021  0.8  0.0      None  increase

或者：

cols = ['v1','v2']

m1 = df[cols] < df[cols].shift()
m2 = df[cols] > df[cols].shift()
m3 = df[cols].isna() | df[cols].shift().isna()

arr = np.select([m1, m2, m3],['decrease','increase', None], default='equal')

df = df.join(pd.DataFrame(arr, columns=cols, index=df.index).add_prefix('trend_'))

編輯：

不錯的改進是m3評論中提到的變化：

cols = ['v1','v2']

m1 = df[cols] < df[cols].shift()
m2 = df[cols] > df[cols].shift()
m3 = df[cols] == df[cols].shift()

arr = np.select([m1, m2, m3],['decrease','increase', 'equal'], default=None)

轉載請註明出處，本文鏈接：https://www.uj5u.com/net/313011.html

標籤：蟒蛇-3.x 熊猫数据框

上一篇：檢查資料框中的值是否更有可能增加或減少

下一篇：Pandas->DataFrame->按價格排名