我有一列由數字組成的陣列,即[0,80,160,220],并想創建一列相鄰術語之間差異的陣列,即[80,80,60]
有沒有人知道如何在 Python 或 PySpark 中解決這個問題?我正在考慮迭代的東西(從第二個學期開始,第 i 個詞減去第 i-1 個詞),但我真的很困惑如何編碼。謝謝!
uj5u.com熱心網友回復:
編輯:
d=[0,80,160,220]
df=pd.DataFrame(d,columns= ['col_list'])
df['col_new']=df['col_list'].diff()
print(df)
#output
col_list col_new
0 0 NaN
1 80 80.0
2 160 80.0
3 220 60.0
此外,如果您想洗掉該行,NaN您可以執行以下操作:
df.dropna(subset = ['col_new'])
#output
col_list col_new
1 80 80.0
2 160 80.0
3 220 60.0
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/329735.html
上一篇:雖然回圈沒有中斷(Python)
下一篇:Spring引導變數/嵌套請求體
