假設我有一個 pandas 資料框,我想選擇資料框的一列并將值隨機添加到其現有值中,換句話說,我想從該列中選擇隨機值并向它們添加一些常量。我所做的是我選擇了一個樣本
df['column_in_question'].sample(frac=0.2, random_state=1).values 1000
但是這個命令只生成一個值串列并向它們添加 1000,這不是我想要的行為。
uj5u.com熱心網友回復:
您可以通過選擇這些索引來獲取抽樣索引并增加值
indexes = df['column_in_question'].sample(frac=0.2, random_state=1).index
df.loc[indexes, 'column_in_question'] = 1000
# or
df['Number'] = df['Number'].mask(df.index.isin(indexes), df['Number'].add(1000))
# or
import numpy as np
df['Number'] = np.where(df.index.isin(indexes), df['Number'].add(1000), df['Number'])
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/457945.html
上一篇:從R中的多個資料框中過濾行
下一篇:資料幀的條件操作
