我為 R 提出了這個問題,但現在嘗試在 Python 中做同樣的事情。
我有一個包含 10000 行的資料框。
Author Value
aaa 111
aaa 112
bbb 156
bbb 165
ccc 543
ccc 256
每個作者有 4 行,所以我有 2500 個作者。
我想將所有字串替換為數值。理想情況下與tidyverse.
預期產出
Author Value
1 111
1 112
2 156
2 165
3 543
3 256
---------
2500 451
2500 234
謝謝!
uj5u.com熱心網友回復:
使用pd.factorize():
df['Author'] = pd.factorize(df['Author'])[0] 1
uj5u.com熱心網友回復:
另一種方式,cumsum 連續列值的布林值
df['Author'] = (df['Author']!=df['Author'].shift()).cumsum()
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/434041.html
