我有一個看起來像這樣的熊貓資料框(csv格式,第一行是標題):
employee_id, workplace, rank
1, google, 1
1, facebook, 2
1, apple, 3
2, amazon, 1
2, google, 2
2, netflix, 3
employee_id: 代表唯一的員工 IDworkplace: 代表員工在某個時間點的作業場所rank:代表當員工在那里作業-例如,“1”表示,他們目前在那里作業。“2”表示這是他們以前的作業場所。“3”是他們在“2”作業之前作業過的地方。等等。
我的目標是找出哪里谷歌員工之前在谷歌(作業作業立即以前的作業)?
例如,輸出將是(csv格式,第一行是標題):
first_previous_workplace_for_googlers
facebook
netflix
有任何想法嗎?
uj5u.com熱心網友回復:
假設您的資料框已按以下方式排序rank:
first_previous_workplace = lambda x: x.eq('google').shift(fill_value=False)
out = df[df.groupby('employee_id')['workplace'].apply(first_previous_workplace)]
print(out)
# Output
employee_id workplace rank
1 1 facebook 2
5 2 netflix 3
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/402291.html
標籤:
