我有一個重復的資料框:
timestamp id ch is_eval. c
12. 1. 1. False. 2
13. 1. 0. False. 1
12. 1. 1. True. 4
13. 1 0. False. 3
當有重復時,總是當我想drop_duplicates使用鍵但保持為 True(timestamp,id,ch)的行時 。is_eval意思是,如果有一行,is_eval==True則保留它。否則,沒關系。所以這里的輸出應該是:
12. 1. 1. True. 4
13. 1 0. False. 1
我該怎么做?
uj5u.com熱心網友回復:
利用:
df = df.sort_values('is_eval', kind='mergesort', ascending=False).drop_duplicates(['timestamp','id','ch'])
print (df)
timestamp id ch is_eval c
2 12 1 1 True 4
1 13 1 0 False 1
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/484957.html
