我的代碼使用 drop_duplicates,keep=false 洗掉所有重復項。
我遇到的問題是,在洗掉重復項之前,我想將所有洗掉的重復項移動到單獨的資料框中。我想出了下面的代碼行,但是我認為它留下了一個重復項,而不是洗掉所有重復項。
duplicates_df = combined_df.loc[combined_df.duplicated(subset='Unique_ID_Count'), :]
combined_df.drop_duplicates(subset='Unique_ID_Count', inplace=True, keep=False)
您對如何將第二行代碼中洗掉的所有重復項移動到 duplicates_df 資料框有任何想法嗎?
任何幫助將不勝感激,謝謝!
uj5u.com熱心網友回復:
嘗試這個:
duplicates_df = combined_df.loc[combined_df.duplicated(subset='Unique_ID_Count', keep=False)]
combined_df = combined_df.loc[~combined_df.duplicated(subset='Unique_ID_Count', keep=False)]
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/441257.html
