我在 jupyter notebook 上與我公司的客戶有一個 df,他們正在回答一項可以多次回答的研究,并且資料時間已注冊。我想選擇每個客戶的最新答案并將其組合在一個新的資料框中。
我嘗試使用:
df_1 = df[df['提交日期'] == df['提交日期'].max()].copy()
但是 .max () 只是選擇最新的日期,因此 df_1 只得到 1 個值。我是這個領域的新手,如果有一些初學者級別的錯誤,我很抱歉。
uj5u.com熱心網友回復:
您需要按回答日期升序排序,然后按回答的客戶洗掉重復項。如果遇到多個值,則保留最后一個客戶,以確保您有最新的答案。代碼如下所示:
df.sort_values('Submit Date').drop_duplicates(subset=['customer'], keep=’last’)
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/448259.html
標籤:Python 熊猫 数据框 jupyter-笔记本
