我有一個類似于以下示例的資料框:
import pandas as pd
data = pd.DataFrame(data={'col1': [1,2,3,4,5,6,7,8,9], 'col2': [1.55,1.55,1.55,1.8,1.9,1.9,1.9,2.1,2.1]})
在第二列 col2 中,可以看到幾個重復值,3 次 1.55、3 次 1.9 和 2 次 2.1。我需要做的是洗掉與其前一行重復的所有行。所以,第一行是我想保留的。在此示例中,這將是 col2 值為 1、4、5、8 的行,將以下資料框作為我想要的輸出:
clean_data = pd.DataFrame(data={'col1': [1,4,5,8], 'col2': [1.55,1.8,1.9,2.1]})
對于比這個小示例大得多(就行而言)的資料框,最好的方法是什么?
uj5u.com熱心網友回復:
您可以使用shift:
data.loc[data['col2'] != data['col2'].shift(1)]
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/535599.html
下一篇:熊貓合并問題
