我在 Pandas 資料框中有兩個字串列。
我想檢查的是,如果兩行在一列中具有相同的值,那么它們在另一列中具有相同的值。
idx col1 col2
1 A X
2 B Y
3 B Y
4 A X
5 C Z
在上面的示例中,col1 和 col2 具有不同的值,但兩列實際上是相同的,因為兩列都可以分為索引 {1,4}、{2,3} 和 {5}。
idx col1 col2
1 A X
2 B X
3 B Y
4 A X
5 C Z
上表中,不符合要求。如何在 Pandas 或其他 python 庫中檢查兩列是否滿足此要求?
uj5u.com熱心網友回復:
factorize如果全部為Trues,則比較d 列:
same = np.all(pd.factorize(df['col1'])[0] == pd.factorize(df['col2'])[0])
print (same)
True
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/366381.html
上一篇:根據資料框的條件格式添加字串
