我有一個 Pandas 資料框,我想在其中找到列中唯一值的數量 Title并洗掉所有具有重復項(keep=False邏輯)的行,但前提Format是第二列不相同。其他列 ( Publisher, Year) 應被忽略。
原始 df:
Title Format Publisher Year
T1 F1 P1 2010
T1 F1 P2 2014
T2 F2 P1 2012
T3 F1 P3 2016
T4 F3 P2 2009
T4 F1 P3 2010
T4 F2 P3 2011
所需的過濾 df:
Title Format Publisher Year
T1 F1 P1 2010
T1 F1 P2 2014
T2 F2 P1 2012
T3 F1 P3 2016
然后我就用df["Title"].nunique()get 3。我需要過濾后的 df 和最終數字以進行進一步分析。
謝謝!
uj5u.com熱心網友回復:
DataFrameGroupBy.nunique與GroupBy.transform每個組一起使用并過濾,如果1在boolean indexing:
df[df.groupby('Title')["Format"].transform('nunique').eq(1)]
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/346967.html
