示例 csv 檔案:
myId tags
0 id_1 \N
1 id_1 \N
2 id_1 \N
3 id_1 \N
4 id_2 "[""tag1""]"
5 id_2 "[""tag1""]"
6 id_2 "[""tag0"",""tag1""]"
7 id_3 \N
8 id_3 \N
9 id_3 "[""tag1""]"
10 id_3 \N
由此,我只想用熊貓回傳 id_2 。但為什么我想要它?因為只有那個 id 在它的所有成員中都有“tag1”。所以這就是我無法弄清楚如何查詢的事情。我想回傳在其所有成員中都帶有 tag1 的 ID 。例如,我不想要 id_3,因為 4 個成員中只有 1 個有 tag1 標簽,我也不想要 id_1,因為它的成員都沒有 tag1。另一方面,id_2 的所有成員在其標簽串列中都有一個 tag1。
有人可以幫助如何用熊貓查詢嗎?這只是一個小例子,我想知道如何做這樣的事情。
提前致謝。
uj5u.com熱心網友回復:
您可以計算一個掩碼來檢查all每組的條目是否包含該模式,然后切片:
mask = df['tags'].str.contains('tag1').groupby(df['myId']).transform('all')
df[mask]
輸出:
myId tags
4 id_2 "[""tag1""]"
5 id_2 "[""tag1""]"
6 id_2 "[""tag0"",""tag1""]"
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/400753.html
