我正在處理多標簽影像分類任務。我有一個包含兩列(id 和標簽)的資料框。我想創建一個新列,它檢查 id 是否有重復,如果有重復(就是這種情況),則應將附加標簽分配給新列。結果應該是一個包含所有標簽的新列。我正在努力將標簽作為串列寫在新列中。有人可以在這里支持我嗎?
我的 df 具有以下結構:
| id | labels |
| -------- | -------------- |
| x.jpg | label_1 |
| x.jpg | label_2 |
新資料框
| id | labels | all_labels |
| -------- | -------------- |-------------------
| x.jpg | label_1 | [label_1, label_2, and other if existent]
| x.jpg | label_2 |
uj5u.com熱心網友回復:
我認為這可以滿足您的要求,盡管格式有點不同:
newdf = df.groupby('id')['labels'].agg(list).reset_index(name='labels')
生產
id labels
0 x.jpg [label_1, label_2]
1 y.jpg [label_3]
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/515881.html
下一篇:回圈遍歷串列以創建dict
