我有一個名為的資料框train_df:
| 文本 | 標簽 |
|---|---|
| 我愛 Instagram | |
| 我愛領英 | 領英 |
| 我愛臉書 | |
| 我愛推特 | 推特 |
我正在嘗試將文本放入串列并將串列放入字典中,鍵是標簽,例如
my_dict = {'Instagram' : [我愛 Instagram], 'Linkedin': [我愛 Linkedin]...}
目前,我為完成此操作而撰寫的代碼是:
my_dict = dict()
for i in train_df.label.unique():
my_dict[i] = " ".join(train_df[train_df["label"] == "@i"]["text"].tolist())
我得到了如上所述的字典,但值為空。我不確定我做錯了什么,非常感謝任何幫助。非常感謝!!!
uj5u.com熱心網友回復:
我希望能幫助你:
my_dict = dict()
for i in train_df.label.unique():
my_dict[i] = train_df.loc[train_df.label == i, 'text'].values.tolist()
uj5u.com熱心網友回復:
按'label'( train_df.groupby('label'))分組,將分組的文本聚合成串列( ...['text'].agg(list)),然后使用to_dict方法將得到的DataFrame轉換為字典
my_dict = train_df.groupby('label')['text'].agg(list).to_dict()
uj5u.com熱心網友回復:
# Convert to lists
textList = df["text"].tolist()
labelList = def["label"].tolist()
# Create a dictionary
my_dict = {}
for i, label in enumerate(labelList):
my_dict[label] = textList[i]
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/349880.html
