您如何從 df 列中洗掉 paratheses(包括 paratheses)中的文本?例如:
| 指數 | 描述 |
|---|---|
| 0 | 牛肉(牛)) |
| 1 | 豬肉(豬) |
| 2 | 熱狗(豬) |
| 3 | 雞肉(雞肉) |
| 4 | 魚條(魚)) |
應該:
| 指數 | 產品 |
|---|---|
| 0 | 牛肉 |
| 1 | 豬肉 |
| 2 | 熱狗 |
| 3 | 雞 |
| 4 | 魚棒 |
uj5u.com熱心網友回復:
使用str.replace用正則運算式,像這樣:
df["description"] = df["description"].str.replace(r'\s \([^()]*\)', '')
\s匹配括號前的任何空格\((字面上匹配[^()]*不是任何字符匹配(或)中,*使得重復\))字面上匹配
uj5u.com熱心網友回復:
一種使用方式pandas.Series.str.replace:
df["description"] = df["description"].str.replace("\( . ?\) ", "", regex=True)
print(df)
輸出:
index description
0 0 Beef
1 1 Pork
2 2 Hot Dog
3 3 Chicken
4 4 Fish Sticks
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/381298.html
上一篇:將列轉換為資料框列geaders
