我有一張這樣的桌子:
| 第 1 列 | 第 2 列 | 文本 |
|---|---|---|
| 1 | 2 | 蘋果橙車 |
| 2 | 5 | 蘋果樹 |
| 3 | 8 | 蘋果橙 |
| 4 | 7 | 太陽橙 |
| 5 | 8 | 橙子 |
| 6 | 7 | 蘋果橙蘋果 |
現在我想要的是通過Text 列過濾這個 DataFrame ,其中一個(Apple或Orange)出現在文本中,沒有別的。
所以輸出應該是這樣的:
| 第 1 列 | 第 2 列 | 文本 |
|---|---|---|
| 3 | 8 | 蘋果橙 |
| 5 | 8 | 橙子 |
| 6 | 7 | 蘋果橙蘋果 |
實作它的方法是什么?
uj5u.com熱心網友回復:
這將單詞分解成一個串列,將串列變成一個集合,然后使用集合操作來本質上問:
- “
Text集合是{'Apple', 'Orange'}”的子集嗎
df[df.Text.str.split().apply(set).le({'Apple', 'Orange'})]
輸出:
Column1 Column2 Text
2 3 8 Apple Orange
4 5 8 Orange
5 6 7 Apple Orange Apple
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/491333.html
