我在“檔案名”列中有如下所示的 csv 檔案,并且我希望標簽列名稱只有下劃線 (_) 之前的單詞,例如:輸出如下
filename label
我怎樣才能從下面的列中只提取那些詞并粘貼到標簽列中。
uj5u.com熱心網友回復:
使用str.split()方法,并假設您將 csv 作為資料框匯入:
import pandas as pd
df = pd.read_csv('file_path')
df['label'] = df['filename'].str.split('____').str[0]
uj5u.com熱心網友回復:
也許你可以試試
import padndas as pd
data = pd.read_csv('file_path')
def extract_label(filename):
rerurn filename.split('____')[0]
data['label'] = data['filename'].apply(lambda filename:extract_label(filename))
uj5u.com熱心網友回復:
df['label'] = df.apply(lambda row:row['filename'].split('____')[0], axis=1)
uj5u.com熱心網友回復:
請在您的代碼上嘗試這一行。
df['Label'] = [x.split("___")[0] for x in df['filename']]
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/389515.html
上一篇:Python:每行平均值的廣告列
