我有一個資料框,我想將它的特定部分提取到一個新列中。我相信使用正則運算式應該很容易做到這一點。我擁有的資料框是這樣的:
A
0 data-GR1
1 GR2-data
2 data_GR3_data
所需的輸出是獲取另一列中的所有 GR ID,例如:
A B
0 data-GR1 GR1
1 GR2-data GR2
2 data_GR3_data GR3
我認為最好的方法是 df["B"] = df["A"].str.extract(regular expression)
有關如何執行此操作的任何幫助?
uj5u.com熱心網友回復:
使用str.extract:
df['B'] = df['A'].str.extract('(GR\d )', expand=False)
print(df)
# Output
A B
0 data-GR1 GR1
1 GR2-data GR2
2 data_GR3_data GR3
uj5u.com熱心網友回復:
使用命名組
df=df.join(df['A'].str.extract(r'(?P<B>[GR\d] )'))
A B
0 data-GR1 GR1
1 GR2-data GR2
2 data_GR3_data GR3
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/394115.html
