我有一個資料框:
id type value
1 inner Upload new model. \nUpdate data.
2 outer Create new task.
我想通過拆分其中的文本并放入新行來拆分列值中具有 \n 的行。所以想要的結果是:
id type value
1 inner Upload new model.
1 inner Update data.
2 outer Create new task.
例如,這個資料框,真實的要大得多,所以我需要撰寫一個函式來應用到資料框。我怎么能那樣做?
uj5u.com熱心網友回復:
也許這會有所幫助:
>>> df.assign(value=df['value'].str.split('\n')).explode('value')
'''
id type value
0 1 inner Upload new model.
0 1 inner Update data.
1 2 outer Create new task.
uj5u.com熱心網友回復:
您可以執行以下操作:
df['value'] = df['value'].replace(r'\\n', '\\n ', regex=True)
\n這在和下一個單詞之間放置了一個規范。然后
(df.set_index(['id', 'type'])
.apply(lambda x: x.str.split('\\n ').explode())
.reset_index())
這使
id type value
0 1 inner Upload new model.
1 1 inner Update data.
2 2 outer Create new task.
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/480911.html
標籤:Python python-3.x 数据框 功能
