我有一列需要提取和分離所有型別,然后將這些提取型別添加回資料框中。我試圖實作str.extract()方法,但沒有得到任何地方。
列示例:
|title||genres|
|-----||------|
|Cowboy Bebop||['Comedy', 'Dementia', 'Horror', 'Seinen']|
理想新欄目:
|title||genres|
|-----||------|
|Cowboy Bebop||'Comedy'|
|CowBoy Bebop||'Dementia'|
|CowBoy Bebop||'Horror'|
|CowBoy Bebop||'Seinen'|
uj5u.com熱心網友回復:
你需要pandas.DataFrame.explode:
df = df.explode('genres').reset_index(drop=True)
輸出:
>>> df
title genres
0 Cowboy Bebop Comedy
1 Cowboy Bebop Dementia
2 Cowboy Bebop Horror
3 Cowboy Bebop Seinen
請注意,您可能需要將genres列中的值轉換為實際串列,因為它可能看起來像一個串列,但實際上是一個字串。如果是這樣,請在上述之前運行:
import ast
df['genres'] = df['genres'].apply(ast.literal_eval)
uj5u.com熱心網友回復:
這將為您提供 .explode() 所需的結果
data = {'title' : ['Cowboy Bebop'], 'genres' : [['Comedy', 'Dementia', 'Horror', 'Seinen']]}
df = pd.DataFrame(data)
df = df.explode('genres')
df
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/441256.html
標籤:熊猫 数据框 熊猫-groupby
