當列的條目重復時，在資料框中添加一個空行-有解無憂

我有一個存盤時間序列資料的資料框

請在下面找到代碼

import pandas as pd
from pprint import pprint

d = {
    't': [0, 1, 2, 0, 2, 0, 1],
    'input': [2, 2, 2, 2, 2, 2, 4],
    'type': ['A', 'A', 'A', 'B', 'B', 'B', 'A'],
    'value': [0.1, 0.2, 0.3, 1, 2, 3, 1],
}
df = pd.DataFrame(d)
pprint(df)

df>
t  input type  value
0      2    A    0.1
1      2    A    0.2
2      2    A    0.3
0      2    B    1.0
2      2    B    2.0
0      2    B    3.0
1      4    A    1.0

當列的第一個條目t重復時，我想添加一個空行。

預期輸出：

df>
t  input type  value
0      2    A    0.1
1      2    A    0.2
2      2    A    0.3

0      2    B    1.0
2      2    B    2.0

0      2    B    3.0
1      4    A    1.0

我不知道該怎么做。建議將非常有幫助。

編輯： dup = df['t'].eq(0).shift(-1, fill_value=False)

t在si 0行中開始值時有幫助。

但它也可能是一個非零值，如下例所示。附加示例：

d = {
    't': [25, 35, 90, 25, 90, 25, 35],
    'input': [2, 2, 2, 2, 2, 2, 4],
    'type': ['A', 'A', 'A', 'B', 'B', 'B', 'A'],
    'value': [0.1, 0.2, 0.3, 1, 2, 3, 1],
}

uj5u.com熱心網友回復：

有幾種方法可以實作這一點

選項1

你可以使用groupby.apply：

(df.groupby(df['t'].eq(0).cumsum(), as_index=False, group_keys=False)
   .apply(lambda d: pd.concat([d, pd.Series(index=d.columns, name='').to_frame().T]))
)

輸出：

     t  input type  value
0  0.0    2.0    A    0.1
1  1.0    2.0    A    0.2
2  2.0    2.0    A    0.3
   NaN    NaN  NaN    NaN
3  0.0    2.0    B    1.0
4  2.0    2.0    B    2.0
   NaN    NaN  NaN    NaN
5  0.0    2.0    B    3.0
6  1.0    4.0    A    1.0
   NaN    NaN  NaN    NaN

選項 2

如果索引已經排序，則另一種選擇：

dup = df['t'].eq(0).shift(-1, fill_value=False)

pd.concat([df, df.loc[dup].assign(**{c: '' for c in df})]).sort_index()

輸出：

   t input type value
0  0     2    A   0.1
1  1     2    A   0.2
2  2     2    A   0.3
2                    
3  0     2    B   1.0
4  2     2    B   2.0
4                    
5  0     2    B   3.0
6  1     4    A   1.0

分組附錄

當值減小時設定組：

dup = df['t'].diff().lt(0).cumsum()

(df.groupby(dup, as_index=False, group_keys=False)
   .apply(lambda d: pd.concat([d, pd.Series(index=d.columns, name='').to_frame().T]))
)

uj5u.com熱心網友回復：

因為groupby通常很慢，您可以DataFrame按連續組創建助手，用于0在t列中開始，加入concat和排序：

#groups starting by 0
df.index = df['t'].eq(0).cumsum()

#groups starting by difference if less like 0
df.index = (~df['t'].diff().gt(0)).cumsum()

df = (pd.concat([df, pd.DataFrame('', columns=df.columns, index=df.index.unique())])
        .sort_index(kind='mergesort', ignore_index=True)
        .iloc[:-1])
print (df)
   t input type value
0  0     2    A   0.1
1  1     2    A   0.2
2  2     2    A   0.3
3                    
4  0     2    B   1.0
5  2     2    B   2.0
6                    
7  0     2    B   3.0
8  1     4    A   1.0

df.index = (~df['t'].diff().gt(0)).cumsum()

df = (pd.concat([df, pd.DataFrame(' ', columns=df.columns, index=df.index.unique())])
        .sort_index(kind='mergesort', ignore_index=True)
        .iloc[:-1])
print (df)
    t input type value
0  25     2    A   0.1
1  35     2    A   0.2
2  90     2    A   0.3
3                     
4  25     2    B   1.0
5  90     2    B   2.0
6                     
7  25     2    B   3.0
8  35     4    A   1.0

uj5u.com熱心網友回復：

這是我的建議：

pd.concat([pd.DataFrame(index=df.index[df.t == df.t.iat[0]][1:]), df]).sort_index()

      t  input type  value
0  25.0    2.0    A    0.1
1  35.0    2.0    A    0.2
2  90.0    2.0    A    0.3
3   NaN    NaN  NaN    NaN
3  25.0    2.0    B    1.0
4  90.0    2.0    B    2.0
5   NaN    NaN  NaN    NaN
5  25.0    2.0    B    3.0
6  35.0    4.0    A    1.0

轉載請註明出處，本文鏈接：https://www.uj5u.com/gongcheng/471313.html

標籤：Python python-3.x 熊猫数据框

上一篇：在AutoML上實施ComputerVison以使用.NII檔案格式的MRI影像對癡呆癥進行分類

下一篇：為什么即使回圈離開了該數字，仍會繼續列印數字？