如何有效地將多行插入到具有缺失值的pandasDF中？-有解無憂

我有一個DF：

df = pd.DataFrame({"A":[0,1,3,5,6], "B":['B0','B1','B3','B5','B6'], "C":['C0','C1','C3','C5','C6']})

我試圖在 A 列的連續序列中缺失數字的位置插入 10 個空行。對于這 10 行，A、B 和 C 列的值分別是缺失的數字 Nan 和 Nan。像這樣：

A   B   C
0   B0  C0
1   B1  C1
2   NaN NaN
2   NaN NaN
2   NaN NaN
2   NaN NaN
2   NaN NaN
2   NaN NaN
2   NaN NaN
2   NaN NaN
2   NaN NaN
2   NaN NaN
3   B3  C3
4   NaN NaN
4   NaN NaN
4   NaN NaN
4   NaN NaN
4   NaN NaN
4   NaN NaN
4   NaN NaN
4   NaN NaN
4   NaN NaN
4   NaN NaN
5   B5  C5
6   B6  C6

我玩過索引，但這只增加了 1 行：

df1 = df.merge(how='right', on='A', right = pd.DataFrame({'A':np.arange(df.iloc[0]['A'],
                                                                        df.iloc[-1]['A'] 1)})).reset_index().drop(['index'], axis=1)

提前致謝！

uj5u.com熱心網友回復：

讓我們嘗試使用值高于 1 和repeat的索引：diffconcat

N = 10
out = (pd.concat([df, df[['A']].loc[df.index.repeat(df['A'].diff(-1).lt(-1).mul(N-1))]])
         .sort_index(kind='stable')
      )

輸出：

   A    B    C
0  0   B0   C0
1  1   B1   C1
1  1  NaN  NaN
1  1  NaN  NaN
1  1  NaN  NaN
1  1  NaN  NaN
1  1  NaN  NaN
1  1  NaN  NaN
1  1  NaN  NaN
1  1  NaN  NaN
1  1  NaN  NaN
2  3   B3   C3
2  3  NaN  NaN
2  3  NaN  NaN
2  3  NaN  NaN
2  3  NaN  NaN
2  3  NaN  NaN
2  3  NaN  NaN
2  3  NaN  NaN
2  3  NaN  NaN
2  3  NaN  NaN
3  5   B5   C5
4  6   B6   C6

uj5u.com熱心網友回復：

一種方法如下：

首先，使用df.set_index使列A成為索引。
接下來，使用range一個從0through 到 max of A(ie 6) 的范圍。
現在，申請df.reindex基于np.repeat。我們使用回圈將 a 饋送1到repeats引數中存在的所有值A，對于所有缺失的值，我們使用10.
最后，鏈df.reset_index。

df.set_index('A', inplace=True)
rng = range(df.index.max() 1)
df = df.reindex(np.repeat(rng,[1 if i in df.index else 10 for i in rng]))\
    .reset_index(drop=False)

print(df)

    A    B    C
0   0   B0   C0
1   1   B1   C1
2   2  NaN  NaN
3   2  NaN  NaN
4   2  NaN  NaN
5   2  NaN  NaN
6   2  NaN  NaN
7   2  NaN  NaN
8   2  NaN  NaN
9   2  NaN  NaN
10  2  NaN  NaN
11  2  NaN  NaN
12  3   B3   C3
13  4  NaN  NaN
14  4  NaN  NaN
15  4  NaN  NaN
16  4  NaN  NaN
17  4  NaN  NaN
18  4  NaN  NaN
19  4  NaN  NaN
20  4  NaN  NaN
21  4  NaN  NaN
22  4  NaN  NaN
23  5   B5   C5
24  6   B6   C6

轉載請註明出處，本文鏈接：https://www.uj5u.com/caozuo/533448.html

標籤：Python熊猫麻木的

上一篇：獨立左移2DNumpy陣列的每一行

下一篇：2個未知方程引發NotImplementedError