使用Pythonpandas根據列增量對相同的值進行分組-有解無憂

我想要做的是在特定時間段內使用 python 資料框對 0 的值進行分組，例如我有：

| Time (seconds) | Value |
|       1        |   0   |
|       2        |   0   |
|       3        |   0   |
|       4        |   1   |
|       5        |   0   |
|       6        |   1   |
|       7        |   1   |
|       8        |   0   |
|       9        |   0   |
|       10       |   0   |
|       11       |   1   |
|       12       |   0   |
|       13       |   0   |

我期望的輸出是：

| Time (seconds) | Value | Group |
|       1        |   0   |   1   |
|       2        |   0   |   1   |
|       3        |   0   |   1   |
|       4        |   1   |       |
|       5        |   0   |   2   |
|       6        |   1   |       |
|       7        |   1   |       |
|       8        |   0   |   3   |
|       9        |   0   |   3   |
|       10       |   0   |   3   |
|       11       |   1   |       |
|       12       |   0   |   4   |
|       13       |   0   |   4   |

uj5u.com熱心網友回復：

您可以檢查當值的變化使用shift，cumsum和面膜：

s = df['value'].eq(0)
df['group'] = (s&s.ne(s.shift())).cumsum().where(s, 0)

輸出：

    time  value  group
0      1      0      1
1      2      0      1
2      3      0      1
3      4      1      0
4      5      0      2
5      6      1      0
6      7      1      0
7      8      0      3
8      9      0      3
9     10      0      3
10    11      1      0
11    12      0      4
12    13      0      4

uj5u.com熱心網友回復：

您可以嘗試cumsum然后傳遞給factorize

s = df.Value.ne(0)

df.loc[df.index[~s],'new'] = s.cumsum()[~s].factorize()[0] 1

uj5u.com熱心網友回復：

這是一個使用以下方法的奇怪解決方案numpy.split：

arr = df['Value'].to_numpy()
counter = 1
out = []
for ar in np.split(arr, np.where(arr==1)[0]):
    mask = ar==0
    out.append(np.where(mask, counter, 0))
    if mask.any():
        counter  = 1
df['Group'] = np.concatenate(out)

輸出：

    Time  Value  Group
0      1      0      1
1      2      0      1
2      3      0      1
3      4      1      0
4      5      0      2
5      6      1      0
6      7      1      0
7      8      0      3
8      9      0      3
9     10      0      3
10    11      1      0
11    12      0      4
12    13      0      4I’m

轉載請註明出處，本文鏈接：https://www.uj5u.com/net/388175.html

標籤：Python 熊猫数据框 pandas-groupby

上一篇：熊貓：根據同一資料幀的日期時間索引查找添加新列

下一篇：在Pandas中，是否有任何矢量化的方式來檢查列的字串是否為子字串？