在給定特定條件的范圍內計算列中的值-有解無憂

我有這個代碼

df = pd.DataFrame({'R': {0: '1', 1: '2', 2: '3', 3: '4', 4: '5', 5: '6', 6: '7'}, 'an': {0: 'f', 1: 'i', 2: '-', 3: '-', 4: 'f', 5: 'c,f,i,j', 6: 'c,d,e,j'}, 'nv1': {0: [-1.0], 1: [-1.0], 2: [], 3: [], 4: [-2.0], 5: [-2.0, -1.0, -3.0, -1.0], 6: [-2.0, -1.0, -2.0, -1.0]}})

產生以下資料框：

    nv1
0   [-1.0]
1   [-1.0]
2   []
3   []
4   [-2.0]
5   [-2.0, -1.0, -3.0, -1.0]
6   [-2.0, -1.0, -2.0, -1.0]

我希望創建新列來計算列 df['nv1'] 上每行中有多少值低于 -1。

所需的輸出如下：

    nv1                      ct
0   [-1.0]                    
1   [-1.0]                   
2   []                       
3   []                       
4   [-2.0]                    1  
5   [-2.0, -1.0, -3.0, -1.0]  2
6   [-2.0, -1.0, -2.0, -1.0]  2

我分別嘗試了下面的兩行代碼，但遇到了錯誤：

df['ct'] = np.sum((df['nv1']>-1))
df['ct'] = df['nv1'].mask(lambda x: x.ne(x>[-1])).transform('count')

uj5u.com熱心網友回復：

你需要在這里回圈。

使用Series.applylambda 函式和sum：

df['ct'] = df['nv1'].apply(lambda s: sum(e<-1 for e in s))

或者使用經典的回圈理解：

df['ct'] = [sum(e<-1 for e in s) for s in df['nv1']]

輸出：

   R       an                       nv1  ct
0  1        f                    [-1.0]   0
1  2        i                    [-1.0]   0
2  3        -                        []   0
3  4        -                        []   0
4  5        f                    [-2.0]   1
5  6  c,f,i,j  [-2.0, -1.0, -3.0, -1.0]   2
6  7  c,d,e,j  [-2.0, -1.0, -2.0, -1.0]   2

如果你真的想要空字串代替零：

df['ct'] = [S if (S:=sum(e<-1 for e in s)) else '' for s in df['nv1']]

輸出：

   R       an                       nv1 ct
0  1        f                    [-1.0]   
1  2        i                    [-1.0]   
2  3        -                        []   
3  4        -                        []   
4  5        f                    [-2.0]  1
5  6  c,f,i,j  [-2.0, -1.0, -3.0, -1.0]  2
6  7  c,d,e,j  [-2.0, -1.0, -2.0, -1.0]  2

uj5u.com熱心網友回復：

使用 lambda 函式sum：

df['ct'] = df['nv1'].apply(lambda x: sum(y <-1 for y in x))

print (df)
   R       an                       nv1  ct
0  1        f                    [-1.0]   0
1  2        i                    [-1.0]   0
2  3        -                        []   0
3  4        -                        []   0
4  5        f                    [-2.0]   1
5  6  c,f,i,j  [-2.0, -1.0, -3.0, -1.0]   2
6  7  c,d,e,j  [-2.0, -1.0, -2.0, -1.0]   2

另一個想法是通過串列創建 DataFrame 并與 less 進行-1比較sum：

df['ct'] = pd.DataFrame(df['nv1'].tolist(), index=df.index).lt(-1).sum(axis=1)

轉載請註明出處，本文鏈接：https://www.uj5u.com/shujuku/444005.html

標籤：熊猫数数范围

上一篇：用兩列中存在的缺失范圍填充DataFrame

下一篇：在PandasGroupby中，在某些條件下找到最遠的行