如何根據python中其他列的單元格條件移動列的位置-有解無憂

我需要一些關于 python 的幫助。這是我想要實作的目標。

我有一個如下所示的資料集：

import pandas as pd



# define data
data = {'A': [55, "g", 35, 10,'pj'], 'B': [454, 27, 895, 3545,34], 
        'C': [4, 786, 7, 3, 896], 
        'Phone Number': [123456789, 7, 3456789012, 4567890123, 1],'another_col':[None,234567890,None,None,215478565]}
pd.DataFrame(data)

    A   B       C   Phone Number    another_col
0   55  454     4   123456789          None
1   g   27     786  7               234567890.0
2   35  895     7   3456789012         None
3   10  3545    3   4567890123         None
4   pj  34     896  1               215478565.0

我已經從 pdf 中提取了這些資料，不幸的是它在資料框中添加了一些隨機字串，如上圖所示。我想檢查任何列中的任何單元格是否包含字串或非數字值。如果是這樣，則洗掉該字串并將整行向左移動。最后，想要的輸出如下圖所示：

    A   B      C    Phone Number     another_col
0   55  454    4    1.234568e 08        None
1   27  786    7    2.345679e 08        None
2   35  895    7    3.456789e 09        None
3   10  3545   3    4.567890e 09        None
4   34  896    1    2.15478565 8        None

我將衷心感謝您的幫助。

uj5u.com熱心網友回復：

一種方法是使用to_numeric將每個值強制轉換為數值，然后使用向左移動每一行dropna：

out = (df.apply(pd.to_numeric, errors='coerce')
       .apply(lambda x: pd.Series(x.dropna().tolist(), index=df.columns.drop('another_col')), axis=1))

輸出：

      A       B    C  Phone Number
0  55.0   454.0  4.0  1.234568e 08
1  27.0   786.0  7.0  2.345679e 08
2  35.0   895.0  7.0  3.456789e 09
3  10.0  3545.0  3.0  4.567890e 09
4  34.0   896.0  1.0  2.154786e 08

uj5u.com熱心網友回復：

您可以創建布爾掩碼，shift并且pd.concat：

m=pd.to_numeric(df['A'], errors='coerce').isna()
pd.concat([df.loc[~m], df.loc[m].shift(-1, axis=1)]).sort_index()

輸出：

    A     B  C  Phone Number  another_col
0  55   454  4  1.234568e 08          NaN
1  27   786  7  2.345679e 08          NaN
2  35   895  7  3.456789e 09          NaN
3  10  3545  3  4.567890e 09          NaN
4  34   896  1  2.154786e 08          NaN

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/457236.html

標籤：Python 正则表达式熊猫细绳数据框

上一篇：找不到導航物件。您的組件在NavigationContainer內嗎

下一篇：如果許多列包含字串，則輸入該行的值