我正在嘗試在熊貓資料框中連接 4 個字串變數。資料框是這樣的:
Morada 1 Morada 2 Localidade Postal Code
RUA DOS QUATRO CAMINHOS VEREDA 2 N 14 4DTO SUL CANIDELO 4400-501
RUA DOS QUATRO CAMINHOS VEREDA 2 N 14 4DTO SUL CANIDELO 4400-501
Rua chieiras n543 2.9B Vila Nova de Gaia 4400-415
RUA BOMBEIROS VOLUNTáRIOS DECOIM BR?ES 202 CASA3 Vila Nova de Gaia 4400-057
R DA BELGICA 2387 Vila Nova de Gaia 4400-053
例如,對于第一行變數,我正試圖得到這樣的東西
RUA DOS QUATRO CAMINHOS VEREDA 2 N 14 4DTO SUL CANIDELO 4400-501
另一方面,對于缺少變數“Morada 2”的第 3 行,目標是得到這個:
Rua chieiras n543 2.9B Vila Nova de Gaia 4400-415
在資料框中,這 4 個變數中的每一個都可能丟失,例如,可能是 NA 值。我的目標是通過忽略不適用的字串來連接字串。
我想知道是否有一種方法可以不涉及所有可能的缺失值條件。
謝謝!
uj5u.com熱心網友回復:
您可以DataFrame像下面的示例一樣使用 lambda 組合:
df['combined'] = df.apply(lambda row: ' '.join(row.dropna().astype(str)), axis=1)
這將為您創建一個新列,其中連接了組合字串,忽略缺失值。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/456082.html
下一篇:用前綴重命名新的拆分列
