目前正在處理包含大量聯系人資料的資料集,電子郵件是變數之一。
電子郵件列中的一個單元格可以包含多個電子郵件(1 到 n),并且它們都由逗號和空格分隔。
對于只有兩封電子郵件的聯系人,該程序將非常簡單。可以拆分字串并為該輔助電子郵件創建一個新列,如下所示
email_df[['Emails', 'SecondaryEmail']] = email_df['Emails'].str.split(', ', expand=True)
但是,這不適用于超過 2 封電子郵件。因此,我想知道當電子郵件的數量可以從 1 變為 n 時(在這種情況下,n 限制在 10 左右,但情況并非總是如此),將電子郵件拆分為帶有的列的最有效方法是什么每人只有一封電子郵件(每人都有不同的名字)?
uj5u.com熱心網友回復:
處理后使用with洗掉列:Series.str.splitSeries.str.rsplitDataFrame.popEmail
df = email_df.join(email_df.pop('Emails').str.split(', ', expand=True).add_prefix('Email'))
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/437192.html
上一篇:如何創建一個長正整數
