我正在處理列名為df['Location']的資料子集:
開羅,埃及開羅
埃及開羅,開羅,埃及
埃及,開羅
埃及開羅,開羅,埃及
埃及,開羅
埃及,開羅
埃及,開羅
埃及
埃及
埃及
埃及開羅,開羅,埃及
本哈,埃及,Al Qalyubiyah
開羅,埃及,開羅
開羅,埃及,開羅
開羅,埃及,開羅
Alexandria, Alexandria, 埃及
新開羅,埃及開羅
亞歷山大,埃及,亞歷山大
埃及,開羅
開羅,埃及,開羅
新開羅,埃及開羅
新開羅,埃及開羅
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
開羅,埃及開羅
Alexandria, Alexandria, 埃及
新開羅,埃及開羅
開羅,埃及,開羅
吉薩,埃及,Al Jizah
10月6日,埃及,開羅
吉薩,埃及,Al Jizah
埃及,開羅
開羅,埃及,開羅
Qesm El Nozha,埃及,開羅
吉薩,Al Jizah,埃及
埃及
開羅,埃及,開羅
開羅,埃及,開羅
開羅,埃及,開羅
埃及,開羅,開羅,埃及
埃及
新開羅,埃及開羅
10月6日,埃及,開羅
埃及開羅,開羅,埃及
埃及,開羅
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
埃及,開羅
埃及開羅,開羅,埃及
開羅,埃及開羅
Alexandria, Alexandria, 埃及
埃及,開羅
埃及開羅,開羅,埃及
新開羅,埃及開羅
埃及,開羅
埃及,開羅
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
Markaz Banha,埃及,Al Qalyubiyah
Qesm El Maadi, 開羅,埃及
埃及
吉薩,埃及,Al Jizah
埃及開羅,開羅,埃及
埃及,開羅
埃及,開羅
Qesm El Maadi,埃及,開羅
齋月10日,埃及,沙爾基亞
吉薩,埃及,Al Jizah
開羅,埃及,開羅
開羅,埃及,開羅
開羅,埃及,開羅
開羅,埃及,開羅
埃及,開羅
埃及開羅,開羅,埃及
埃及,開羅
埃及,開羅
埃及,開羅
埃及
埃及
埃及
埃及開羅,開羅,埃及
本哈,埃及,Al Qalyubiyah
開羅,埃及,開羅
開羅,埃及,開羅
開羅,埃及,開羅
Alexandria, Alexandria, 埃及
新開羅,埃及開羅
亞歷山大,埃及,亞歷山大
埃及,開羅
開羅,埃及,開羅
新開羅,埃及開羅
新開羅,埃及開羅
埃及開羅,開羅,埃及
埃及開羅,開羅,埃及
我想把這個資料分成城市和省市兩欄,其中城市是最左邊的條目,我想說,如果它少于3個條目或者城市條目='Cairo'(這是一個省市,而不是一個城市,我想說,在'省市名稱'中未指定的城市,這是第二個條目!另外,如果只有1個條目,我想說,省市沒有指定
P.S output is formatted as (city, governate,country)
uj5u.com熱心網友回復:
應用分割字串的函式:
def split_fun(x)。
lst = x.split(', ')
政府 = ''/span>
城市 = ''/span>
country = lst[-1]
if len(lst) > 1: gov = lst[-2]
if len(lst) == 3: city = lst[0]
return pd.Series([city, gov, country])
df[['City', 'Gov', 'Country']] = df['Location'].apply( split_fun
地點 城市 政府 國家
0 開羅,埃及 開羅 開羅 埃及
1 埃及開羅,開羅 埃及開羅
2 埃及開羅 埃及開羅
3 埃及開羅,開羅 埃及開羅
4 埃及開羅 埃及開羅
.. ... ... ... ...
94 埃及開羅,開羅 埃及開羅
95 新開羅,埃及開羅 新開羅 埃及
96 埃及開羅的新開羅,埃及 新開羅 開羅 埃及
97 開羅,埃及開羅 埃及開羅 埃及開羅
98 開羅,埃及開羅 埃及開羅 埃及開羅
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/326410.html
標籤:
