我有一列“已發布”,其值類似于“1980 年 6 月 13 日(美國)”
我想從這個字串中獲取年份,所以我嘗試使用以下代碼
df['year_correct'] = df['released'].astype(str).str[',':'(']
但它在新的“year_correct”列中將所有值回傳為 Nan。請幫忙
uj5u.com熱心網友回復:
更好的方法可能是使用單詞分隔符 ( \b) 提取 4 位值,以確保不超過 4 位:
df['year_correct'] = df['released'].astype(str).str.extract(r'\b(\d{4})\b')
例子:
released year_correct
0 June 13, 1980 (United States) 1980
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/519474.html
