<p class="m-t-xs">
地址:遼寧省鐵嶺市開原市開原經濟開發區科研南街25號
</p>
比如上面的!我只要抓取“遼寧”。
我測驗了很久,一直是報錯,不知道是為什么呀!

我是小白,所以求大神給一下具體一點的解決辦法!謝謝了啦!
uj5u.com熱心網友回復:
你代碼里寫的是"地區" 正則可以這樣寫 (?<=地址:).*?(?=省)你是想要做省份識別嗎 cpca這個包了解一下 適用于python3 https://github.com/DQinYuan/chinese_province_city_area_mapper
uj5u.com熱心網友回復:
謝謝 !cpca功能很強大哇!不過我的只需要抓到省份,并將省份錄入表格中就行了!最終我寫成了這樣:
findDiqu=re.compile(r'北京|上海|天津|重慶|河北|山西|內蒙古|遼寧|吉林|黑龍江|江蘇|浙江|安徽|福建|江西|山東|河南|湖北|湖南|廣東|廣西|海南|四川|貴州|云南|西藏|陜西|甘肅|青海|寧夏|新疆')
diqu=findDiqu.search(total)
if diqu is None:
print('沒找到省份')
diquNew=''
else:
diquNew=diqu.group()
基本解決了我的需求!只是有些地址根本沒有上面庫里的!比如很多地址直接是:綿陽市***** 因此就取不到它是屬于四川這個了!不過目前這點對我作業的影響也不是很大。
uj5u.com熱心網友回復:
不客氣 你舉例的 綿陽市***** 這種缺失地址cpca其實也可以直接匹出四川來 很方便實用轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/16590.html
