主要實作2個功能
1. 把用戶輸入的不規范的地址分離成規范省 市 區 街道 號碼...
2. 從很多資訊中提取出地址來
有幾個問題請教大家
1. python 是不是最好的語言來實作這個功能?
因為python中有很多庫可以呼叫
2.
第一個功能的實作,我大致是這樣想的
首先對用戶輸入的地址進行分詞,然后拿每一個詞和字典里面比較,取匹配度最大的
此時就要需要至少兩個庫
1). 一個分詞庫來對用戶輸入進行分詞, 有沒有專門針對地址進行分詞的庫?我看了網上有很多庫,但不是針對地址, 比如nlp, 結巴,復旦分詞,哈工大分詞等等
2 ). 第二個是字典,分完之后和字典里面比較,這個字典如何獲取?
對這個進行爬蟲嗎?http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2015/index.html ,這個是個好方法嗎?
有沒有更簡便的方法
3. 第二個功能還在考慮之中,大家有什么看法?
uj5u.com熱心網友回復:
你好 ,我現在也要做中文地址匹配,請問你的功能1實作了嘛?能不能分享交流下,我的郵箱[email protected]uj5u.com熱心網友回復:
你好,我也在做這一塊,能交流分享一下嗎?我郵箱[email protected]uj5u.com熱心網友回復:
一個聊天小程式xafkav.com.歡迎探討uj5u.com熱心網友回復:
建議看看這篇文章 https://www.weupgo.cn/?p=361uj5u.com熱心網友回復:
樓主都說了jieba不是專門應對地址的分詞,你還讓人家看jieba的介紹轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/16544.html
標籤:人工智能技術
