請問一下技術大神,有沒有這樣一種技術:
比如我們是窩窩團的,有一些未開發的專案想COPY 美團,我們已經可以從美團從截取所有網頁欄位,只需要匹配到我們欄位即可·
但所有程式都是機器來弄,擔心因為關鍵字不同無法匹配:
比如美團 東城美食的 “九門小吃”,其中“一些列的美食介紹描述”是我們需要的!
而我們窩窩團,已經通過技術擁有了他們所有“美食介紹描述‘’
但,我們的標題是”九門美食“ 而美團是”美團小吃“! 因為關鍵字不同,所以拿來的資料匹配不上!
如果單是少些資料我們可以人工解決,問題是資料是海量的,假如有幾十萬個,人工一個個去匹配完全不可能!
所以請教一下大神們,是否有這種技術:
1.即使關鍵字有差別,幾十萬的資料照樣能匹配上;
2 如果不能匹配,是否有一種方法短時間內能樣我們的關鍵字“九門美食”完全匹配”九門小吃“等N多個關鍵字!
謝謝,再次謝謝大神們!
uj5u.com熱心網友回復:
NLTK, natural language processinguj5u.com熱心網友回復:
謝謝樓主分享uj5u.com熱心網友回復:
這個太難了,這是自然語言處理的問題了。我覺得你可以考慮相似度來處理。
uj5u.com熱心網友回復:
謝謝樓主分享uj5u.com熱心網友回復:
同求…………uj5u.com熱心網友回復:
謝謝樓主 我來學習的uj5u.com熱心網友回復:
同求 期待答案揭曉uj5u.com熱心網友回復:
謝謝樓主,學習了轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/92924.html
上一篇:關于hadoop調度問題
下一篇:ios中如何呼叫js
