想要實作:
對一份無固定格式的中文個人簡歷,進行資訊抽取決議,最終輸出到對應欄位的為JSON格式
各位大神有比較好的思路,大家可以一起討論交流
不想完全用正則運算式實作,后期維護成本太高了
uj5u.com熱心網友回復:
主要還是要自己找資訊的規律uj5u.com熱心網友回復:
除了類似“姓名”,“學歷”,“作業經歷”這些標題之外,其他資訊也沒有規律。樓上的大神能否提供一下大概的思路呢?uj5u.com熱心網友回復:
對一份無固定格式的中文個人簡歷,進行資訊抽取決議,最終輸出到對應欄位的為JSON格式招實習生人工處理。
uj5u.com熱心網友回復:
樓主,你好,請問解決問題了嗎?
uj5u.com熱心網友回復:
可以使用NLP處理試試先分段分句,然后分詞
關鍵詞提取:人工維護關鍵詞及相近詞(電子郵件:電郵,郵件,信箱,email),從段落的分詞結果中提取關鍵詞,提取資訊
uj5u.com熱心網友回復:
jieba搭配機器學習可破,但你這成本有點高啊uj5u.com熱心網友回復:
用nlp處理比較好吧 我們用的是spacy庫uj5u.com熱心網友回復:
spacy如何處理中文的呢?
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/57328.html
上一篇:【求助】Visual Studio Code中運行粘貼的python代碼總是報錯
下一篇:求大神出手相助,運行出錯
