我利用pyhanlp進行一些分詞操作,自定義了一些詞典添加了一些新詞和詞性,并配置好了路徑問題,但是在處理檔案時,遇到數學符號或者字母不能很好的分出來,例如“{|a+b|}”其中“{,|,}”這些符號我已經在自定義詞典中定義了詞性和詞頻(將“{”等定義為數學符號),但是還是不能完全分開,實際效果“|}/w”想要效果“|/數學符號”“}/數學符號”一個一個符號分出來。看了很多資料也不是很清楚,求大佬們解答
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/195608.html
