這兩天被折磨的夠嗆。
我一個寫業務的垃圾竟然被派來搞這種事情。
需求是做一個東西可以識別用戶輸入的文本的意圖,比如用戶說“打開空調”我就能識別到“開空調”的意圖。
初步的邏輯都做差不多了,比如用白名單和正則過濾啊之類的,但是最后有一步,按照設想是如果正則搞不定,就用向量機模型搞定。
也就是SVM。
但實際上壓根不知道這個怎么用。
ok,前提介紹完畢,然后是問題,求教啊~~
在網上找了份原始碼,大概看了下libsvm用來生成模型的文本是怎么來的了,計算一些CHI、TF、IDF、TF-UDF之類的,自己打通了流程生成了對應的檔案和模型,但是在使用上出現了問題。
libSVM的資料格式是這樣的
Label 1:value 2:value ….
按照本人的理解哈,label對應的意圖,123對應的是第幾個有效詞(和單詞做了對應關系),value對應的就是這個詞的權重。
但是根據我對原始碼的閱讀,發現權重value的值是Tfidf,這個值是和當前單詞在文本和樣本中出現的頻率等有關,那么我如果用老的模型來識別一句新的文本,這個value要怎么獲得/計算呢?
uj5u.com熱心網友回復:
噗,一個人都沒啊……uj5u.com熱心網友回復:
這估計涉及到機器學習,人工智能方面,可能java版很少有人了解,建議去人工智能版塊那邊去問問uj5u.com熱心網友回復:
……渣java開發,入行尚淺,啥都不懂,十分感謝
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/83964.html
標籤:人工智能技術
上一篇:使用Python中的客戶端子網選項決議dns(edns)
下一篇:win10的mysql-front連接后報1109錯誤我的mysql版本是8.0.19是我的mysql版本太高了嗎,
