機器學習多示例學習討論研究,記錄平時的想法等等,歡迎參與討論??
uj5u.com熱心網友回復:
想法1:基于訓練正包中所有的實體構建樹結構
步驟:
1)概念1:訓練正包中所有的實體,簡稱為正實體池。
??2)從正實體池中隨機選取一個實體作為根結點;
??3)計算其余實體與根結點的相似性,例如余弦相似性;
??4)小于一定閾值,例如小于 0.5 0.5 0.5的實體作為左子樹,余下為右子樹;
??5)重復以上步驟,每一個結點需要記錄所屬包的序號;
??6)對于每一個包,映射時,包中的每一個實體從根結點開始計算相似性,記錄走的路徑,例如用哈夫曼編碼記錄。
??7)目前的問題是怎么統一映射后的長度?
參與者:因吉、天不生我喜哥
uj5u.com熱心網友回復:
uj5u.com熱心網友回復:
這樣建樹的時間開銷比較大哦uj5u.com熱心網友回復:
如何建樹減少時間開銷,可以按照比例來選取,如果是一顆滿二叉樹的話,則需要將實體的個數控制在2^n-1個;這樣對于后續的包映射也能控制向量的維度uj5u.com熱心網友回復:
值得嘗試哈哈哈轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/269526.html
標籤:人工智能技術
