可以應用哪些演算法和/或資料結構來決定基于某些共同特征的兩個事物的相似程度。
哪些知識領域處理此類問題?
這樣做的一種方法可能是:
** 每個 int 值代表一些特征
** 并且每組整數代表一個特征中的一組特征,例如
物件_1: {1, 2, 3}, {11, 14}, {88, 90}
物件_2: {4, 7}, {12, 16}, {81, 91}
搜索詞: {2, 90}
搜索應該回傳,'Object_1'因為 {2, 90}是{1, 2, 3, 11, 14, 88, 90}
希望這個例子能縮小問題的范圍。
uj5u.com熱心網友回復:
有許多不同型別的相似性度量。要決定使用哪個,第一步是指定您的測量級別和資料型別。以下是分類資料和連續資料的一些相似性度量:
- 對于分類資料:
- 漢明距離
- 索卡爾-米切納
- 羅素-拉奧
- 對于連續資料:
- 基于閔可夫斯基的距離,例如歐幾里得距離,曼哈頓距離
- 馬氏距離
用于基于相似性學習的通用演算法是最近鄰演算法。有關更多資訊,您可以參考John.D Kelleher 的書。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/321831.html
上一篇:在一個字典中更新許多字典
下一篇:這段代碼的時間復雜度是多少?
