資料結構:
詞1:{ 文章1的id:權重值0.2,文章2的id:權重值0.5 }
詞2:{ 文章1的id:權重值0.4,文章3的id:權重值0.1 }
...
(有很多詞,10萬左右)
...
最終查詢:(并行實時查詢)
比如:根據一組詞,[ 詞1 , 詞2 ]。查詢權重值最高的那一篇文章的id,上面即為文章1(0.2+0.4=0.6最大)
問題:請問按最上面那樣結構的資料 應該以怎樣的形式保存在 mongodb里面,才能有最高的查詢效率的????
如果把所有詞都保存在一個檔案里面,大小應該會超過16M,如果分多個檔案保存,后期查詢好些又不少很方便
uj5u.com熱心網友回復:
用各單詞做主鍵(_id:'word_name')單詞中對應的文章名稱放在串列中。
{_id:'word_name',score:[{article:1,score:0.2},{article:2,score:0.5}]}
#可以在各單詞的文章欄位建立一個索引:
createIndex({"score.article":1})
uj5u.com熱心網友回復:
我也在選檔案服務器,不知道什么合適uj5u.com熱心網友回復:
這種情況索引應該用不上吧轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/48457.html
標籤:MongoDB
上一篇:知識圖譜在大資料中的應用
下一篇:寫一個Hql
