論文:A DeepWalk-Based Approach to Defend Pro?le Injection Attack
這篇文章重點研究了一種基于深度用戶行為分析的推薦演算法,以便找到與在線用戶檔案相似的用戶群,從而產生推薦,該演算法對所有用戶資料資訊進行建模和分析,對資料進行抽象,并比較同一user behavior之間的相似性,剔除掉受到攻擊影響的user behavior,以此消除了偏向攻擊概要檔案的大部分影響,
比如這是用戶的購買行為記錄,

首先將用戶購買行為當作節點,并構建節點之間的網路,在構建網路時,使用一階相似度和二階相似度,前者是相鄰節點之間的相似度,后者是使用中間節點連接的節點之間的條件概率,ui和uj表示用戶行為的embedding,

之前的網路構建的方式都是因為用戶1先后購買了A和B,所以A和B有一條邊,但這篇文章中構建網路是通過結點與結點之間的一階相似度和二階相似度構建的,下圖就是構建好的網路,然后就開始隨機游走,這個程序就是從任意一個節點出發,形成一條游走序列,文中序列長度是固定的,隨機游走保證了網路的“同質性”和“結構性”,前者是指距離相近節點的embedding應該盡量近似(比如u和s1、s2、s3、s4),后者指結構上相似的節點embedding應該盡量近似(u和s6),

之后將形成的用戶行為序列輸送到skip-gram模型,這是一個word2vec的模型,就是給定當前的word,它能夠推理出周圍環境中的其他word(本文中,word就是user behavior),在本文中,就是給一個當前節點的特征,它能夠通過模型得到前后節點的特征,

經過了隨機游走和skip-gram,我們就得到了每個節點的特征,也就是得到了每個用戶的行為序列特征,然后開始分析用戶在一定時間內的影像行為序列,特征包括時間、觀看風格和相應的分數,這個程序首先將序列特征向量轉化為二維影像,然后用深度學習模型去學習其中的特征,這樣我們就得到了包含用戶行為以及周圍關系的user特征,最后用一個深度學習模型計算user profile之間的相似度,并且去除掉相似度不高的節點,這里也就是剔除掉受攻擊影響較大的特征,如下圖:

最后通過保證用戶行為特征可信來抵御推薦系統中的托攻擊,通過上圖得到可信的特征之后再使用一個深度學習模型形成推薦串列:

轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/194972.html
標籤:其他
