1.gensim的安裝
可以使用如下命令安裝gensim
conda install -i https://pypi.tuna.tsinghua.edu.cn/simple gensim==3.8.2
2.生成分詞串列
這一步已經有生成好的分詞串列可以忽略
專案串列:

點擊查看代碼
# coding:utf-8
from gensim.models import Word2Vec, word2vec
import jieba
import multiprocessing
import torch
# 1. 停用詞表
def get_stop_words(filepath='第2題/stop_word.txt') -> list:
return open(filepath, 'r', encoding='utf-8').readlines()[0].split(',')
# 2.分詞
def cut_words(sentence, stop_words, save_path=None):
cut_sentence = []
for line in sentence:
cuts = jieba.cut(line, cut_all=False)
new_cuts = []
for cut in cuts:
if cut not in stop_words:
new_cuts.append(cut)
cut_sentence.append(new_cuts)
if save_path:
with open(save_path, 'w') as f:
for ele in cut_sentence:
for e in ele:
e = e + '\n'
f.write(e)
f.flush()
return cut_sentence # 回傳 list to list 格式資料
def train_word2vec(words_file):
# 可以用BrownCorpus,Text8Corpus或lineSentence來構建sentences
sentences = list(word2vec.LineSentence(words_file)) # 加載分詞后的檔案
model = Word2Vec(sentences, size=256, min_count=1, window=5, sg=0, workers=multiprocessing.cpu_count())
return model
def train_word2vec_2(words_file):
sentences = list(word2vec.LineSentence(words_file))
model = Word2Vec(vector_size=256, min_count=1)
# 加載詞表
model.build_vocab(sentences)
# 訓練
model.train(sentences, total_examples=model.corpus_count, epochs=10)
return model
if __name__ == '__main__':
sentences_list: list = [
'推薦系統可以在海量的資料資訊中獲取用戶偏好,從而更好地實作個性化推薦、提高用戶體檢以及解決互聯網中的資訊過載,但其仍然存在冷啟動和資料稀疏問題,這也成為當前推薦系統研究重點,知識圖譜作為一種擁有大量物體和豐富語意關系結構化知識庫,可以輔助推薦系統,其不但能夠提高推薦系統的準確性,還能夠為推薦專案提供可解釋性,從而增強用戶對推薦系統的信任度,為解決推薦系統中存在的一系列關鍵問題提供了新方法、新思路,論文首先針對知識圖譜推薦系統進行研究與分析,以應用領域為分類依據將知識圖譜推薦系統分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,同時根據這些知識圖譜推薦方法的特點進一步分類,對每類方法進行定量分析和定性分析;之后列舉出知識圖譜推薦系統在其應用領域中常用的資料集,對資料集的規模和特點概述;最后對知識圖譜推薦系統未來的研究方向進行展望和總結,優惠的政策和政府對產業發展的重視也吸引了更多醫美企業來成都尋覓機遇,2018年成都醫美機構的數量一度飆升至407家,較之前一年激增131家,',
'互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦系統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,中國醫學科學院整形外科醫院也選擇于2018年將首家京外分院——成都八大處醫療美容醫院落地蓉城,不斷增長的營收資料沒有讓人失望',
'多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,成都八大處醫療美容醫院院長唐勇告訴記者,在因新冠肺炎疫情停業近40天的情況下,該院2020年的營收相比2019年仍實作了約30%的增長,'
'“成都打造‘醫美之都’的程序中,優惠的政策、聚合的資源、配套的宣傳措施等為醫美行業造起了‘勢’,對行業發展起到積極的推動作用,城市產業氛圍十分友好,',
'基于嵌入的方法可以將知識圖譜中的圖資料通過一些表征學習方法得到特征的低維向量表示而且還能保留知識圖譜中物體和專案之間的語意資訊,知識圖譜通過嵌入的方式將更加全面的資料資訊提供給推薦系統,但此類方法會忽略掉知識圖譜中路徑的設計以及多跳物體之間的關聯資訊,導致基于嵌入的方法可解釋性不強其中公式(4)中的Ρ(vj∣∣ui)表示用戶ui首先選擇專案vj的概率,公式(3)中pθ(vj∣∣ui,r)表示推薦系統中的評分函式pture(vj∣∣ui,r)表示用戶真實偏好,Ye等人[38]提出了BEM邊界元模型,BEM模型要學習兩類知識圖,用TransE模型學習專案屬性知識圖譜,該知識圖譜包含著專案的屬性資訊,用GraphSAGE[39]模型學習用戶行為知識圖譜,該知識圖譜包含了用戶行為資訊,如用戶之間的關聯資訊、用戶的共同購買資訊和共同收藏資訊等,BEM通過對兩類知識圖譜的學習得到初始嵌入表示,再通過貝葉斯模型對嵌入表示進行細化,推薦系統會根據用戶之間的共同行為,在行為知識圖譜中找到最相關的專案進行推薦,兩階段學習法非常易于實作,更加適合大規模的資料,但是它的推薦模塊和KGE[40]模塊結構性松散,相互依賴程度較低,b) 聯合學習法,將知識圖譜的特征學習和推薦系統的函式部分進行結合,推薦系統可以指導知識圖譜的學習表征程序,實作端到端的聯合學習,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,知識圖譜技術在各行業事故故障智能化服務中已得到了廣泛的研究和應用,在電力行業,李新鵬等人[7]通過構建調度自動化系統的知識圖譜,實作系統故障的智能診斷和分析;郭榕等人[8]針對電網故障處置預案資料,構建電網故障處置知識圖譜,提升了電網故障處置能力和智能化水平;在中石油領域,陳傳剛等人[9]構建基于知識圖譜的站場故障預警模型,實作現場事故預警;在鐵路領域,楊連報等人[10]通過構建鐵路設備事故故障部位知識圖譜,實作了設備故障關聯分析和原因推薦,基于各行業對知識圖譜構建方法及應用模式的研究,本文在研究鐵路運輸設備安全保障體系的基礎上,提出了鐵路運輸設備故障知識圖譜構建與應用架構,以及設備故障知識圖譜應用場景本研究也存在一些不足之處,一是因為診療指南是醫學知識的高度凝練,能夠抽取并用來構建知識圖譜的知識的數量較為有限,后續將進一步擴充相關的高質量的知識來源,不斷對本研究所構建的知識圖譜進行豐富和擴展,二是因為目前診療指南中的部分資料和關聯從知識圖譜構建的角度而言存在一定的交叉重疊,為了解決這個問題,我們在資料收集、本體構建和知識融合等環節,需要臨床醫師根據知識圖譜開發的要求,完成交叉知識的拆解和融合才能夠更合理的構建知識圖譜,三是目前本研究構建的知識圖譜中使用的輸入癥狀詞語必須與臨床指南中用語一致才能識別,還未能支持輸入癥狀串列進行中醫臨床輔助決策,下一步應在此研究基礎上實作自然語言處理功能,訓練與指南資料和知識圖譜適配的自然語言處理模型,實作從自然語言中自動抽取知識圖譜能夠識別的用語,并基于知識圖譜實作癥狀串列輸入功能,四是目前還未能支持證候的兼夾性和患者更加個體的資訊,下一步將開發設定支持多證候顯示的知識圖譜,以支持兼夾證候的顯示,并且從本體層設計納入更多的體現患者個體差異的資料結構,將臨床中患者的個體差異體現在知識圖譜展示的診療程序中從而將模型整合成為功能更貼近真實臨床的中醫臨床輔助決策系統,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,鐵路運輸設備狀態是鐵路安全運輸的根本,良好的設備狀態既是運輸生產的物質基礎,又是運輸安全的重要保證[1],隨著鐵路運營里程的積累和鐵路設備的更新迭代,積累了大量的鐵路運輸設備故障資料,這些故障資料記錄了故障發生的詳細資訊,包括故障的基礎資訊和對故障的人工分析資料,蘊含了鐵路運輸設備的重要價值資訊,科學分析設備故障資料是將故障從消極轉變為積極的有效途徑,但由于這些故障資料存在存盤分散、資料格式不同、存盤形式各異的情況,給資料分析帶來了困難[2],知識圖譜能夠有效地將多源異構資料轉化為基于深層語意的知識服務,基于知識圖譜技術實作設備故障的深度挖掘和智能應用,是分析鐵路運輸設備故障資料的有效途徑同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”實體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜技術在各行業事故故障智能化服務中已得到了廣泛的研究和應用,在電力行業,李新鵬等人[7]通過構建調度自動化系統的知識圖譜,實作系統故障的智能診斷和分析;郭榕等人[8]針對電網故障處置預案資料,構建電網故障處置知識圖譜,提升了電網故障處置能力和智能化水平;在中石油領域,陳傳剛等人[9]構建基于知識圖譜的站場故障預警模型,實作現場事故預警;在鐵路領域,楊連報等人[10]通過構建鐵路設備事故故障部位知識圖譜,實作了設備故障關聯分析和原因推薦,基于各行業對知識圖譜構建方法及應用模式的研究,本文在研究鐵路運輸設備安全保障體系的基礎上,提出了鐵路運輸設備故障知識圖譜構建與應用架構,以及設備故障知識圖譜應用場景本研究也存在一些不足之處,一是因為診療指南是醫學知識的高度凝練,能夠抽取并用來構建知識圖譜的知識的數量較為有限,后續將進一步擴充相關的高質量的知識來源,不斷對本研究所構建的知識圖譜進行豐富和擴展,二是因為目前診療指南中的部分資料和關聯從知識圖譜構建的角度而言存在一定的交叉重疊,為了解決這個問題,我們在資料收集、本體構建和知識融合等環節,需要臨床醫師根據知識圖譜開發的要求,完成交叉知識的拆解和融合才能夠更合理的構建知識圖譜,三是目前本研究構建的知識圖譜中使用的輸入癥狀詞語必須與臨床指南中用語一致才能識別,還未能支持輸入癥狀串列進行中醫臨床輔助決策,下一步應在此研究基礎上實作自然語言處理功能,訓練與指南資料和知識圖譜適配的自然語言處理模型,實作從自然語言中自動抽取知識圖譜能夠識別的用語,并基于知識圖譜實作癥狀串列輸入功能,四是目前還未能支持證候的兼夾性和患者更加個體的資訊,下一步將開發設定支持多證候顯示的知識圖譜,以支持兼夾證候的顯示,并且從本體層設計納入更多的體現患者個體差異的資料結構,將臨床中患者的個體差異體現在知識圖譜展示的診療程序中從而將模型整合成為功能更貼近真實臨床的中醫臨床輔助決策系統,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,鐵路運輸設備狀態是鐵路安全運輸的根本,良好的設備狀態既是運輸生產的物質基礎,又是運輸安全的重要保證[1],隨著鐵路運營里程的積累和鐵路設備的更新迭代,積累了大量的鐵路運輸設備故障資料,這些故障資料記錄了故障發生的詳細資訊,包括故障的基礎資訊和對故障的人工分析資料,蘊含了鐵路運輸設備的重要價值資訊,科學分析設備故障資料是將故障從消極轉變為積極的有效途徑,但由于這些故障資料存在存盤分散、資料格式不同、存盤形式各異的情況,給資料分析帶來了困難[2],知識圖譜能夠有效地將多源異構資料轉化為基于深層語意的知識服務,基于知識圖譜技術實作設備故障的深度挖掘和智能應用,是分析鐵路運輸設備故障資料的有效途徑同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,上述知識圖譜的幾個模塊,即為依據中醫診療指南進行辨證論治的程序,通過癥狀(臨床表現)的組合文本,提煉出相應的證候要素,在證候要素的基礎上組合出相應的證候型別,根據相應的證候型別即可推斷相應的治法,確立治法后,即可推薦相應的中成藥和中藥方劑,并進一步可視化展示中藥方劑所用的中藥串列,這個程序即模擬了中醫辨證論治冠心病穩定型心絞痛的程序,是診療指南的可視化和網路化的展示,下面我們將使用知識圖譜的查詢檢索功能進行展示,圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化資料和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式圖5為“證候型別”、“治法”、“中成藥”、“方劑”和“中藥”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,粉色節點代表“方劑”物體,綠色節點代表“中藥”物體,聯結“證候型別”物體和“治法”物體之間的邊表示“證候型別”對應該“治法”,聯結“治法”物體和“方劑”物體之間的邊表示該“治法”推薦選擇該“方劑”,聯結“方劑”物體和“中藥”物體之間的邊表示該“方劑”由該“中藥”組成,如圖5所示,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段中的中藥方劑推薦“八珍湯加味”,方劑“八珍湯加味”的組成中藥有“黨參”、“白術”、“茯苓”、“甘草”、“當歸”“紅花”“赤芍”等11種,通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦中藥方劑,以及顯示中藥方劑所用的中藥藥味而圖2為“臨床表現”與“證候要素”知識圖譜的示意圖,其中藍色節點代表“臨床表現”物體、紫色節點代表“證候要素”物體,從“臨床表現”物體指向“證候要素”物體的有向箭頭代表二者之間的關聯,即“臨床表現”中提煉出該“證候要素”,如“神疲”、“乏力”等臨床表現,能夠相應的提煉出證候要素“氣虛”,通過所構建的知識圖譜,可輸入相應的臨床表現,即可自動提煉組合出對應的證候要素且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將圖3為“證候要素”、“證候型別”和“治法”的知識圖譜示意圖,其中紫色節點代表“證候要素”物體,橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,從“證候要素”物體指向“證候型別”物體的有向箭頭代表二者之間的關聯,即“證候要素”組成該“證候型別”,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,“氣虛”和“陰虛”這2個證候要素,共同組成“氣陰兩虛證”這一證候型別,而“氣陰兩虛證”對應的治法為“益氣養陰,活血通絡”,通過所構建的知識圖譜,輸入相應的證候要素串列,即可自動組合出對應的證候型別這些任務放在同一個框架中進行交替學習,使用py2neo將診療指南中提取整理好的結構化資料匯入到Neo4j資料庫中,并進而完成基于中醫診療指南的冠心病知識圖譜構建,構建的知識圖譜可通過py2neo或用Cypher陳述句進行查詢和呼叫,因所構建的知識圖譜節點較多,并且節點之間的關聯復雜,難以在一張圖上做清晰的顯示,而診療指南中,“氣虛”證候要素組合為證候型別的組合可能性較多,為了便于展示盡可能多的組合方式和節點關聯,以“氣虛”這一個證候要素相關的知識圖譜為例(包含臨床表現、證候要素、證候型別、治法、中成藥、方劑和中藥等節點及之間的關聯),對所構建的知識圖譜的節點和關聯進行闡述Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起知識圖譜是人工智能的重要研究領域,本質是構建和存盤不同型別資料的關聯性,用圖網路來表示知識及其屬性和關聯,可在一定程度上表征復雜的知識結構和關聯,尤其適宜中醫領域的知識特點,如尹丹等[2]基于知識圖譜,模擬了“方證對應”的診療程序,但目前知識圖譜相關研究多基于網路爬蟲技術批量格式化的爬取大量的醫療相關資料,并基于此資料構建知識圖譜[3,4,5],這類知識圖譜普遍存在著資料一致性差,無效資料較多,以及資料缺失嚴重[6]等問題,生成的知識圖譜冗余度[7]較大,對于醫療尤其是臨床的實際意義和應用價值有限,中醫藥臨床指南與共識推進了中醫藥標準化和規范化行程,中華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》是基于大量具有獨特療效的中醫診治冠心病穩定型心絞痛臨床診療經驗制定的,能夠規范中醫診療程序和促進提升中醫診療的整體水平[8],在冠心病穩定型心絞痛的診療中具有規范性和權威性,以此為模式物體是本體、實體和關系的整和,比如臨床表現“乏力”是本體中的一個概念,“乏力”也是一個具體的臨床表現個體,稱為實體,其有對應的屬性如“分值”和對應的“證候要素”—“氣虛”,“乏力”以及本體“癥狀”和相關的屬性,稱為“物體”,本研究使用知識圖譜常用的三元組資料模型來描述診療指南中的知識和知識之間的關系,三元組關系類似于“主謂賓”的關系,表征主語和賓語之間的關聯特征,診療指南中的資料欄位有“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑”、“中成藥”和“中藥”等,他們之間的關聯關系分別為:從“臨床表現”提煉“證候要素”,由“證候要素”組成“證候型別”,“證候型別”對應相應的“治法”,依據“治法”選擇“方劑”,依據“治法”選擇“中成藥”,“方劑”包含“中藥”,基于上述抽取的本體之間的關系,可設計三元組結構表見表2構建中醫冠心病診療的知識圖譜,對于冠心病中醫診療的標準化和規范化以及經驗的傳承具有重要意義,本研究基于知識圖譜技術,以《冠心病穩定型心絞痛中醫診療指南》為模式構建知識圖譜,通過編程實作以臨床表現的輸入呼叫知識圖譜,可視化展示冠心病穩定型心絞痛的中醫規范化診療程序,以期為直觀地展現中醫診療程序提供了一種可參考的新的范式,1.1資料和知識來源本研究所用到的資料和知識來源于中本體是概念的集合和框架,類似于面相物件程式設計中的類,是知識圖譜的架構,也是知識圖譜結構化的基礎邏輯,將本體整理成相應的結構表,有助于對知識圖譜的理解,根據診療指南中的本體結構特征,本研究針對診療指南進行本體的提取,首先提取“臨床表現”、“證候要素”、“證候型別”、“治法”、“方劑(方藥)”和“中成藥”等,其中“方劑”和“中成藥”都可抽象為“治療手段”,所以將“治療手段”作為一級本體,而“方劑”和“中成藥”作為二級本體,然后根據提取的本體,提取實體,分別為“胸悶痛”、“氣虛”、“氣滯血瘀”和“冠心2號方”[11]等,最后抽取本體之間的關系,即“臨床表現”提煉“證候要素”、“證候要素”組成“證候型別”、“證候型別”對應“治法”等,據此本文設計本體的結構見表1華中醫藥學會心血管病分會發布的《冠心病穩定型心絞痛中醫診療指南》[8],1.2 軟體工具本研究的知識圖譜使用Neo4j (www.neo4j.com)社區版實作,Neo4j是一個開源的基于java的高性能的NoSQL的圖資料庫,不同于傳圖4為“證候型別”、“治法”、“中成藥”和“方劑”的知識圖譜示意圖,其中橘黃色節點代表“證候型別”物體,灰色節點代表“治法”物體,深綠色節點代表“中成藥”物體,粉色節點代表“方劑”物體,從“證候型別”物體指向“治法”物體的有向箭頭代表二者之間的關聯,即“證候型別”對應的治法為該“治法”,從“治法”物體指向8個“中成藥”物體的有向箭頭代表二者之間的關聯,即該“治法”被選擇后,推薦選擇的中成藥為8個“中成藥”物體所對應的中成藥,此外,從“治法”物體還有一個指向“方劑”物體的有向箭頭,代表二者之間的關聯為該“治法”被選擇后,推薦選擇的中藥方劑為該“方劑”物體所對應的中藥方劑,“氣虛血瘀證”所對應的治法為“益氣活血,補虛止痛”,該治法所對應的治療手段有2種,第1種是中成藥,第2種是中藥方劑,該治法推薦選擇的中成藥有“通心絡膠囊”、“通心舒膠囊”、“血栓心脈寧片”等8種,推薦的中藥方劑為“八珍湯加味”,從診療指南可見,“八珍湯加味”的組成藥味有“黨參、白術、茯苓、甘草、當歸、生地黃、赤芍、川芎、桃仁、紅花、丹參”,根據《中華人民共和國藥典》[12]和《中藥學》[13]的藥物功效分類和《方劑學》的內容,除了八珍湯的八味藥組和使用具有氣血雙補的功效外,川芎、桃仁、紅花和丹參為活血化瘀藥具有活血化瘀的功效,王階教授根據多年臨床研究指出,補氣強心為治療冠心病的第一要義[14],冠心病因其發病率和危害已經成為全球重大公共衛生問題[19],給公共醫療帶來很大負擔[20],臨床指南作為綜合當前最佳研究證據和指導臨床實踐的檔案,是醫療水平穩定的重要保證,《冠心病穩定型心絞痛中醫診療指南》是由中華中醫藥學會心血管病分會組織相關專家編撰的,編撰程序參照國際最新的臨床指南的制訂方法,并在相關法律法規和技術檔案指導的框架下,通過辨證論治的資料和關系突出體現了傳統中醫辨證論治的思想,編撰程序深度結合循證醫學原理,在古今文獻的回顧分析、臨床流行病學調查、中成藥系統綜述、名老中醫經驗總結、專家咨詢等系統研究作業的基礎上,對冠心病穩定型心絞痛的基本證候特點、辨證用藥規律等進行了系統地梳理、歸納和總結,《冠心病穩定型心絞痛中醫診療指南》為中醫、中西醫結合臨床醫師規范化開展冠心病的防治作業提供權威指導,選用八珍湯加味能夠氣血同補兼具活血通絡,補氣通絡之法為王階教授治療冠心病的寶貴經驗[15],通過所構建的知識圖譜,輸入相應的證候型別,即可自動組合出對應的治法,推薦的中成藥和中藥方劑統資料庫中使用的關系模型[9],它將結構化的資料存盤在靈活的圖網路中而不是表中,更適合表征具有復雜關聯的資料及之間的關系,從而在各個行業中得到廣泛應用,知識圖譜構建和呼叫程序我們使用Python中的py2neo (https://github.com/py2neo-org/py2neo)來實作,Py2neo是一個Python庫和工具包,用于從Python應用程式和命令列中呼叫或操作Neo4j,其中Node和Relationship這兩個物件是py2neo的關鍵,它們都擴展了Subgraph類,提供了一套全面的圖結構資料型別和操作支持,從而在如何呼叫和操作圖資料方面提供了顯著的靈活性,1.3 知識圖譜概念知識圖譜是使用圖結構的資料模型或拓撲結構來集成和表示資料的知識庫,知識圖譜通常用于存盤物體(物件、事件、情況或抽象概念)的相互關聯的描述,同時還對所用術語背后的語意進行編碼[10],自語意網發展以來,知識圖譜往往與關聯的開放資料專案相關聯,側重于概念與物體之間的聯系的存盤和表示,利用知識圖譜能夠關聯核心醫學概念及醫療知識,從海量臨床醫案中對經驗和知識進行提煉整理、錄入標注和體系構建,以解決優質醫療資源短缺和醫療需求持續增加的矛盾,知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,本研究將冠心病穩定型心絞痛中醫診療指南中所規定的分條羅列的知識模式,通過知識圖譜可視化的方式實作,這有助于將凝結了專家經驗和循證證據所形成的醫學模式和診療程序直觀的展示給中醫醫師,系統精確的展示指南中的醫學模式和醫療知識之間的相互關聯和模式之間先前隱含的潛在聯系,有助于中醫、中西醫結合診療經驗的規范化傳承和共享,為構建中醫臨床輔助決策系統提供研究基礎,此外,該研究方法作為一種技術框架,不局限于這一項診療指南的知識圖譜構建和研究,二是可以作為基礎框架推廣到其他診療指南,為診療指南的推廣和指南中的標準化診療規范的普及提供參考范式為保障鐵路運輸安全,面向鐵路運輸系統構建了健全的鐵路運輸設備安全保障體系,在該體系下,可對運輸設備的基礎資訊、運行維護(簡稱:運維)資訊及故障資料進行有效管理,鐵路運輸設備安全保障體系包含針對鐵路基礎設施設備構建的鐵路運輸設備監測檢測系統、鐵路運輸設備資訊管理系統及鐵路運營集成化平臺,可實作鐵路運輸設備的全生命周期管理、設備故障資訊管理,以及設備故障資料一體化分析,鐵路運輸安全保障體系架構如圖1所示知識圖譜的基本構建流程包括本體構建、物體配置、知識抽取和知識融合等,1.4 知識圖譜設計1.4.1 流程設計本研究首先根據診療指南中的知識和資訊,按照知識圖譜構建的方法,從抽象的層面分別定義物體、關系和屬性,然后將指南中本研究所需要的結構化資料、半結構化數本研究結合目前中醫診療經驗傳承中存在的問題,針對冠心病穩定型心絞痛這個單一病種,提出了一種基于凝結了中醫行業專家經驗和循證證據所形成的診療指南,來構建知識圖譜的方法,與一些相關的研究不同的是,該方法沒有選擇使用基于網路爬蟲的大資料來構建知識圖譜,而是選擇使用規范化、規則化程度較高的中醫診療指南中的醫學知識和術語構建知識圖譜并可視化的展示和描述中醫診治冠心病穩定型心絞痛的程序,而知識圖譜通過描述物體及其關系來表示語意,知識圖譜可以使用本體作為模式層,通過這樣的設計,基于知識圖譜設計的模型將不僅支持顯示知識相關的查詢,同時也支持與隱式知識相關的邏輯推理,該方法能夠從患者的輸入癥狀出發,經過知識圖譜的查詢和計算,得到患者可能的證候型別以及應該選擇的治法和方劑,這是一種構建中醫臨床輔助決策系統的有益嘗試據和非結構化資料,分別進行整理和提取,形成本研究所需要的資料(包含節點、屬性與關系),在此基礎上,我們進行物體消歧、物體對齊等知識融合程序,隨后本研究通過Python的py2neo庫呼叫Neo4j,將知識資料匯入Neo4j中構建知識圖譜,然后通過Python編程將程式構建的基于中醫診療指南的知識圖譜,支持基于圖資料庫的查詢功能,我們以診療指南中第一個證候對應的第一個臨床表現(胸固定性痛)為例來說明,如查詢“臨床表現”為“胸固定性痛”,則展示如圖6所示的知識圖譜,藍色節點為查詢的癥狀“胸固定性痛”,其對應的“證候要素”為“血瘀”,“血瘀”能夠組成“氣虛血瘀證”、“氣滯血瘀證”、“心血瘀阻證”“痰瘀互結證”4個證型,4個證型又分別對應治法和方劑以及中成藥等,從而實作基于中醫診療指南和專家經驗的知識圖譜可視化展示程序,為直觀地展現中醫診療程序提供一種新的方式,本研究將冠心病穩定型心絞痛中醫診療指南中所規定的分條羅列的知識模式,通過知識圖譜可視化的方式實作,這有助于將凝結了專家經驗和循證證據所形成的醫學模式和診療程序直觀的展示給中醫醫師,系統精確的展示指南中的醫學模式和醫療知識之間的相互關聯和模式之間先前隱含的潛在聯系,有助于中醫、中西醫結合診療經驗的規范化傳承和共享,為構建中醫臨床輔助決策系統提供研究基礎,此外,該研究方法作為一種技術框架,不局限于這一項診療指南的知識圖譜構建和研究,二是可以作為基礎框架推廣到其他診療指南,為診療指南的推廣和指南中的標準化診療規范的普及提供參考范式為保障鐵路運輸安全,面向鐵路運輸系統構建了健全的鐵路運輸設備安全保障體系,在該體系下,可對運輸設備的基礎資訊、運行維護(簡稱:運維)資訊及故障資料進行有效管理,鐵路運輸設備安全保障體系包含針對鐵路基礎設施設備構建的鐵路運輸設備監測檢測系統、鐵路運輸設備資訊管理系統及鐵路運營集成化平臺,可實作鐵路運輸設備的全生命周期管理、設備故障資訊管理,以及設備故障資料一體化分析,鐵路運輸安全保障體系架構如圖1所示可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,其中公式(4)中的Ρ(vj∣∣ui)表示用戶ui首先選擇專案vj的概率,公式(3)中pθ(vj∣∣ui,r)表示推薦系統中的評分函式pture(vj∣∣ui,r)表示用戶真實偏好,Ye等人[38]提出了BEM邊界元模型,BEM模型要學習兩類知識圖,用TransE模型學習專案屬性知識圖譜,該知識圖譜包含著專案的屬性資訊,用GraphSAGE[39]模型學習用戶行為知識圖譜,該知識圖譜包含了用戶行為資訊,如用戶之間的關聯資訊、用戶的共同購買資訊和共同收藏資訊等,BEM通過對兩類知識圖譜的學習得到初始嵌入表示,再通過貝葉斯模型對嵌入表示進行細化,推薦系統會根據用戶之間的共同行為,在行為知識圖譜中找到最相關的專案進行推薦,兩階段學習法非常易于實作,更加適合大規模的資料,但是它的推薦模塊和KGE[40]模塊結構性松散,相互依賴程度較低,b) 聯合學習法,將知識圖譜的特征學習和推薦系統的函式部分進行結合,推薦系統可以指導知識圖譜的學習表征程序,實作端到端的聯合學習,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法實際上,隨著“顏值經濟”不斷走熱,醫美逐漸成為部分當代中國人的“剛需”,其中恢復期短、風險較低的輕醫美最受歡迎,',
'基于傳播的方法,基于元結構的方法大多數需要人工定義元結構生成路徑,基于路徑嵌入的方法雖然可以不需要人工定義路徑,可以列舉出可能的路徑,但是模型較為復雜,系統計算量大,基于傳播的方法將知識圖譜各條路徑中多跳鄰居嵌入表示,利用傳播的思想來預測用戶偏好,Wang等人[57]在2018年提出了RippleNet模型,基于路徑的方法可以分成基于元結構的方法、基于路徑嵌入的方法和基于傳播的方法,在基于嵌入的方法中各模型常用評價指標為Recall、MAE、RMSE、AUC、ACC、Precision等,具體評價指標對比如表4所示,表4中MAE的最大值是SemRec-P在Yelp資料集上的實驗結果1.176,RMSE的最大值為FMG模型在Amazon資料集上的結果1.186,MCRec模型的Precision指標在Last.FM資料集上達到了0.480,KPRE模型的Recall指標在KKBOX資料集上達到了0.881,KGCN模型的AUC指標在MovieLens-20M上的結果為0.979,KNI模型的ACC指標在MovieLens-20M上的結果為0.970基于嵌入的方法可以將知識圖譜中的圖資料通過一些表征學習方法得到特征的低維向量表示而且還能保留知識圖譜中物體和專案之間的語意資訊,知識圖譜通過嵌入的方式將更加全面的資料資訊提供給推薦系統,但此類方法會忽略掉知識圖譜中路徑的設計以及多跳物體之間的關聯資訊,導致基于嵌入的方法可解釋性不強其中公式(4)中的Ρ(vj∣∣ui)表示用戶ui首先選擇專案vj的概率,公式(3)中pθ(vj∣∣ui,r)表示推薦系統中的評分函式pture(vj∣∣ui,r)表示用戶真實偏好,Ye等人[38]提出了BEM邊界元模型,BEM模型要學習兩類知識圖,用TransE模型學習專案屬性知識圖譜,該知識圖譜包含著專案的屬性資訊,用GraphSAGE[39]模型學習用戶行為知識圖譜,該知識圖譜包含了用戶行為資訊,如用戶之間的關聯資訊、用戶的共同購買資訊和共同收藏資訊等,BEM通過對兩類知識圖譜的學習得到初始嵌入表示,再通過貝葉斯模型對嵌入表示進行細化,推薦系統會根據用戶之間的共同行為,在行為知識圖譜中找到最相關的專案進行推薦,兩階段學習法非常易于實作,更加適合大規模的資料,但是它的推薦模塊和KGE[40]模塊結構性松散,相互依賴程度較低,b) 聯合學習法,將知識圖譜的特征學習和推薦系統的函式部分進行結合,推薦系統可以指導知識圖譜的學習表征程序,實作端到端的聯合學習,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,其中公式(4)中的Ρ(vj∣∣ui)表示用戶ui首先選擇專案vj的概率,公式(3)中pθ(vj∣∣ui,r)表示推薦系統中的評分函式pture(vj∣∣ui,r)表示用戶真實偏好,Ye等人[38]提出了BEM邊界元模型,BEM模型要學習兩類知識圖,用TransE模型學習專案屬性知識圖譜,該知識圖譜包含著專案的屬性資訊,用GraphSAGE[39]模型學習用戶行為知識圖譜,該知識圖譜包含了用戶行為資訊,如用戶之間的關聯資訊、用戶的共同購買資訊和共同收藏資訊等,BEM通過對兩類知識圖譜的學習得到初始嵌入表示,再通過貝葉斯模型對嵌入表示進行細化,推薦系統會根據用戶之間的共同行為,在行為知識圖譜中找到最相關的專案進行推薦,兩階段學習法非常易于實作,更加適合大規模的資料,但是它的推薦模塊和KGE[40]模塊結構性松散,相互依賴程度較低,b) 聯合學習法,將知識圖譜的特征學習和推薦系統的函式部分進行結合,推薦系統可以指導知識圖譜的學習表征程序,實作端到端的聯合學習,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將數據資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式基于路徑的方法可以分成基于元結構的方法、基于路徑嵌入的方法和基于傳播的方法,在基于嵌入的方法中各模型常用評價指標為Recall、MAE、RMSE、AUC、ACC、Precision等,具體評價指標對比如表4所示,表4中MAE的最大值是SemRec-P在Yelp資料集上的實驗結果1.176,RMSE的最大值為FMG模型在Amazon資料集上的結果1.186,MCRec模型的Precision指標在Last.FM資料集上達到了0.480,KPRE模型的Recall指標在KKBOX資料集上達到了0.881,KGCN模型的AUC指標在MovieLens-20M上的結果為0.979,KNI模型的ACC指標在MovieLens-20M上的結果為0.970基于嵌入的方法可以將知識圖譜中的圖資料通過一些表征學習方法得到特征的低維向量表示而且還能保留知識圖譜中物體和專案之間的語意資訊,知識圖譜通過嵌入的方式將更加全面的資料資訊提供給推薦系統,但此類方法會忽略掉知識圖譜中路徑的設計以及多跳物體之間的關聯資訊,導致基于嵌入的方法可解釋性不強其中公式(4)中的Ρ(vj∣∣ui)表示用戶ui首先選擇專案vj的概率,公式(3)中pθ(vj∣∣ui,r)表示推薦系統中的評分函式pture(vj∣∣ui,r)表示用戶真實偏好,Ye等人[38]提出了BEM邊界元模型,BEM模型要學習兩類知識圖,用TransE模型學習專案屬性知識圖譜,該知識圖譜包含著專案的屬性資訊,用GraphSAGE[39]模型學習用戶行為知識圖譜,該知識圖譜包含了用戶行為資訊,如用戶之間的關聯資訊、用戶的共同購買資訊和共同收藏資訊等,BEM通過對兩類知識圖譜的學習得到初始嵌入表示,再通過貝葉斯模型對嵌入表示進行細化,推薦系統會根據用戶之間的共同行為,在行為知識圖譜中找到最相關的專案進行推薦,兩階段學習法非常易于實作,更加適合大規模的資料,但是它的推薦模塊和KGE[40]模塊結構性松散,相互依賴程度較低,b) 聯合學習法,將知識圖譜的特征學習和推薦系統的函式部分進行結合,推薦系統可以指導知識圖譜的學習表征程序,實作端到端的聯合學習,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,其中公式(4)中的Ρ(vj∣∣ui)表示用戶ui首先選擇專案vj的概率,公式(3)中pθ(vj∣∣ui,r)表示推薦系統中的評分函式pture(vj∣∣ui,r)表示用戶真實偏好,Ye等人[38]提出了BEM邊界元模型,BEM模型要學習兩類知識圖,用TransE模型學習專案屬性知識圖譜,該知識圖譜包含著專案的屬性資訊,用GraphSAGE[39]模型學習用戶行為知識圖譜,該知識圖譜包含了用戶行為資訊,如用戶之間的關聯資訊、用戶的共同購買資訊和共同收藏資訊等,BEM通過對兩類知識圖譜的學習得到初始嵌入表示,再通過貝葉斯模型對嵌入表示進行細化,推薦系統會根據用戶之間的共同行為,在行為知識圖譜中找到最相關的專案進行推薦,兩階段學習法非常易于實作,更加適合大規模的資料,但是它的推薦模塊和KGE[40]模塊結構性松散,相互依賴程度較低,b) 聯合學習法,將知識圖譜的特征學習和推薦系統的函式部分進行結合,推薦系統可以指導知識圖譜的學習表征程序,實作端到端的聯合學習,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,互聯網快速地發展以及資料量不斷增加,使得在海量資料中獲取到用戶所需的有效資訊成為當前推薦系統研究的主要目標,推薦系統作為一種資訊過濾的方法,能夠根據用戶的需求、行為和偏好,為用戶推薦感興趣的資料內容,推薦系統的核心是進行個性化推薦,傳統的推薦系統可以分成三類,分別是基于內容的推薦系統[1]、基于協同過濾的推薦系統[2]和混合推薦系統[3],基于內容的推薦系統目的是找到與目標用戶相似的用戶,將相似用戶的偏好專案作為推薦結果,其方法簡單、系統可解釋性強,但不適合處理復雜資訊,存在冷啟動問題,而且該方法在處理大規模復雜資料時耗時久、效率較低,基于協同過濾的推薦系統根據用戶歷史行為資訊,利用聚類方法實作推薦,基于協同過濾的推薦是當前應用最為廣泛的推薦方法,但其也存在著新用戶或新專案的冷啟動以及資料稀疏等問題,針對上述兩種方法中出現的問題,研究者進一步提出了混合推薦系統,混合推薦系統結合上述兩種方法的優點,可以有效緩解上述兩種方法中的不足,增加推薦的準確性,但是,混合推薦系統不能徹底解決冷啟動[4]和資料稀疏[5]問題,知識圖譜的出現有效緩解了上述問題,根據以上三條路徑可以推斷出用戶A可能喜歡《簡單愛》這首歌,推薦系統會把這一結果推薦給用戶,該實體反應了知識圖譜能夠有效地挖掘出用戶和專案之間潛在的關系,不但緩解了冷啟動和資料稀疏問題,而且還使得推薦結果具有可解釋性,知識圖譜輔助推薦系統已經成為推薦系統研究領域的熱點,Chang等人[6]根據推薦生成方法將知識圖譜推薦方法分為基于本體的推薦生成方法、基于開放鏈接資料的推薦生成方法和圖嵌入的推薦生成方法,Qin[7]等人基于知識圖譜與推薦系統資訊結合的不同方式,將知識圖譜與推薦系統的結合方法分成基于嵌入的知識圖譜資訊挖掘方法和基于路徑的知識圖譜資訊挖掘方法,Guo等人[8]細化了基于路徑的知識圖譜資訊挖掘方法,將其進一步分為基于路徑的知識圖譜資訊挖掘方法和基于傳播的知識圖譜資訊挖掘方法,Zhu[9]等人按照演算法思想差異性將知識圖譜推薦演算法分為基于連接的推薦、基于嵌入的推薦和基于混合的推薦,但上述研究中均沒有從知識圖譜推薦系統應用領域的視角,對現有的方法進行分類分析,由于不同應用領域的資料集具有不同的特性,將不同的知識圖譜推薦方法應用于不同資料集產生的推薦效果可能各不相同,因此論文綜合分析當前知識圖譜推薦統,將其分為多領域知識圖譜推薦系統和特定領域知識圖譜推薦系統,如圖2所示,多領域知識圖譜推薦系統應用范圍廣泛,在多個領域中均可使用,多領域知識圖譜推薦系統又可分為基于嵌入的多領域知識圖譜推薦系統和基于路徑的多領域知識圖譜推薦系統,特定領域知識圖譜推薦系統是根據某個領域的資料特點提出的僅限于該領域使用的推薦方法,該類方法在其它領域使用效果一般,其特點為針對性強、應用領域較為單一,知識圖譜推薦系統根據用戶歷史行為資料快速發掘用戶和專案相關的物體、關系,使得推薦系統能夠獲取更加豐富的用戶、專案背景資訊,實作更精準、有效地推薦,知識圖譜本質上是具有物體間關系的語意網路,由三元組組成,三元組包含物體、關系和屬性(屬性值)三個要素,這三個要素是構成知識圖譜的基礎,知識圖譜作為一種輔助資訊融入推薦系統能夠提高系統的可解釋性,如圖1所示,在原有的資料中只能看出用戶A喜歡《青花瓷》這首歌,但是無法將用戶A和《簡單愛》這首歌相關聯,通過構建知識圖譜可以將資訊關聯到一起,并利用知識推理推斷出用戶的喜好,這種由用戶和專案之間的互動資訊構成的知識圖譜是一種異質資訊網,推薦系統可以通過異質資訊網中的不同路徑尋找推薦專案,從而提高推薦的準確度,在圖1中可以看出從用戶A到《簡單愛》有三條路徑,另外,論文還基于應用領域分類進一步介紹知識圖譜推薦系統中常用的資料集,并在最后對基于知識圖譜推薦系統現有的研究作業進行總結,同時展望未來的研究作業,論文第一節將介紹相關研究背景,其包含傳統推薦系統和知識圖譜的基本概念與定義;第二節從應用領域的角度詳細分析有關基于知識圖譜推薦系統的相關研究;第三節對各領域使用的資料集進行分析;第四節對研究方向進行展望;第五節對論文總結,推薦系統對用戶和專案具有主動性,其不需要用戶提出明確的需求,推薦演算法可以自主分析用戶歷史行為以及用戶、專案之間的關系,分析出用戶的偏好,并基于此偏好,為用戶提供個性化推薦服務,滿足用戶個性化需求[10],推薦系統的目標就是給用戶推薦一個或者多個專案,其推薦程序大致分為以下幾步:第一步,定義用戶集合為U,ui為系統目標用戶,專案集合為V,vj為候選推薦專案;第二步,定義一個系統評分函式f:ui×vj→?i,j,該評分函式表示目標用戶ui對候選推薦專案vj的喜愛程度;第三步,對評分函式得出的用戶偏好值進行排序,生成推薦串列,最終實作用戶個性化推薦,隨著推薦技術的成熟,推薦系統廣泛應用于電子商務、電影、音樂、新聞、社交、招聘等多個領域[11],傳統推薦系統通常被分為三類,分別是基于內容的推薦系統、基于協同過濾的推薦系統、混合推薦系統,基于內容的推薦系統是最早出現且最基礎的推薦演算法,一開始被應用于資訊檢索系統,許多資訊過濾和資訊檢索的方法都可以應用于此,但基于內容的推薦系統在內容特征提取時過度依賴內容標簽,僅關注用戶自身資料,并沒有考慮用戶之間的行為資料,基于此不足,基于協同過濾的推薦系統被提出,該種系統利用了用戶之間的行為資料和內容之間的關聯資料,提高了推薦效率,但其仍然存在冷啟動和稀疏性等問題,由于上述兩種推薦系統均存在不足,混合推薦系統被提出,1.1.1 基于內容的推薦系統基于內容的推薦系統的核心是在候選專案集中找到與用戶偏好專案相似的專案,整個推薦程序首先要提取用戶的內容特征,內容特征包括用戶評分、評價、點贊等顯性反饋行為和瀏覽、搜索等隱性反饋行為,其次對用戶的內容特征進行建模,計算出專案之間的相似度,最后通過相似度排序,生成推薦結果,基于內容的推薦系統優點是模型簡單、直觀,具有可解釋性,不存在新專案的冷啟動問題和資料稀疏問題,缺點是對復雜專案的內容特征提取不全面,會影響推薦結果,并且,由于系統新用戶沒有內容特征,系統很難發現新用戶的偏好特征,動態推薦系統也是一樣,在針對實時性較高的資料時,比如音頻資料,新聞資料等,這些資訊更新較快,基于靜態偏好建模的推薦系統不能解決用戶實時興趣,當用戶做出行為時,如何根據當前的行為快速獲取用戶當前偏好產生推薦結果也值得探索,動態圖網路可能是個很好的解決辦法,Song[89]等人提出了通過動態圖注意力網路進行基于會話的社交推薦,動態圖注意力網路由RNN的隱藏表示捕獲用戶當前的興趣,用圖注意力網路捕獲用戶影響,將用戶的短期偏好與長期偏好分開來,根據用戶當前的興趣,使用注意力機制自動確定每個用戶的影響力,使用這種方法可以實作動態推薦系統存在新用戶的冷啟動問題,1.1.2 基于協同過濾的推薦系統基于協同過濾的推薦系統是推薦系統中應用最成功、最廣泛的推薦方法[12],基于協同過濾的方法通過不同的聚類方式被分成3類,分別是基于用戶的協同過濾、基于專案的協同過濾和基于模型的協同過濾,基于用戶的協同過濾基本思想是目標用戶與其相似用戶之間的偏好可能相同,這就需要根據用戶歷史行為記錄計算出用戶之間的相似度,通過相似用戶的喜愛專案,給目標用戶做出推薦,該類方法的優點是邏輯簡單,可解釋性強,缺點是存在新用戶的冷啟動問題,隨著用戶數量增加,推薦演算法效率會降低,不適合處理大規模資料,基于專案的協同過濾基本思想是如果大多數用戶對推薦專案的評分相近,目標用戶對該推薦專案的評分也可能相近,該方法與基于用戶的協同過濾方法相似,不同的是要根據多數用戶對推薦專案的評分,找到評分高的專案,根據評分高低進行排序,將高評分專案推薦給目標用戶,其優點是可以處理復雜的推薦物件,有利于發掘用戶興趣愛好,缺點是當用戶評分量增加的時候會出現評分差異大的情況,導致資料稀疏問題,而且該方法需要有大量的用戶資料才會有較好的推薦效果,基于模型的協同過濾的基本思想是根據用戶偏好訓練推薦模型,其根據用戶歷史行為記錄通過機器學習方法訓練出數學模型,該方法相比于前兩種方法更加適合大規模資料,1.1.3 混合推薦系統針對上述推薦系統中的不足,混合推薦系統被提出,并將多種推薦技術進行融合,目的是通過多個推薦演算法協同合作,避免單個演算法存在的問題,更好地為用戶做推薦,提升推薦質量和用戶體驗,其中,基于內容的推薦跨領域融合,根據分析可以看出針對特定領域知識圖譜推薦系統提出的方法較少,這種方式針對性更強,推薦效果更好,但是應用成本高,應用范圍受限,大多數知識圖譜推薦系統都可以應用在多個領域,應用范圍廣泛,但是各領域的資料型別不同,同一方法的推薦效果也不同,如何將不同領域資訊融合,實作對物體的多維描述,補全物體資訊實作跨領域推薦值得深度探索,跨領域融合嘗試將同一物體的多領域資訊整合,由于同一用戶在不同領域的偏好可能會出現偏差,就可以考慮遷移學習的方法[90],Zhu[91]等人提出了PTUPCDR模型,該模型首次提出了個性化遷移用戶興趣偏好這個概念,將用戶特征嵌入表示輸入一個元網路來生成個性化的偏好橋來達到個性化偏好遷移,未來可以嘗試用遷移學習的方法將用戶在輔助域中的偏好轉移到目標域,不僅能實作推薦的跨領域融合,而且還能緩解冷啟動的問題和基于協同過濾的推薦組合的方式是最常見的,混合推薦系統融合方式種類多樣,最常見的有推薦結果融合和推薦演算法融合兩種方式,推薦結果融合是將各推薦方法得到的結果進行混合計算,推薦演算法融合使用某一推薦技術作為框架,將其它推薦技術加入到框架中,混合推薦系統通過多種方法結合,有效地緩解了系統中冷啟動和資料稀疏問題,并且還能夠針對特定領域選擇合適的模型進行推薦,通過多種資訊結合,提升推薦系統性能[12],1.2 基于圖神經網路的推薦系統近些年,由于深度學習技術的廣泛使用,研究人員開始嘗試在圖譜中引入深度學習方法,出現了基于圖神經網路推薦系統研究熱潮[13],借鑒了回圈神經網路[14]、卷積神經網路[15]和自動編碼器的基本思想,將圖資料和神經網路相結合,形成圖神經網路[16],圖神經網路分成圖卷積網路、圖注意力網路、圖自編碼器、圖生成網路和圖時空網路五類,圖卷積神經網路是推薦中最常用到的圖神經網路,其基本思想是將卷積運算應用到圖資料中,常見的模型有NGCF[17]、KGCN-PN[18]、NIA-GCN[19],有些推薦系統會將圖神經網路和注意力機制相結合,可以在序列推薦任務中將注意力放到最重要的資料上,常見的模型有GAT[20]、BGANR[21],GCN-ONCF[22]模型是將圖神經網路設計成為一個編碼器,圖神經網路可以學習到深度學習演算法學習不到的用戶和專案之間的關聯關系,利用圖神經網路學習知識圖譜的表示,可以打破物體之間的孤立性,有助于學到更完整更豐富的物體、關系表示,而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起,',
'基于路徑的推薦系統考慮到嵌入而且圖神經網路在學習節點、邊表示上具有很大的優勢,可以更好地學習知識圖譜物體、關系的嵌入表示,改善關系抽取等,幫助構建知識圖譜,但對比于知識圖譜推薦系統,圖神經網路推薦系統的可解釋性不強,無法解釋推理程序和推理依據,并且深度圖神經網路的訓練程序非常艱難,1.3 知識圖譜知識圖譜這一概念最早于2012年由谷歌公司提出,最初的目的是為了提高資訊檢索速度,增加用戶搜索體驗,根據谷歌公司對知識圖譜的描述可以知道知識圖譜是一種利用圖模型來描述知識和建模世界萬物之間關聯關系的技術,它可以將現實世界中的各種物體或者概念以及它們之間的關系都放在一張網路圖譜中,形成關系語意網路,由于資料資訊的多樣化,可以將資料資訊分為非結構化資料、半結構化資料、結構化資料三類,非結構化資料和半結構化資料很難體現出物體之間的關聯關系,不利于資訊檢索,而知識圖譜可以將非結構化資料和半結構化資料轉換成結構化資料,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,知識圖譜根據關系連接各物體并生成路徑,用戶能夠通過路徑去發現與物體具有關聯性的潛在專案,從而獲取更加準確的用戶偏好,在表3中,匯總出了多領域知識圖譜推薦系統基于路徑的方法Hete-MF模型只是使用了專案之間的相似度,多方法推薦,不同的推薦方法都有各自的優缺點,當面對不同需求、不同背景關系場景時應選擇不同的推薦演算法,不可能存在一個推薦演算法在任何時候下都優于其他演算法的情況,所以要充分運用不同推薦演算法各自的優勢,取長補短,相互融合形成一個強大的推薦框架,而且將多種推薦方法融合,可以有效的提高推薦效果,RippleNet模型、KGCN模型和KGAT模型都是典型的混合模型,它們將基于嵌入和基于路徑的方法融合,充分利用了知識圖譜中的物體資訊和語意關系,實作更精確的推薦,但是多種方法結合也導致了計算量大,模型復雜,系統開銷大,推薦速度慢等問題,如何在多方法融合的系統中,針對不同的情況系統可以快速做出推薦回應并盡量降低成本和開銷,在未來推薦系統的發展中值得研究Luo等人[47]提出的Hete-CF模型是將用戶之間的相似度、專案之間的相似度和用戶專案之間的相似度都作為正則化來挖掘用戶偏好,與上述模型思想相似的還有HeteRec[48]模型和HeteRec-p[49]模型,由Shi等人[50]提出的SemRec模型與上述的四類模型不同,SemRec模型根據知識圖譜中的路徑生成一個用戶對專案評級的強度矩陣,評級強度矩陣就代表了用戶的偏好,模型再根據相似用戶的評分,預測推薦系統目標用戶對專案的評分,根據評分進行排序,從高到低推薦給用戶,公式(17)是用戶之間相似度正則化目標函式該模型首先根據用戶的互動歷史訓練出一個關系矩陣給路徑中的各跳鄰居分配權重,由于知識圖譜是由三元組組成的,RippleNet模型根據三元組中的頭物體、關系權重以及候選項得出尾物體的權重,計算出多跳鄰居和候選項之間的相似度,路徑中的每一層用戶都會有一個用戶表示,最后將每一層的用戶表示結合生成用戶的最終表示,反映出用戶的偏好,計算得到用戶的點擊概率,根據點擊概率給用戶做推薦出于對安全性、可靠性等因素的考慮,大量消費者自然而然地流動到醫美資源集聚的城市“求美”,“醫美旅游”悄然興起方法的缺點,根據知識圖譜中路徑表達的語意關系進行推薦,在基于路徑的推薦中元路徑方法需要手動設計元路徑,作業量大,由于各領域資料元結構不同,導致該方法的應用領域有限,基于路徑嵌入的方法不需要手動設計,融合了語意資訊,但是路徑過多導致模型復雜、計算量大、系統開銷也大在針對多領域的模型中,基于嵌入的推薦系統通過對知識圖譜的學習表征,使相關物體得到了低維表征,減少了模型的復雜度和作業量,但是在知識圖譜中除了有大量物體外還有豐富的物體關系,表達了物體間的語意關系,基于嵌入的方法沒有考慮到知識圖譜中資訊間的連接關系,導致推薦系統的可解釋性不強,用戶信任度不高將知識圖譜和推薦系統進行融合,利用知識圖譜中大量的物體和語意關系,可以使相關推薦專案的資訊更加豐富,有效緩解了傳統推薦系統存在的冷啟動和資料稀疏問題,極大提高了推薦的個性化和精確度,研究人員對推薦系統進行深入研究,越來越多推薦模型被提出,推薦的效果也逐步提升,不同模型針對解決的問題也不同,都有各自的優缺點,推薦系統應該根據推薦專案的應用領域,資料集以及資料規模適時地選擇合適的模型,表7列舉了基于知識圖譜推薦系統中各類方法中的經典模型,并對各類模型優缺點進行總結,在表8中還將傳統推薦系統和知識圖譜推薦系統評價指標進行對比,推薦系統常見的評價指標為Acc、AUC、Recall、Precision、RMSE等,根據表8的對比可以看出通常情況下知識圖譜推薦系統優于傳統推薦系統CFKG模型通過定義一個用戶-商品知識圖譜對傳統的協同過濾演算法進行擴展,在用戶-商品的知識圖譜中將用戶、專案及其相關屬性作為物體,用戶的一些歷史行為,如購買、點擊等被作為物體之間的關系,還包含了各種商品的輔助資訊,如用戶評價、商品品牌、品類、購買組合等,CFKG模型利用結構化的資料深度挖掘用戶的喜好,根據歷史行為資料為用戶提供了符合個性化的推薦,通過知識圖譜中的資訊彌補了傳統協同過濾推薦存在的冷啟動和資料稀疏問題,但CFKG模型使用了聯合學習法,模型的訓練周期較長,當目標函式不同時需要進行調整大多數知識圖譜推薦系統均可以通用到多個領域,通用的推薦模型也能夠適用于多種資料集,其優點為適用范圍廣泛、使用方便,但其也存在針對性不強等問題,相同的推薦系統模型在不同的領域推薦效果有時差異較大,尤其面向某些特定領域,通用的推薦模型無法滿足用戶的個性化需求,因此研究者為了提高推薦效率,提出了針對特定領域的特定知識圖譜推薦模型,從而有效地提高推薦準確性,更好地滿足用戶需求基于傳播的方法結合了基于元結構和基于路徑嵌入方法的優點,通過路徑中的傳播思想更加細化用戶和專案的表示,在推薦系統中可以得到更加精確的結果,但是相比于其它兩種方法,利用傳播思想的模型計算量較大,引數優化復雜,系統能源消耗大,如何解決這些問題,使復雜的模型有更加精確、高效的推薦結果值得進一步研究成都頭部醫美機構之一、四川華美紫馨醫學美容醫院2020年整體營收約6億元,該院總經理薛紅介紹,醫院每年治療人數中約20%都是專程前來的外地消費者,',
'“尤其最近幾年,這部分消費者數量增長很快,來自甘肅、青海、云南、貴州等各個省份的都有,多任務學習法,將嵌入模塊和推薦模塊設計成了相關又分離的任務,將這些任務放在同一個框架中進行交替學習,Wang等人[43]提出了MKR模型,Cao等人[44]提出了KTUP模型,典型的例子就是MRK模型,該模型是由KGE模塊和推薦模塊組成的,將知識圖譜以三元組的形式輸入KGE模塊,通過KGE模塊預測出尾物體,用戶和專案的特征表示作為推薦模塊的輸入,通過推薦模塊得到專案點擊率的估計值,在KGE模塊和推薦模塊中間有一個交叉特征共享單元,兩個模塊可以通過該共享單元進行資料交換,這樣就可以得到用戶的最終表示uL,如公式(6)所示,專案的最終表示vL,如公式(7)所示,其中vL是由L個交叉壓縮單元提取的特征,CL是第L層的交叉特征矩陣,Sv表示的是專案v的相關物體集合,公式(8)為預測函式,目的是將用戶的最終表示uL和專案的最終表示vL結合起來,”',
'動態知識圖譜[87]和動態推薦系統[88],隨著圖神經網路和圖卷積網路技術的成熟發展知識圖譜推薦系統已經有了良好的性能,但現在資訊的更新速度快,實時性強,目前已有的知識圖譜都是在一定時間內創建的,資訊更新不及時,搭建動態知識圖譜,可以考慮在知識圖譜資料中加入時間資訊,利用時序分析技術和圖相似性技術,分析圖譜結構隨時間的變化和趨勢,從而掌握到關鍵資訊,知識圖譜構建的工程量較大,如何在短時間內將資訊匯入知識圖譜,實作知識圖譜的實時更新值得進一步研究基于上述分析,可以得出知識圖譜推薦系統提高了推薦準確性、應用廣泛、緩解了傳統推薦系統存在的冷啟動問題和資料稀疏問題,但由于資訊量持續膨脹,資訊時效性增強,如何利用時效資訊快速推薦,并且實作跨領域和多方法推薦使知識圖譜推薦系統能夠適應不同的應用需求,還存在著很多有待研究、解決的問題,本節針對知識圖譜推薦系統的時效性和融合性對未來研究問題進行展望電子商務:由于網購的普及和發展,針對電子商務推薦的研究也逐漸增多[84],和其它的推薦任務相比,電子商務推薦的資料量很大,常用的資料集是從豆瓣收集來的,也有些論文使用了Taobao資料集,Douban[85]資料集中包含了服裝、電子產品、音樂、電影等多個子資料集,資料集中不僅有用戶和商品的屬性,還有用戶的評價和用戶的互動歷史資訊,這些資料使用戶和專案的表示更加豐富,有助于提高推薦效果,特定領域知識圖譜推薦系統中的CFKG模型使用了Amazon電子商務資料集,CFKG模型選取了Amazon資料集中的CDs & Vinyl、Clothing、Cell Phone和Beauty五個子資料集,每個子資料集中到包含了大量的用戶和專案以及互動資料,其中每個用戶或產品只會有5個相關的評論資訊,所以資料集中用戶、專案和物體之間的互動是十分稀疏的電影:在傳統的推薦系統中電影推薦和圖書推薦一樣,是最常見的推薦任務之一,電影推薦任務和圖書推薦不同之處在于,電影中包含大量視頻資訊和音頻資訊[77],在電影推薦中常用的資料集是MovieLens[78]資料集和DoubanMovie[79]資料集,MovieLens資料集分為MovieLens-20M、MovieLens-1M和MovieLens-100K資料集,常用的是MovieLens-1M和MovieLens-100K資料集,MovieLens-1M中有三份資料集,ratings中是用戶對電影的評分資料,users中是用戶的相關資料資訊,movies中是電影的相關資料資訊,MovieLens-100K資料集是最小的,和MovieLens-1M不同的是各個用戶都有獨立的檔案,MovieLen資料集中的資料是顯式反饋資料,使用該資料集時要將顯式反饋資料轉換為隱式反饋資料,其中每個條目都標記為1,每個用戶會設定一個未觀看集,未觀看集中的資料被標記為0,MovieLens的評級閾值為4,DoubanMovie資料集包含31441條電影的相關記錄,每條記錄中都有電影ID、電影名稱、電影上映年份、電影型別等相關資訊基于路徑的推薦系統考慮到嵌入方法的缺點,根據知識圖譜中路徑表達的語意關系進行推薦,在基于路徑的推薦中元路徑方法需要手動設計元路徑,作業量大,由于各領域資料元結構不同,導致該方法的應用領域有限,基于路徑嵌入的方法不需要手動設計,融合了語意資訊,但是路徑過多導致模型復雜、計算量大、系統開銷也大',
]
# 加載停用詞表
stopwords = get_stop_words()
sentences_cut = cut_words(sentences_list, stopwords, save_path='第2題/data.txt')
print(sentences_cut)
model = train_word2vec(words_file='第2題/data.txt')
print("相似度計算:", model.wv.most_similar(['知識', '輔助']))
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/543606.html
標籤:其他
