1 什么是知識圖譜?
通俗地講,知識圖譜就是把所有不同種類的資訊(Heterogeneous Information)連接在一起而得到的一個關系網路,
知識圖譜這個網路具備以下3種特性:
1.1 由節點(Point)和邊(Edge)組成
1.2 每個節點表示現實世界中存在的“物體”,每條邊為物體與物體之間的“關系”
1.3 知識圖譜是關系的最有效的表示方式

簡單總結知識圖譜就是語意網路,是一種基于圖的資料結構,
知識圖譜主要分為兩大類:
1.通用知識圖譜,用自己的話來講就是大家都可以用的一種,不涉及深層的專業知識以及行業知識內容,例如有:一些常識問題,科普類問題等等
2.是行業知識圖譜,用自己的話來講就是比較專業的一種,根據不同的行業不同的領域深度研究的版本,主要解決當前行業和當前領域的專業問題,
首先是通用的知識圖譜
我們日常經常使用的知識圖譜,主要就是面向瀏覽器搜索,推薦系統,還有問答系統等等業務場景,
瀏覽器知識圖譜

行業知識圖譜
行業知識圖譜是特定的領域內的知識圖譜,對不同的物件要考慮行業內中的不同級別的人員,不同人員對應的作業和業務場景不同,因而需要一定的完備性,行業的知識圖譜對準確率要求極高,通常用于輔助和分析應用,有嚴格和豐富的資料模式,行業知識圖譜中的物體通常比較多:

企業社交圖譜查詢:
基于任職、投資、專利、投標關系以企業為核心向外層擴散,形成一個網路關系圖,直觀的顯示企業之間的聯系,

人脈之間的關系
基于兩個用戶之間的關系(例如:所在公司、同事、同學、家人)找到兩者之間存在的關系,

輔助貸錢資訊審核:
基于知識圖譜資料的統一查詢,會掌握用戶的詳細資訊,避免資訊不一致資訊重復,資訊不完整等問題,

企業最終持股人查詢:
基于股權投資找到持股比例最大的股東,

反欺詐騙貨
同一個人利用多個身份去申請貸款,根據下圖可以看出來,A,B,C之前沒有直接的關系,但是通過圖可以看出三者之間都共享同一部分的資訊,存在一定的騙貨風險,

企業發展歷程時(融資)
基于企業知識圖譜中的投融資事件發生的時間順序,記錄企業的融資發展歷程,

競品分析
兩家企業知識路徑相同,競爭關系就越緊張:

征信系統
根據用戶已以有的資訊(例如:身份證資訊,聯系方式,擔保人,學歷,被擔保人資訊)關聯多家平臺的資訊記錄,

建設一個知識圖譜系統,需要包括:知識建模、知識獲取、知識融合、知識存盤和知識應用五大部分組成:
1.知識建模:構建的多層級知識體系,將抽象的知識、屬性、關系等資訊,進行定義,組織、管理,轉化成現實的資料庫,
2.知識獲取:將不同來源、不同結構的資料轉化成圖譜資料,包括結構化資料、半結構化資料、知識標引、知識推理等,保障資料的有效性和完整性,
3.知識融合:將多個來源、重復的知識資訊進行融合,包括融合計算、融合計算引擎、手動操作融合等,
4.知識存盤:根據業務場景提供合理的知識存盤方法,存盤方法應具備靈活、多樣化、可拓展性,
5.知識應用:為構建好的知識圖譜提供圖譜檢索、知識計算、圖譜可視化的一些分析和應用能力,并提供各類知識計算的SDK(軟體開發工具),包含圖譜基礎的應用類、圖譜結構分析類、圖譜語意應用類、自然語言處理類、圖資料獲取類、圖譜的統計類、資料集獲取資料類、資料集統計類等一些,
下一章:會寫關于 《知識圖譜-知識建模》
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/384130.html
標籤:AI
上一篇:RNN,LSTM和GRU
