主頁 > 後端開發 > Python工具箱系列(三十一)

Python工具箱系列(三十一)

2023-05-12 07:59:14 後端開發

Neo4j是一個高性能的開源的,使用Java語言實作的NoSQL圖資料庫,它將結構化資料存盤在網路上而不是表中,它是一個嵌入式的、基于磁盤的、具備完全的事務特性的Java持久化引擎,但是它將結構化資料存盤在網路(從數學角度叫做圖)上而不是表中,Neo4j也可以被看作是一個高性能的圖引擎,該引擎具有成熟資料庫的所有特性,現實中很多資料都是用圖來表達的,比如社交網路中人與人的關系、地圖資料、或是基因資訊等等,RDBMS并不適合表達這類資料,而且由于海量資料的存在,讓其顯得捉襟見肘,NoSQL資料庫的興起,很好地解決了海量資料的存放問題,圖資料庫也是NoSQL的一個分支,相比于NoSQL中的其他分支,它很適合用來原生表達圖結構的資料,圖資料庫存盤的結構就如同計算機科學中的資料結構中所論述的圖,由頂點和邊組成,

Neo4j適用于圖形一類資料,例如:社會關系,公共交通網路,地圖及網路拓撲,Neo4j并為此專門進行了演算法優化,也開發了相關的查詢語言,這是Neo4j與其他NoSQL資料庫的最顯著區別,Neo4j不適用于:

◆記錄大量基于事件的資料(例如日志條目或傳感器資料)

◆對大規模分布式資料進行處理,類似于Hadoop

◆二進制資料存盤

◆適合于保存在關系型資料庫中的結構化資料

Neo4j提供了免費的社區版本,在資料量不大的情況下,可以用于開發,大規模部署與應用建議購買企業版,在ubuntu bionic下的安裝程序如下所示:

wget -O - https://debian.neo4j.com/neotechnology.gpg.key | sudo apt-key add -
echo 'deb https://debian.neo4j.com stable latest' | sudo tee /etc/apt/sources.list.d/neo4j.list
sudo apt-get update

# 安裝社區版本
sudo apt-get install -y neo4j

# 安裝企業版本
sudo apt-get install -y neo4j-enterprise

systemctl status neo4j
systemctl start neo4j
systemctl enable neo4j

# 直接在本地檢測是否安裝成功
curl http://localhost:7474/

同樣的,預設情況下是只接受本地訪問要求,可以編輯/etc/neo4j/neo4j.conf檔案增加"dbms.default_listen_address=0.0.0.0"這一行,隨后重新啟動服務即可遠程訪問:

sed -i '$adbms.default_listen_address=0.0.0.0' /etc/neo4j/neo4j.conf
systemctl restart neo4j

以上使用sed命令增加了系結地址,隨后使用主流的瀏覽器(Edge,firefox,chrome)就可以訪問資料庫,如下圖所示:

第一次訪問時的預設用戶名與口令均是Neo4j,登錄后需要修改,隨后就進入到作業界面如下:

也可以使用傳統的資料庫客戶端如DBeaver來訪問Neo4j資料庫,此時的連接屬性設定如下圖所示:

與SQL類似,Neo4j推出了專用于圖的宣告性文本查詢語言Cypher,Cypher包含陳述句、關鍵詞和運算式,比如謂詞、函式等,其中很多大家都很熟悉(如WHERE,ORDER BY,SKIP LIMIT,AND,p.unitPrice > 10),與SQL不同,Cypher完全是表達圖模式的,添加了一個特殊子句MATCH來匹配資料中的這些模式,使用圓括號表示節點物體的圓,比如:(p:Product),而關系的箭頭使用-->來表達,Cypher語言在其它方面的重點是圖概念,例如路徑、可變長度路徑、最短路徑函式;串列上許多功能,操作和謂詞的支持以及鏈接查詢的功能,使用Cypher可以更新圖結構和資料,甚至匯入大量的CSV資料,通過用戶定義的程序能夠擴展語言,通過openCypher專案,Cypher已經成為一種現代圖查詢語言的開放標準,并且得到了多家資料庫公司的支持,其語法可以參考[語法卡](https://neo4j.com/docs/cypher-refcard/current/),

可以通過多種方式來訪問Neo4j資料庫:

◆ 使用命令列工具如Cypher shell等

◆使用主流的瀏覽器訪問,Neo4j稱為Neo4j browser

◆其它第三方工具軟體

模仿movie graph,我們建立一個中文的圖資料庫,相關創建內容如下:

CREATE (Jiangshuying:Person {name:'江疏影', born:1986})
CREATE (胡哥:Person {name:'胡哥', born:1982})
CREATE (Jindong:Person {name:'靳東', born:1976})
CREATE (萬莤:Person {name:'萬莤', born:1982})
CREATE (Gentlemen:Teleplay {title:"戀愛先生", released:2017})
CREATE (NothingButThirty:Teleplay {title:'三十而已', released:2020})
CREATE (外科風云:Teleplay {title:'外科風云', released:2017})
CREATE (偽裝者:Teleplay {title:'偽裝者', released:2015})
CREATE (好先生:Teleplay {title:'好先生', released:2016})
CREATE (縣委大院:Teleplay {title:'縣委大院', released:2022})
CREATE (Jiangshuying)-[:ACTED_IN {roles:['江萊']}]->(好先生)
CREATE (Jiangshuying)-[:ACTED_IN {roles:['羅鑰']}]->(Gentlemen)
CREATE (Jiangshuying)-[:ACTED_IN {roles:['王漫妮']}]->(NothingButThirty)
CREATE (Jindong)-[:ACTED_IN {roles:['莊恕']}]->(外科風云)
CREATE (Jindong)-[:ACTED_IN {roles:['明樓']}]->(偽裝者)
CREATE (Jindong)-[:ACTED_IN {roles:['Boss']}]->(Gentlemen)
CREATE (胡哥)-[:ACTED_IN {roles:['明臺']}]->(偽裝者)
CREATE (胡哥)-[:ACTED_IN {roles:['梅曉哥']}]->(縣委大院)
CREATE (萬莤)-[:ACTED_IN {roles:['徐麗']}]->(好先生)

此時形成的知識圖譜如下所示:

由此可見Neo4j對中文的支持非常好,可以混合用中英文來建立自己的知識圖譜,下面的代碼顯示了,尋找萬莤與胡哥間相互認識的最短路徑,

match p=shortestpath((:Person {name:'江疏影'})-[*]-(:Person {name:'胡哥'})) return p

查詢結果如下圖所示:

當然這只是一個示例,因為并沒有真正梳理每個人的關系,僅僅是從現有的知識中計算出來的,對于知識圖譜來說,資訊越充分,威力越巨大,

需要注意的是,以上命令必須一次性輸入執行完成,否則就會出現看起來是一樣的節點,但Neo4j會認為是不同的物件,從而形成意料之外的節點與關系,

Python操作知識圖譜

安裝了Py2neo就可以使用Python操作Neo4j了,我們也就可以在線處理大規模的資料,實作知識圖譜的自動構建了,安裝方法非常簡單,直接在cmd中輸入下列命令即可:

pip install py2neo

以下代碼創建了一個極簡的知識圖譜,如下圖所示:

示例代碼如下所示:

from py2neo import Node, Relationship, Graph, NodeMatcher, RelationshipMatcher

# 遠端NEO4J服務器
test_graph = Graph('http://172.20.103.169:7474',auth=('neo4j','88488848'))

A = Node("員工", name="張三", PID = 100)
B = Node("員工", name="李四", PID = 100)
C = Node("公司", name="西安衍輿",  CID = 99)
test_graph.create(A)
test_graph.create(B)
test_graph.create(C)
test_graph.create(Relationship(A, "作業于", C))
test_graph.create(Relationship(B, "作業于", C))

print(test_graph.nodes.match('員工').all())

從圖中可以看出,Neo4j對于中文的支持是非常好的,能夠以非常符合中文習慣的方式寫出相關知識,真正能夠實用的知識圖譜必須是榷訓月累的程序,有了稱手的工具后,知識本身的正確性才是重點,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/552190.html

標籤:Python

上一篇:用tk.mybaits實作指定欄位更新

下一篇:返回列表

標籤雲
其他(158833) Python(38126) JavaScript(25413) Java(18033) C(15226) 區塊鏈(8264) C#(7972) AI(7469) 爪哇(7425) MySQL(7177) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5338) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4570) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1972) 功能(1967) Web開發(1951) HtmlCss(1935) python-3.x(1918) C++(1915) 弹簧靴(1913) xml(1889) PostgreSQL(1875) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Python工具箱系列(三十一)

    Neo4j是一個高性能的開源的,使用Java語言實作的NoSQL圖資料庫,它將結構化資料存盤在網路上而不是表中。它是一個嵌入式的、基于磁盤的、具備完全的事務特性的Java持久化引擎,但是它將結構化資料存盤在網路(從數學角度叫做圖)上而不是表中。 ......

    uj5u.com 2023-05-12 07:59:14 more
  • 用tk.mybaits實作指定欄位更新

    ? 去年年底的因為業務需要需要在使用tk.mybaits框架的系統中實作指定欄位的更新,可是tk.mybaits框架本身并不支持這個功能,我翻遍了CSDN和其他相關的技術相關的網站都沒有找到相關的解決方法。于是我通過幾天的翻閱相關資料和摸索后終于實作了這個功能。最近事情不是很多,想到又想到了去年解決 ......

    uj5u.com 2023-05-12 07:58:43 more
  • 存下吧!Spring高頻面試題總結

    Spring是什么? Spring是一個輕量級的控制反轉(IoC)和面向切面(AOP)的容器框架。 Spring的優點 通過控制反轉和依賴注入實作松耦合。 支持面向切面的編程,并且把應用業務邏輯和系統服務分開。 通過切面和模板減少樣板式代碼。 宣告式事務的支持。可以從單調繁冗的事務管理代碼中解脫出來 ......

    uj5u.com 2023-05-12 07:57:17 more
  • Spring MVC官方檔案學習筆記(一)之Web入門

    注: 該章節主要為原創內容,為后續的Spring MVC內容做一個先行鋪墊 1.Servlet的構建使用 (1) 選擇Maven -> webapp來構建一個web應用 (2) 構建好后,打開pom.xml檔案,一要注意打包方式為war包,二匯入servlet依賴,如下 <!-- 打war包 --> ......

    uj5u.com 2023-05-12 07:56:59 more
  • docker(一):Develop faster. Run anywhere.

    Docker 是一個開源的應用容器引擎,可以讓開發者將應用程式打包成一個容器,并通過容器來部署、運行和管理應用程式。Docker 的核心概念包括容器和鏡像。容器是鏡像的可運行實體,可以通過 Docker API 或 CLI 來創建、啟動、停止、移動或洗掉容器。鏡像是一個只讀模板,包含了創建 Dock... ......

    uj5u.com 2023-05-12 07:51:36 more
  • 實作高并發秒殺的 7 種方式,寫的太好了,建議收藏!!

    1.引言 高并發場景在現場的日常作業中很常見,特別是在互聯網公司中,這篇文章就來通過秒殺商品來模擬高并發的場景。文章末尾會附上文章的所有代碼、腳本和測驗用例。 本文環境: SpringBoot 2.5.7 + MySQL 8.0 X + MybatisPlus + Swagger2.9.2 模擬工具 ......

    uj5u.com 2023-05-12 07:40:17 more
  • JScrollPane

    JScrollPane 組件() 功能介紹: 當容器的顯示區域不足以同時顯示所有組件的時候,滾動面版JScrollPane(后省略為JS)可以通過滾動的方式將組件的內容展示出來。 使用方法: JS通過將一些組件先添加到JPanel中,再將JPanel添加到JS上,而JTextArea、JList、J ......

    uj5u.com 2023-05-12 07:30:02 more
  • 6000+字講透ElasticSearch 索引設計

    ElasticSearch 索引設計 在MySQL中資料庫設計非常重要,同樣在ES中資料庫設計也是非常重要的 概述 我們創建索引就像創建表結構一樣,必須非常慎重的,索引如果創建不好后面會出現各種各樣的問題 索引設計的重要性 索引創建后,索引的分片只能通過_split和_shrink介面對其進行成倍的 ......

    uj5u.com 2023-05-12 07:29:48 more
  • spring-transaction原始碼分析(3)Transactional事務失效原因

    問題概述 在Transactional方法中使用this方式呼叫另一個Transactional方法時,攔截器無法攔截到被呼叫方法,嚴重時會使事務失效。 類似以下代碼: @Transactional public void insertBlogList(List<Blog> blogList) { ......

    uj5u.com 2023-05-12 07:29:33 more
  • 用go設計開發一個自己的輕量級登錄庫/框架吧(專案維護篇)

    用go設計開發一個自己的輕量級登錄庫/框架吧(專案維護篇) 本篇將開始講講開發庫/框架的最開始階段,也就是搭建一個專案 原始碼:weloe/token-go: a light login library (github.com) 專案結構 專案結構,不是上一篇所說的代碼架構,而是分包,明確的分包更有助 ......

    uj5u.com 2023-05-12 07:29:13 more