主頁 > 後端開發 > Python工具箱系列(三十一)

Python工具箱系列(三十一)

2023-05-12 08:01:18 後端開發

Neo4j是一個高性能的開源的,使用Java語言實作的NoSQL圖資料庫,它將結構化資料存盤在網路上而不是表中,它是一個嵌入式的、基于磁盤的、具備完全的事務特性的Java持久化引擎,但是它將結構化資料存盤在網路(從數學角度叫做圖)上而不是表中,Neo4j也可以被看作是一個高性能的圖引擎,該引擎具有成熟資料庫的所有特性,現實中很多資料都是用圖來表達的,比如社交網路中人與人的關系、地圖資料、或是基因資訊等等,RDBMS并不適合表達這類資料,而且由于海量資料的存在,讓其顯得捉襟見肘,NoSQL資料庫的興起,很好地解決了海量資料的存放問題,圖資料庫也是NoSQL的一個分支,相比于NoSQL中的其他分支,它很適合用來原生表達圖結構的資料,圖資料庫存盤的結構就如同計算機科學中的資料結構中所論述的圖,由頂點和邊組成,

Neo4j適用于圖形一類資料,例如:社會關系,公共交通網路,地圖及網路拓撲,Neo4j并為此專門進行了演算法優化,也開發了相關的查詢語言,這是Neo4j與其他NoSQL資料庫的最顯著區別,Neo4j不適用于:

◆記錄大量基于事件的資料(例如日志條目或傳感器資料)

◆對大規模分布式資料進行處理,類似于Hadoop

◆二進制資料存盤

◆適合于保存在關系型資料庫中的結構化資料

Neo4j提供了免費的社區版本,在資料量不大的情況下,可以用于開發,大規模部署與應用建議購買企業版,在ubuntu bionic下的安裝程序如下所示:

wget -O - https://debian.neo4j.com/neotechnology.gpg.key | sudo apt-key add -
echo 'deb https://debian.neo4j.com stable latest' | sudo tee /etc/apt/sources.list.d/neo4j.list
sudo apt-get update

# 安裝社區版本
sudo apt-get install -y neo4j

# 安裝企業版本
sudo apt-get install -y neo4j-enterprise

systemctl status neo4j
systemctl start neo4j
systemctl enable neo4j

# 直接在本地檢測是否安裝成功
curl http://localhost:7474/

同樣的,預設情況下是只接受本地訪問要求,可以編輯/etc/neo4j/neo4j.conf檔案增加"dbms.default_listen_address=0.0.0.0"這一行,隨后重新啟動服務即可遠程訪問:

sed -i '$adbms.default_listen_address=0.0.0.0' /etc/neo4j/neo4j.conf
systemctl restart neo4j

以上使用sed命令增加了系結地址,隨后使用主流的瀏覽器(Edge,firefox,chrome)就可以訪問資料庫,如下圖所示:

第一次訪問時的預設用戶名與口令均是Neo4j,登錄后需要修改,隨后就進入到作業界面如下:

也可以使用傳統的資料庫客戶端如DBeaver來訪問Neo4j資料庫,此時的連接屬性設定如下圖所示:

與SQL類似,Neo4j推出了專用于圖的宣告性文本查詢語言Cypher,Cypher包含陳述句、關鍵詞和運算式,比如謂詞、函式等,其中很多大家都很熟悉(如WHERE,ORDER BY,SKIP LIMIT,AND,p.unitPrice > 10),與SQL不同,Cypher完全是表達圖模式的,添加了一個特殊子句MATCH來匹配資料中的這些模式,使用圓括號表示節點物體的圓,比如:(p:Product),而關系的箭頭使用-->來表達,Cypher語言在其它方面的重點是圖概念,例如路徑、可變長度路徑、最短路徑函式;串列上許多功能,操作和謂詞的支持以及鏈接查詢的功能,使用Cypher可以更新圖結構和資料,甚至匯入大量的CSV資料,通過用戶定義的程序能夠擴展語言,通過openCypher專案,Cypher已經成為一種現代圖查詢語言的開放標準,并且得到了多家資料庫公司的支持,其語法可以參考[語法卡](https://neo4j.com/docs/cypher-refcard/current/),

可以通過多種方式來訪問Neo4j資料庫:

◆ 使用命令列工具如Cypher shell等

◆使用主流的瀏覽器訪問,Neo4j稱為Neo4j browser

◆其它第三方工具軟體

模仿movie graph,我們建立一個中文的圖資料庫,相關創建內容如下:

CREATE (Jiangshuying:Person {name:'江疏影', born:1986})
CREATE (胡哥:Person {name:'胡哥', born:1982})
CREATE (Jindong:Person {name:'靳東', born:1976})
CREATE (萬莤:Person {name:'萬莤', born:1982})
CREATE (Gentlemen:Teleplay {title:"戀愛先生", released:2017})
CREATE (NothingButThirty:Teleplay {title:'三十而已', released:2020})
CREATE (外科風云:Teleplay {title:'外科風云', released:2017})
CREATE (偽裝者:Teleplay {title:'偽裝者', released:2015})
CREATE (好先生:Teleplay {title:'好先生', released:2016})
CREATE (縣委大院:Teleplay {title:'縣委大院', released:2022})
CREATE (Jiangshuying)-[:ACTED_IN {roles:['江萊']}]->(好先生)
CREATE (Jiangshuying)-[:ACTED_IN {roles:['羅鑰']}]->(Gentlemen)
CREATE (Jiangshuying)-[:ACTED_IN {roles:['王漫妮']}]->(NothingButThirty)
CREATE (Jindong)-[:ACTED_IN {roles:['莊恕']}]->(外科風云)
CREATE (Jindong)-[:ACTED_IN {roles:['明樓']}]->(偽裝者)
CREATE (Jindong)-[:ACTED_IN {roles:['Boss']}]->(Gentlemen)
CREATE (胡哥)-[:ACTED_IN {roles:['明臺']}]->(偽裝者)
CREATE (胡哥)-[:ACTED_IN {roles:['梅曉哥']}]->(縣委大院)
CREATE (萬莤)-[:ACTED_IN {roles:['徐麗']}]->(好先生)

此時形成的知識圖譜如下所示:

由此可見Neo4j對中文的支持非常好,可以混合用中英文來建立自己的知識圖譜,下面的代碼顯示了,尋找萬莤與胡哥間相互認識的最短路徑,

match p=shortestpath((:Person {name:'江疏影'})-[*]-(:Person {name:'胡哥'})) return p

查詢結果如下圖所示:

當然這只是一個示例,因為并沒有真正梳理每個人的關系,僅僅是從現有的知識中計算出來的,對于知識圖譜來說,資訊越充分,威力越巨大,

需要注意的是,以上命令必須一次性輸入執行完成,否則就會出現看起來是一樣的節點,但Neo4j會認為是不同的物件,從而形成意料之外的節點與關系,

Python操作知識圖譜

安裝了Py2neo就可以使用Python操作Neo4j了,我們也就可以在線處理大規模的資料,實作知識圖譜的自動構建了,安裝方法非常簡單,直接在cmd中輸入下列命令即可:

pip install py2neo

以下代碼創建了一個極簡的知識圖譜,如下圖所示:

示例代碼如下所示:

from py2neo import Node, Relationship, Graph, NodeMatcher, RelationshipMatcher

# 遠端NEO4J服務器
test_graph = Graph('http://172.20.103.169:7474',auth=('neo4j','88488848'))

A = Node("員工", name="張三", PID = 100)
B = Node("員工", name="李四", PID = 100)
C = Node("公司", name="西安衍輿",  CID = 99)
test_graph.create(A)
test_graph.create(B)
test_graph.create(C)
test_graph.create(Relationship(A, "作業于", C))
test_graph.create(Relationship(B, "作業于", C))

print(test_graph.nodes.match('員工').all())

從圖中可以看出,Neo4j對于中文的支持是非常好的,能夠以非常符合中文習慣的方式寫出相關知識,真正能夠實用的知識圖譜必須是榷訓月累的程序,有了稱手的工具后,知識本身的正確性才是重點,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/552199.html

標籤:其他

上一篇:6000+字講透ElasticSearch 索引設計

下一篇:返回列表

標籤雲
其他(158840) Python(38128) JavaScript(25413) Java(18033) C(15226) 區塊鏈(8264) C#(7972) AI(7469) 爪哇(7425) MySQL(7177) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5338) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4570) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1972) 功能(1967) Web開發(1951) HtmlCss(1935) python-3.x(1918) C++(1915) 弹簧靴(1913) xml(1889) PostgreSQL(1875) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Python工具箱系列(三十一)

    Neo4j是一個高性能的開源的,使用Java語言實作的NoSQL圖資料庫,它將結構化資料存盤在網路上而不是表中。它是一個嵌入式的、基于磁盤的、具備完全的事務特性的Java持久化引擎,但是它將結構化資料存盤在網路(從數學角度叫做圖)上而不是表中。 ......

    uj5u.com 2023-05-12 08:01:18 more
  • 6000+字講透ElasticSearch 索引設計

    ElasticSearch 索引設計 在MySQL中資料庫設計非常重要,同樣在ES中資料庫設計也是非常重要的 概述 我們創建索引就像創建表結構一樣,必須非常慎重的,索引如果創建不好后面會出現各種各樣的問題 索引設計的重要性 索引創建后,索引的分片只能通過_split和_shrink介面對其進行成倍的 ......

    uj5u.com 2023-05-12 08:00:59 more
  • 用go設計開發一個自己的輕量級登錄庫/框架吧(專案維護篇)

    用go設計開發一個自己的輕量級登錄庫/框架吧(專案維護篇) 本篇將開始講講開發庫/框架的最開始階段,也就是搭建一個專案 原始碼:weloe/token-go: a light login library (github.com) 專案結構 專案結構,不是上一篇所說的代碼架構,而是分包,明確的分包更有助 ......

    uj5u.com 2023-05-12 08:00:48 more
  • Linux網路編程:socket實作client/server通信

    一、問題引入 閱讀UNIX網路編程 卷1:套接字聯網API 第3版的前4個章節,覺得有必要對書籍上的原始碼案例進行復現,并推敲TCP的C/S通信程序。 二、解決程序 2-1 server #include <sys/types.h> #include <sys/socket.h> #include < ......

    uj5u.com 2023-05-12 08:00:40 more
  • Go語言(Golang)資料庫編程

    Go 資料庫編程 一、連接資料庫 準備連接到資料庫 要想連接到 SQL 資料庫,首先需要加載目標資料庫的驅動,驅動里面包含著于該資料庫互動的邏輯。 sql.Open() 資料庫驅動的名稱 資料源名稱 得到一個指向 sql.DB 這個 struct 的指標 sql.DB 是用來操作資料庫的,它代表了0 ......

    uj5u.com 2023-05-12 08:00:34 more
  • openAI發布v0.2.0了

    時隔20天,OpenAI從v0.0.1升級到了v0.2.0。與v0.0.1版相比,v0.2.0版主要做了以下改動: 把cmd目錄下微信公眾號的相關服務遷移到了這里 完善了cmd下的測驗服務,針對openAI庫里實作的各個介面都提供了回應的呼叫介面,服務運行后可以通過postman進行測驗 完成了Fi ......

    uj5u.com 2023-05-12 08:00:27 more
  • spring-transaction原始碼分析(3)Transactional事務失效原因

    問題概述 在Transactional方法中使用this方式呼叫另一個Transactional方法時,攔截器無法攔截到被呼叫方法,嚴重時會使事務失效。 類似以下代碼: @Transactional public void insertBlogList(List<Blog> blogList) { ......

    uj5u.com 2023-05-12 08:00:18 more
  • Fast-GRPC: 用python輕松開發grpc介面

    簡介 Fast-GRPC 旨在幫助開發者更加輕松快捷地使用 Python 開發 gRPC 介面。它的特點包括簡化步驟、簡單上手、快速開發,同時支持異步和同步代碼,以及支持 middleware,靈感來自FastAPI。 安裝 需要python 3.7+ pip install python-fast ......

    uj5u.com 2023-05-12 07:59:32 more
  • 用Python實作藝識訓畫,人生苦短,代碼賽高

    #用Python實作藝識訓畫 藝識訓畫是一個創造性的程序,包括繪畫、素描和繪畫。借助Python編程語言,您可以模擬藝識訓畫的程序。該程序包括以下步驟: 1.匯入所需的庫-您需要匯入NumPy、OpenCV和Matplotlib等庫來執行影像處理任務。 2.加載影像-您可以使用OpenCV加載影像。 ......

    uj5u.com 2023-05-12 07:59:28 more
  • Python工具箱系列(三十一)

    Neo4j是一個高性能的開源的,使用Java語言實作的NoSQL圖資料庫,它將結構化資料存盤在網路上而不是表中。它是一個嵌入式的、基于磁盤的、具備完全的事務特性的Java持久化引擎,但是它將結構化資料存盤在網路(從數學角度叫做圖)上而不是表中。 ......

    uj5u.com 2023-05-12 07:59:14 more