主頁 > 軟體設計 > Elasticsearch資料庫 | Elasticsearch-7.5.0應用基礎實戰

Elasticsearch資料庫 | Elasticsearch-7.5.0應用基礎實戰

2020-09-28 18:43:10 軟體設計

Elasticsearch 是一個可用于分布式以及符合RESTful 風格的搜索和資料分析引擎,—— Elastic Stack 官網

0FNnW8.png

關于Elasticsearch的“愛恨情仇"

  • 或許提起搜索服務器,大部分人都會想起Solr 和 Elasticsearch 甚至以及國產大廠自研等,隨著人工智能和大資料時代的到來,甚至還帶動了一系列的機器引擎的出現,譬如Splunk等,其中Solr 和 Elasticsearch是基于Lucene的搜索服務器,一般Solr是面向的是全文檢索引擎,而Elasticsearch是用于全文搜索、結構化搜索、分析,而對于Splunk機器資料的引擎,可收集、索引和利用所有應用程式、服務器和設備生成的快速移動型計算機資料,可是不論技術如何發展和更替,作為一位程式員,我們要做的不就是即時地維護技術儲備知識庫和實時更新自己的技術快取,以及實作可擴展性的技術深度樹的增長,
  • 關于Elasticsearch,記得當時接觸到Elasticsearch的名詞的時候,那是2017年的夏天,當時的作業任務是實作一個關于知識庫的系統,當時小伙伴們技術選型主要還是偏向Solr+Lucene來的做,有的甚至說直接使用Mysql資料庫的自帶函式來做,我是在無意中,在網上查詢搜索引擎的技術實戰的時候,看見了一篇對于Elasticsearch應用實戰的應用報告分析,才去查詢了Elasticsearch的相關資料,不過,當時網上大部分對于搜索功能的Demo,大部分還是關于Solr 的比較多,也許在那個時候,大部分的技術概念基本都是偏向于技術長期穩定和檔案資料全,使用程度相對較重的因素,但是,我個人卻留了一個心眼,自己嘗試去實戰Elasticsearch,
  • 第一次,動手實操還是在Windows本機上安裝(22G記憶體)的,其中,安裝程序相比利用Tomcat+Solr來說,相對較復雜,而且對于本機的記憶體和功耗占用較重,個開發基本只能說是能運行起來,可穩定性方面,就有點顯得望而卻步的感覺,第二次,動手實戰是在本機搭建了一個虛擬機去實戰(2核8G),可在網路通信方面,當時選的是網路橋接方式,也讓我對此覺得很是麻煩,第三次,是自己擁有了自己的阿里云服務器,在上面按照傳統部署方式(相對于Docker部署來說),可無奈個人服務器記憶體較低(2核4G),修改配置JVM等無法啟動成功,總是拋出GC日志什么的問題,主要還是當時囊中羞澀的問題,甚至一旦運行Elasticsearch服務,其它的應用便無法啟動和 運行,后來,接觸了Docker,于是,有了第四次的Elasticsearch實戰(單節點部署),第四次,升級了阿里云服務器的配置(2核8G),最終實作了額自己的第一個Elasticsearch服務,甚至,為在后來作業中,動手實戰Elasticsearch分布式集群服務奠定基礎,

基本概述

  • 似乎從某種意義來說Elasticsearch和MongoDB/Redis/Memcache一樣,是一種Nosql資料庫,是一個接近實時的搜索平臺,從索引這個檔案到這個檔案能夠被搜索到只有一個輕微的延遲,企業應用定位:采用Restful API標準的可擴展和高可用的實時資料分析的全文搜索工具,不過在當時,Elastic Stack只有Elasticsearch、Kibana 和 Logstash用例,還沒有包含Beats等,而且在應用方面,除了來當作ELK分布式日志系統搭建外,更多的是Elasticsearch +Elasticsearch-Head插件在滿足業務場景方面的需求,能夠安全可靠地獲取任何來源、任何格式的資料,然后實時地對資料進行搜索、分析和可視化等,
  • 基本特點:
  1. 可拓展:支持一主多從且擴容簡易,只要cluster.name一致且在同一個網路中就能自動加入當前集群;本身就是開源軟體,也支持很多開源的第三方插件
  2. 高可用:在一個集群的多個節點中進行分布式存盤,索引支持shards和復制,即使部分節點down掉,也能自動進行資料恢復和主從切換
  3. 采用RestfulAPI標準:通過http介面使用JSON格式進行操作資料
  4. 資料存盤的最小單位是檔案,本質上是一個JSON 文本

Elasticsearch關鍵詞

  • Node : 節點,單個裝有Elasticsearch服務并且提供故障轉移和實作可擴展的服務器
  • Cluster : 集群,一個Elasticsearch-Cluster集群是有一個Node或者至少2個Node組成的服務器,共同服務和分享Node節點資料的具有負載均衡的功能,甚至基于Zookeeper集群的高可用服務等,
  • Index : 索引,具有相同或者相似特征的Document檔案物件的集合
  • Type : 型別,相同Filed欄位的檔案定義一個Type型別,一個Type可以創建多個Index索引
  • Document :檔案,一個Document檔案可以被用作Index索引的基礎資訊單元
  • Field : 欄位列,Field是Elasticsearch的最小單元,相擋當于資料的某一列
  • Term:由很多的位元組組成,一般將Text型別的Field Value分詞之后的每個最小單元叫做Term,
  • Shards :分片,Elasticsearch把Index索引分成若干份,每一個部分就是一個Shard分片
  • Replicas : 復制,每個Inex索引里每個Shard分片的拷貝或者說是資料備份

Elasticsearch 結構與其它資料庫對比

  • 資料模型上的對比
databaseType databaseName databaseUnit databaseTable databaseRow databaseColumn
sql Mysql 資料庫-database 表-table 資料行-row 資料列-column
Nosql Elasticsearch 索引-index 型別-type 檔案-document 欄位列-field
Nosql Hbase 命名空間-namespace 域/切片-region 資料行-row 資料列-column
  • 使用場景上的對比
databaseType databaseName databaseStorage databaseTransaction databaseConsistency databaseScalability secondaryIndex fullText
sql Mysql 行數資料存盤,適用OLTP業務 Innodb引擎支持 strong consistency-強一致性 單機可拓展粒度不高 支持 支持
Nosql Elasticsearch 索引存盤-任何檢索業務 不支持 支持可配置 水平拓展 支持 支持
Nosql Hbase 列式資料存盤,介于OLTP和OLAP模型之間 不支持 strong consistency-強一致性 和 time consistency-時序一致性 水平拓展 不支持 不支持

ps[??注意事項]:

  1. OLTP: OnLine Transaction Processing聯機事務處理程序(OLTP),主要對應傳統的關系型資料庫,基本操作增刪改查,強調事務一致性,比如銀行系統、電商系統,
  2. OLAP:Online Analytical processing 即聯機分析處理程序(OLAP),主要對應倉儲型資料庫,基本讀取資料,做復雜資料分析,側重技術決策支持,提供直觀簡單的結果,

Elasticsearch原理剖析

0kfaDA.png

  • Gateway[索引資料的存盤格式]: Elasticsearch用來存盤資料index索引的檔案系統,支持多種型別[ Local FileSystem-本地檔案系統 Shared FileSystem-分布式檔案系統 Hadoop HDFS, Amazon S3 ]
  • Distributed Lucene Directory[底層 API框架]:Elasticsearch底層依賴Lucene框架,每一個Elasticsearch節點服務都會有對應的Lucene框架
  • Major Module[加工處理方式] : 在Lucene上層,Index Module(創建Index模塊)、Search Module(搜索模塊)、Mapping(映射)、River(運行在Elasticsearch集群內部的一個插件,主要用來從外部獲取獲取異構資料,然后在Elasticsearch里創建索引
  • Discovery[Elasticsearch發現機制]:Discovery 是Elasticsearch自動發現節點的機制;Zen是用來實作節點自動發現、Master節點選舉用;Elasticsearch是基于P2P的系統,它首先通過廣播的機制尋找存在的節點,然后再通過多播協議來進行節點間的通信,同時也支持點對點的互動
  • Scripting[Elasticsearch腳本執行功能]:Scripting 是腳本執行功能,有這個功能能很方便對查詢出來的資料進行加工處理
  • Plugins[Elasticsearch插件機制]:Elasticsearch整合第三方的插件的主要實作拓展和整合等,譬如elasticsearch-ik分詞插件、elasticsearch-sql sql插件,
  • Transport[Elasticsearch傳輸機制]: 傳輸模塊支持 Thrift, Memcached , HTTP,默認使用 HTTP 傳輸
  • JMX[Elasticsearch基于Java的管理框架]:Java 的管理框架,用來管理 Elasticsearch 應用
  • RSTful Style API [Elasticsearch的API支持模式]:基于Netty實作的網路通信,通過RSTful API 和 Elasticsearch 集群進行互動

資料結構

0kfG9O.png

著作權宣告:本文為博主原創文章,遵循相關著作權協議,如若轉載或者分享請附上原文出處鏈接和鏈接來源,

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/134986.html

標籤:其他

上一篇:Java設計模式之003--工廠模式

下一篇:Java 在線考試系統專案原始碼 springboot mybaits vue.js 前后分離跨域

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more