系列目錄

記憶體吞金獸(Elasticsearch)的那些事兒 -- 認識一下

記憶體吞金獸(Elasticsearch)的那些事兒 -- 資料結構及巧妙演算法

記憶體吞金獸(Elasticsearch)的那些事兒 -- 架構&三高保證

記憶體吞金獸(Elasticsearch)的那些事兒 -- 寫入&檢索原理

記憶體吞金獸(Elasticsearch)的那些事兒 -- 常見問題痛點及解決方案

架構圖

代表ElasticSearch索引的持久化存盤方式，

在Gateway中，ElasticSearch默認先把索引存盤在記憶體中，然后當記憶體滿的時候，再持久化到Gateway里，當ES集群關倍訓重啟的時候，它就會從Gateway里去讀取索引資料，比如LocalFileSystem和HDFS、AS3等，

是Lucene里的一些列索引檔案組成的目錄，它負責管理這些索引檔案，包括資料的讀取、寫入，以及索引的添加和合并等，

代表是資料源，是以插件的形式存在于ElasticSearch中，　

映射的意思，非常類似于靜態語言中的資料型別，比如我們宣告一個int型別的變數，那以后這個變數只能存盤int型別的資料，

eg：比如我們宣告一個double型別的mapping欄位，則只能存盤double型別的資料，

Mapping不僅是告訴ElasticSearch，哪個欄位是哪種型別，還能告訴ElasticSearch如何來索引資料，以及資料是否被索引到等，

搜索模塊

索引模塊

主要是負責集群的master節點發現，比如某個節點突然離開或進來的情況，進行一個分片重新分片等，

　（Zen）發現機制默認的實作方式是單播和多播的形式，同時也支持點對點的實作，以插件的形式存在EC2，

一個基于p2p的系統，它先通過廣播尋找存在的節點，再通過多播協議來進行節點之間的通信，同時也支持點對點的互動，

腳本語言，包括很多，如mvel、js、python等，　　　

定制化功能非常便捷，但有性能問題

代表ElasticSearch內部節點，代表跟集群的客戶端互動，包括 Thrift、Memcached、Http等協議

通過RESTful方式來實作API編程，

第三方插件，（想象一下idea或vscode的插件

開發框架，其內部使用netty實作

監控

一個es集群會有多個es節點
在眾多的節點中，其中會有一個Master Node，主要負責維護索引元資料、負責切換主分片和副本分片身份等作業，如果主節點掛了，會選舉出一個新的主節點
1. 如果某個節點掛了，Master Node就會把對應的副本分片提拔為主分片，這樣即便節點掛了，資料就不會丟，
es最外層的是Index（相當于資料庫表的概念）；一個Index的資料我們可以分發到不同的Node上進行存盤，這個操作就叫做分片，
1. 比如現在我集群里邊有4個節點，我現在有一個Index，想將這個Index在4個節點上存盤，那我們可以設定為4個分片，這4個分片的資料合起來就是Index的資料
2. 分片會有主分片和副本分片之分（防止某個節點宕機，保證高可用）
3. Index需要分為多少個分片和副本分片都是可以通過配置設定的