前言:本文學習并總結自:https://www.bilibili.com/video/BV17a4y1x7zq?p=8
文章目錄
- 1 ES 核心概念
- 2 什么是 IK 分詞器
- 3 安裝 IK 分詞器
- 4 使用 IK 分詞器
1 ES 核心概念








分片(Shard):ES的“分片(shard)”機制可將一個索引內部的資料分布地存盤于多個節點,它通過將一個ES索引切分為多個底層物理的Lucene索引 + 倒排索引的資料結構,完成索引資料的分割存盤功能,這每一個物理的Lucene索引稱為一個分片(shard),這樣的好處是可以把一個大的索引拆分成多個,分布到不同的節點上,降低單服務器的壓力,構成分布式搜索,提高整體檢索的效率(分片數的最優值與硬體引數和資料量大小有關),分片的數量只能在索引創建前指定,并且索引創建后不能更改,副本是一個分片的精確復制,每個分片可以有零個或多個副本,副本的作用一是提高系統的容錯性,當某個節點某個分片損壞或丟失時可以從副本中恢復,二是提高es的查詢效率,es會自動對搜索請求進行負載均衡,
2 什么是 IK 分詞器

3 安裝 IK 分詞器
GitHub 上的下載地址
新建 ik 目錄

將這個插件的壓縮包解壓到 ES 的 plugins 目錄下的 ik 目錄下

之后,重啟 / 啟動 ES,在列印的日志中,會看到加載 ik 插件的資訊

補充:如何查看已安裝的插件:
利用這個可執行檔案:


重啟 / 啟動 Kibana
4 使用 IK 分詞器
打開開發工具

在這里寫陳述句即可
1、ik_smart:最大粒度切分
輸入:

輸出:

2、ik_max_word:最細粒度切分
輸入:

輸出:

3、輸入字典中不存在的詞,例如自己名字
輸入:

輸出:

可見,字典中不存在的詞,被拆分了
4、自定義的詞,需要自己添加到分詞器的字典中
新建自己的自定義詞庫檔案

把自定義的詞,加入進去

在 ik 配置中指定此組態檔

重啟 ES,再次測驗,即可看到已將自定義的詞單獨拆出

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/301910.html
標籤:其他
上一篇:資料庫的特性有哪些
