主頁 >  其他 > 一致性哈希(哈希環)解決資料分布問題

一致性哈希(哈希環)解決資料分布問題

2023-05-13 08:24:58 其他

哈希演算法是程式開發程序中最廣泛接觸到的的演算法之一,典型的應用有安全加密、資料校驗、唯一標識、散列函式、負載均衡、資料分片、分布式存盤,前些天遇到用一致性哈希(哈希環)的場景,不過我細想一下,對這個知識點好像了解過,但是又沒太深印象,說不出具體是什么原理,怎么用,有哪些注意的地方,本文簡單記錄,希望也能給其他人作為初步了解所用,

1.誕生背景解決了怎么樣的問題

一個常見的結論是在需要均勻的解決資料分布場景時通過引入一致性哈希演算法可以很好解決此類問題,一致性哈希誕生,是麻省理工學院在1997年提出的一種分布式哈希(DHT)實作演算法,其設計目標是為了解決因特網中的熱點(Hot Spot)問題,將來自網路上的流量動態的均勻分發到不同的服務器處理,處理大量資料時很可能是遇到類似這樣的難點:

  • 1.處理檔案很大單臺機器記憶體受限無法計算;
  • 2.如果單臺機器處理這樣大量資料處理耗時很大;

為了突破單機記憶體,cup資源限制,借助分片思路,先切分資料,再利用多臺機器提高處理速度,最后在合并起來得到最終結果,這個處理程序也是MapReduce的基本思想,不過再思考一下,僅僅是解決上面問題話,一個普通的哈希演算法就能解決;為什么會要引入一致性哈希演算法呢?

當資料增多,需要擴容機器時,直接加上新機器,那么所有資料會遇到一個問題,就是之前哈希值不對了,通常哈希值計算和機器數量有關,最簡單就是對機器數量取模,當數量變化是需要重新計算哈希值,然后搬移資料到正確的機器上,用在快取場景就相當于所有快取失效,請求資料穿透快取,直接請求資料庫,這樣就很容易發生雪崩效應,所以就需要一種新方法,讓加入機器后,不需要做大量資料遷移,

2.原理介紹

一致性哈希原理介紹
 
一致性哈希是一種用于分布式系統中資料分片和負載均衡的演算法,它的核心思想是將資料根據哈希值映射到一個環形空間中,然后將節點也映射到環上,當需要查找某個資料時,先計算該資料的哈希值,然后沿著環的順時針方向找到第一個大于等于該哈希值的節點,即為該資料所在的節點,這樣可以將資料均勻地分布在各個節點上,并且在節點動態添加或洗掉時,只需要重新映射該節點的哈希值,而不需要重新映射所有資料的哈希值,從而避免了資料遷移的開銷,

一致性哈希演算法的優點是具有高度的可擴展性和容錯性,能夠自動適應節點的動態變化,同時保證資料的一致性和負載均衡,它被廣泛應用于分布式快取、分布式資料庫、負載均衡等領域,

Powered by ChatGPT

再借用大牛們對一致性哈希原理介紹的,通過hash函式映射到一個哈希環上,哈希環可以理解為一個連續變好的回圈鏈表,一般會用32位的哈希值,可以映射2^32個值,

假設key1和key2經過計算都命中哈希環上一個機器節點0,此時新加入一個節點n,節點n接管了部分原來歸屬于節點0的區域(只有key2在其中),此時再次訪問key1和key2,只會有key2因為變更節點,需要重新遷移資料,

3.一致性哈希優點
從上面原理介紹,我們可以很容易看到一致性哈希演算法在可伸縮性的優點,我們簡單模擬下看看是否解決之前的雪崩問題,另外這里我們再討論下它均衡性優點,
我們模擬一下當機器B故障,需要在服務串列里摘除機器B,我們直接將故障機器B從哈希環上移除,原來歸屬于機器B的資料按照一致性哈希規則,應該被快取到哈希環上下一個機器節點例如機器C,其他資料并不會因此產生變化,只有一部分快取失敗需要重新構建,從而不至于所有全部快取失效導致的雪崩效應問題,
不過就像買家秀和買家秀的巨大差距一樣,通常理想很豐滿,現實很骨感,只是按照上述定義,哈希環上機器映射大概率是沒法均分的,快取物件很大可能被集中在某一臺機器上,分布極度不均,產生hash環的偏斜,極端情況下,仍然可能引起系統崩潰,所以一致性哈希演算法中使用‘虛擬節點’解決這個問題,
所謂‘虛擬節點’就是有實際節點虛擬復制而來的節點,填充在哈希環上,讓機器盡量多,均勻的出現在哈希環上,所以通常是一個實際節點對應多個虛擬節點,有虛擬節點加入后再看哈希環,我們就可以達到良好的均衡性,減少哈希環偏斜帶來的影響,快取也就被均勻分布概率越大,

4.總結和思考
一致性哈希主要解決資料分布場景,它存在這樣的優點:

  • 1.可伸縮性
  • 2.負載平衡 (將節點與Hash演算法解耦,而且通過交錯分配虛擬節點的方式解決了負載不均衡導致的快取熱點問題)
    缺點(有個觀點是用錯了場景才是缺陷,用對了,那是特性):
  • 1.key值通過hash演算法算出,映射固定,不靈活,而且節點數量變化時虛擬節點數量也會變化,這種耦合限制哈希演算法進一步優化
  • 2.資料分布均勻,不代表流量和負載的均勻,熱點key導致節點實際表現不均勻

5.參考資料
https://time.geekbang.org/column/article/67388
https://www.wikiwand.com/zh-cn/一致哈希
https://juejin.cn/post/7134656152452726792
https://www.geeksforgeeks.org/consistent-hashing-in-distributed-systems/
https://www.zsythink.net/archives/1182
https://blog.csdn.net/randompeople/article/details/103723839

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/552338.html

標籤:其他

上一篇:從功能到自動化,4個月時間我是如何從點工進入互聯網大廠的

下一篇:返回列表

標籤雲
其他(158951) Python(38129) JavaScript(25420) Java(18034) C(15226) 區塊鏈(8265) C#(7972) AI(7469) 爪哇(7425) MySQL(7179) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5339) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1972) 功能(1967) Web開發(1951) HtmlCss(1936) python-3.x(1918) C++(1915) 弹簧靴(1913) xml(1889) PostgreSQL(1875) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 一致性哈希(哈希環)解決資料分布問題

    哈希演算法是程式開發程序中最廣泛接觸到的的演算法之一,典型的應用有安全加密、資料校驗、唯一標識、散列函式、負載均衡、資料分片、分布式存盤。前些天遇到用一致性哈希(哈希環)的場景,不過我細想一下,對這個知識點好像了解過,但是又沒太深印象,說不出具體是什么原理,怎么用,有哪些注意的地方。本文簡單記錄,希望也 ......

    uj5u.com 2023-05-13 08:24:58 more
  • 從功能到自動化,4個月時間我是如何從點工進入互聯網大廠的

    關了,回望2022年,你的這個2022年識訓咋樣啦,各大招聘網站,測驗工程師月薪一萬以上基本都有一個必備技能,那就是自動化測驗。那么自動化測驗到底難不難呢?下面我將會將我的經歷講給大家聽,希望聽完后,大家會有自己的一個判斷。 ......

    uj5u.com 2023-05-13 08:24:51 more
  • 推薦一款優秀免費的WAF防火墻

    隨著科學技術的飛速發展,互聯網技術也得以發展,它們被廣泛應用于人們的作業及生活中。在給人們帶來便利的同時,也受到了網路安全的威脅,如資料非授權訪問、傳輸丟失及網路病毒入侵等。網路資訊安全是企業中的一項重要生產資料,是提升企業競爭力、業務能力及創新能力的必要條件。相較于傳統的資訊管理模式,在給企業帶來 ......

    uj5u.com 2023-05-13 08:24:45 more
  • 怎樣開發直播軟體?直播原始碼禮物功能篇

    如何去開發直播軟體,直播原始碼技術就是其中重要的一環,而直播原始碼技術的功能又是直播軟體開發的重要環節,今天我為大家分享直播原始碼技術功能的禮物實作。 ......

    uj5u.com 2023-05-13 08:17:52 more
  • 如何在虛擬機Linux系統下(Ubuntu)安裝apache2?如何更改Apache2的

    一、apache2的安裝: 1、在圖形界面下,先ctrl+alt+T打開終端 2、登陸root賬號: 輸入su 輸入之前設定的密碼 待$符號變成#時候,即獲得root權限 3、安裝apache2: 輸入apt-get install apache2 4、啟動apache2: 輸入service ap ......

    uj5u.com 2023-05-13 08:08:09 more
  • 十分鐘讀懂Stable Diffusion運行原理

    AIGC 熱潮正猛烈地席卷開來,可以說 Stable Diffusion 開源發布把 AI 影像生成提高了全新高度,特別是 ControlNet 和 T2I-Adapter 控制模塊的提出進一步提高生成可控性,也在逐漸改變一部分行業的生產模式。驚艷其出色表現,也不禁好奇其背后技術。本文整理了一些學習... ......

    uj5u.com 2023-05-13 07:52:48 more
  • 民謠女神唱流行,基于AI人工智能so-vits庫訓練自己的音色模型(葉蓓

    流行天后孫燕姿的音色固然是極好的,但是目前全網都是她的聲音復刻,聽多了難免會有些審美疲勞,在網路上檢索了一圈,還沒有發現民謠歌手的音色模型,人就是這樣,得不到的永遠在騷動,本次我們自己構建訓練集,來打造自己的音色模型,讓民謠女神來唱流行歌曲,要多帶勁就有多帶勁。 構建訓練集 訓練集是指用于訓練神經網 ......

    uj5u.com 2023-05-13 07:50:13 more
  • 智能化生產應用搭建的實戰案例

    摘要:本文主要為大家介紹使用華為云數字工廠平臺,快速搭建一個智能化生產管理應用的實戰案例。 本文分享自華為云社區《數字工廠深入淺出系列(一):智能化生產應用搭建的實戰案例》,作者: 云起MAE。 華為云數字工廠平臺,專門面向中小型制造企業的生產制造數字化場景設計,端到端整合了構建生產制造數字化應用所 ......

    uj5u.com 2023-05-13 07:49:43 more
  • PTP主時鐘(時間同步裝置)是怎樣實作時鐘同步的?

    PTP主時鐘(時間同步裝置)是怎樣實作時鐘同步的? PTP主時鐘(時間同步裝置)是怎樣實作時鐘同步的? 京準電子科技官微——ahjzsz 1、什么是PTP1588v2? 對于無線通信來說,時鐘同步至關重要,是基站正常作業的必要條件。如果同步有問題,輕則切換成功率降低,重則系統無法運行。 從3G/4G ......

    uj5u.com 2023-05-13 07:48:45 more
  • 使用Pandoc構建Acm模板

    使用Pandoc構建Acm模板 下周日打完河南ICPC省賽就要退役了,以后一場比賽前想要整理一下板子,想要一個擁有目錄,頁眉。頁腳的Acm模板,這樣就可以在比賽的時候快速翻閱,而且要更加好看 但是存在的問題是:很多構建 Acm模板的時候會使用Latex進行構建,但是我使用了很多,要么是些許麻煩,也許 ......

    uj5u.com 2023-05-13 07:48:20 more