主頁 > 軟體設計 > 春招掌握這些Redis分片技巧,我拿到阿里位元組的offer!

春招掌握這些Redis分片技巧,我拿到阿里位元組的offer!

2021-05-03 07:50:56 軟體設計

分片,Redis 資料的分布方式,分片就是將資料拆分到多個 Redis 實體,這樣每個實體將只是所有鍵的一個子集,

1 分片有什么作用?

  1. 分片可以讓Redis管理更大的記憶體,Redis將可以使用所有機器的記憶體,如果沒有磁區,你最多只能使用一臺機器的記憶體,
  2. 分片使Redis的計算能力通過簡單地增加計算機得到成倍提升,Redis的網路帶寬也會隨著計算機和網卡的增加而成倍增長,

2 分片方案

假想我們有 4 個 Redis 實體 R0,R1,R2,R3;
很多表示用戶的鍵,像 user:1,user:2等,
有如下方案可映射鍵到指定 Redis 節點,

2.1 范圍分片(range partitioning)

也叫順序分片,最簡單的分片方式,通過映射物件的范圍到指定的 Redis 實體來完成分片,
例如,可假設用戶從 ID 0 ~ 10000 進入實體 R0,10001 ~ 20000 進入實體 R1,

這套辦法行得通,并且事實上在實踐中被很多人采用,

特點

  • 資料分散度易傾斜
  • 鍵值業務相關
  • 可順序訪問
  • 支持批量操作

缺點

需要一個映射范圍到實體的表格,該表需要管理,不同型別的物件都需要一個表,所以范圍分片在 Redis 中常常并不可取,因這要比其他分片可選方案低效得多,

產品

  • BigTable
  • HBase

2.2 哈希分片(hash partitioning)

該模式適于任何鍵,不必是 object_name:<id> 形式,就像這樣簡單:

  1. 使用一個哈希函式(例如crc32) ,將key轉為一個數字,比如93024922
  2. 對該資料進行取模,將其轉換為一個 0 到 3 之間數字,該數字即可映射到4個 節點之一,93024922 模 4 等于 2,所以鍵 foobar 應當存盤到 R2,

分類

節點取余磁區

  • hash(key) % nodes

    資料遷移:當添加一個節點時
  • 多倍擴容

客戶端分片:哈希+取余
節點伸縮:資料節點關系變化,導致資料遷移
遷移數量和添加節點數量有關:建議翻倍擴容

一致性哈希磁區

  • 一致性哈希-擴容

    客戶端分片:哈希+順時針(優化取余)
    節點伸縮:只影響鄰近節點,但還是有資料遷移
    翻倍伸縮:保證最小遷移資料和負載均衡

虛擬槽哈希磁區(Redis Cluster采用)

  • 虛擬槽分配

    預設虛擬槽:每個槽映射一個資料子集, 一般比節點數大
    良好的哈希函式:例如CRC16
    服務端管理節點、槽、資料:例如Redis Cluster

特點

  • 資料分散度高
  • 鍵值分布業務無關
  • 無法順序訪問
  • 支持批量操作

產品

  • 一致性哈希Memcache
  • Redis Cluster

哈希分片的一種高端形式稱為一致性哈希(consistent hashing),被一些 Redis 客戶端和代理實作

3 分片的各種實作

分片可由軟體堆疊中的不同部分來承擔,

3.1 客戶端分片

客戶端直接選擇正確節點來寫入和讀取指定鍵,許多 Redis 客戶端實作了客戶端分片,

3.2 代理協助分片

客戶端發送請求到一個可以理解 Redis 協議的代理上,而不是直接發送到 Redis 實體,代理會根據配置好的分片模式,來保證轉發我們的請求到正確的 Redis 實體,并回傳回應給客戶端,
Redis 和 Memcached 的代理 Twemproxy 都實作了代理協助的分片.

3.3 查詢路由

可發送你的查詢到一個隨機實體,該實體會保證轉發你的查詢到正確節點,
Redis 集群在客戶端的幫助下,實作了查詢路由的一種混合形式,請求不是直接從 Redis 實體轉發到另一個,而是客戶端收到重定向到正確的節點,

4 分片的缺點

Redis 的一些特性與分片在一起時玩的不是很好:

  • 涉及多個鍵的操作通常不支持,例如,無法直接對映射在兩個不同 Redis 實體上的鍵執行交集
  • 涉及多個鍵的事務不能使用
  • 分片的粒度是鍵,所以不能使用一個很大的鍵來分片資料集,例如一個很大的sorted set
  • 當使用了分片,資料處理變得更復雜,例如,你需要處理多個 RDB/AOF 檔案,備份資料時需要聚合多個實體和主機的持久化檔案
  • 添加和洗掉容量也很復雜,例如,Redis 集群具有運行時動態添加和洗掉節點的能力來支持透明地再均衡資料,但是其他方式,像客戶端分片和代理都不支持這個特性,但有一種稱為預分片(Presharding)的技術在這一點上能幫上忙,

5 資料存盤or快取?

盡管無論是將 Redis 作為資料存盤還是快取,Redis 分片概念上都是一樣的,

  • 但作為資料存盤時有個重要局限:當 Redis 作為資料存盤時,一個給定的鍵總是映射到相同 Redis 實體,
  • 當 Redis 作為快取時,如果一個節點不可用而使用另一個節點,這并不是啥大問題,按照我們的愿望來改變鍵和實體的映射來改進系統的可用性(即系統回應我們查詢的能力),

一致性哈希實作常常能夠在指定鍵的首選節點不可用時切換到其它節點,類似的,如果你添加一個新節點,部分資料就會開始被存盤到這個新節點上,

主要概念:

  • 如果 Redis 用作快取,使用一致性哈希來實作伸縮擴展很容易
  • 如果 Redis 用作存盤,使用固定的鍵到節點的映射,所以節點的數量必須固定不能改變,否則,當增刪節點時,就需要一個支持再平衡節點間鍵的系統,當前只有 Redis 集群可以做到這點,

6 預分片

分片存在一個問題,除非我們使用 Redis 作為快取,否則增加和洗掉節點都是件麻煩事,而使用固定的鍵和實體映射要簡單得多,

然而,資料存盤的需求可能一直在變化,今天可接受 10 個 Redis 節點,但明天可能就需 50 個節點,

因為 Redis 只有相當少的記憶體占用且輕量級(一個空閑的實體只使用 1MB 記憶體),一個簡單的解決辦法是一開始就開啟很多實體,即使你一開始只有一臺服務器,也可以在第一天就決定生活在分布式世界,使用分片來運行多個 Redis 實體在一臺服務器上,
你一開始就可以選擇很多數量的實體,例如,32 或者 64 個實體能滿足大多數用戶,并且為未來的增長提供足夠的空間,
這樣,當資料存盤增長,需要更多 Redis 服務器,你要做的就是簡單地將實體從一臺服務器移動到另外一臺,當你新添加了第一臺服務器,你就需要把一半的 Redis 實體從第一臺服務器搬到第二臺,以此類推,

使用 Redis 復制,就可以在很小或者根本不需要停機的時間內完成移動資料:

  1. 在新服務器上啟動一個空實體
  2. 移動資料,配置新實體為源實體的從服務
  3. 停止客戶端
  4. 更新被移動實體的服務器 IP 地址配置
  5. 向新服務器上的從節點發送 SLAVEOF NO ONE 命令
  6. 以新的更新配置啟動你的客戶端
  7. 最后關閉掉舊服務器上不再使用的實體

7 Redis分片實作

探討完 Redis 分片理論,如何實踐呢?又應該使用什么系統呢?

7.1 Redis 集群

Redis 集群是自動分片和高可用的首選方式,一旦 Redis 集群以及支持 Redis 集群的客戶端可用,Redis 集群將會成為 Redis 分片的事實標準,

Redis 集群是查詢路由和客戶端分片的一種混合模式,

7.2 Twemproxy

Twemproxy 是 Twitter 開發的一個支持 Memcached ASCII 和 Redis 協議的代理,它是單執行緒的,由 C 語言撰寫,運行非常快,基于 Apache 2.0 許可證,

Twemproxy 支持在多個 Redis 實體間自動分片,若節點不可用,還有可選的節點排除支持,
這會改變 <鍵,實體> 映射,所以應該只在將 Redis 作為快取是才使用該特性,

這并非單點故障,因為你可啟動多個代理,并且讓你的客戶端連接到第一個接受連接的代理,

從根本上說,Twemproxy 是介于客戶端和 Redis 實體之間的中間層,這就可以在最下的額外復雜性下可靠地處理我們的分片,這是當前建議的處理 Redis 分片的方式,

7.3 支持一致性哈希的客戶端

Twemproxy 之外的可選方案,是使用實作了客戶端分片的客戶端,通過一致性哈希或者別的類似演算法,有多個支持一致性哈希的 Redis 客戶端,例如 Redis-rb 和 Predis,
查看完整的 Redis 客戶端串列,看看是不是有支持你的編程語言的,并實作了一致性哈希的成熟客戶端即可~

參考

  • https://redis.io/topics/partitioning

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/282337.html

標籤:其他

上一篇:你不知道的無人機知識(建議收藏)

下一篇:C++執行緒 linux

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more