主頁 > 後端開發 > 計算高性能[集群高性能]

計算高性能[集群高性能]

2020-09-14 17:26:56 後端開發

  • 單服務器無論如何優化,無論采用多好的硬體,總會有一個性能天花板,當單服務器的性能無法滿足業務需求時,就需要設計高性能集群來提升系統整體的處理性能
  • 高性能集群的本質很簡單,通過增加更多的服務器來提升系統整體的計算能力,計算本身存在一個特點:同樣的輸入資料和邏輯,無論在哪臺服務器上執行,都應該得到相同的輸出 ,因此高性能集群設計的復雜度主要體現在任務分配這部分,需要設計合理的任務分配策略,將 計算任務分配到多臺服務器上執行
  • 高性能集群的復雜性主要體現在需要增加一個任務分配器,以及為任務選擇一個合適的任務分配演算法,對于任務分配器,現在更流行的通用叫法是“負載均衡器”,但這個名稱有一定的誤導性,會讓人潛意識里認為任務分配的目的是要保持各個計算單元的負載達到均衡狀態,而實際上任務分配并不只是考慮計算單元的負載均衡,不同的任務分配演算法目標是不一樣的,有的基于負載考慮、有的基于性能(吞吐量、回應時間〉考慮、有的基于業務考慮,負載均衡不只是為了計算單元的負載達到均衡狀態,

負載均衡分類

常見的負載均衡系統包括 3 種: DNS 負載均衡、硬體負載均衡和軟體負載均衡,

DNS負載均衡

DNS是最簡單也是最常見的負載均衡方式,一般用來實作地理級別的均衡,例如,北方的用戶訪問北京的機房,南方的用戶訪問深圳的機房,DNS 負載均衡的本質是DNS決議同一個域名可以回傳不同的IP地址,例如,同樣是 www.baidu.com,北方用戶決議后獲取的地址是 61.135 .165.224,南方用戶決議后獲取的地址是 14 .2 15.177.38

DNS 負載均衡
在這里插入圖片描述
DNS負載均衡實作簡單、成本低,但也存在粒度太租、負載均衡演算法少等缺點

  • 簡單 、成本低 : 負載均衡作業交給DNS服務器處理,無須自己開發或維護負載均衡設備
  • 就近訪問,提升訪問速度:DNS決議時可以根據請求來源IP,決議成距離用戶最近的服務器地址,可以加快訪問速度,改善性能
  • 更新不及時 : DNS 快取的時間比較長,修改 DNS 配置后,由于快取的原因,還是有很多用戶會繼續訪問修改前的 I P ,這樣的訪問會失敗,達不到負載均衡的目 的, 并且也影響用 戶正常使用業務
  • 擴展性差 : DNS 負載均衡 的控制權在域名商那里 ,無法根據業務特點針對其做更多 的定制化功能和擴展特性
  • 分配策略比較簡單 : DNS 負 載均衡支持的演算法少:不能區分服務器的差異(不能根 據系統與服務的狀態來判斷負載);也無法感知后端服務器的狀態

針對 DNS 負載均衡的 一 些缺點,對于時延和故障敏感的業務,有一些公司自 己實作了 HTTP-DNS 的功能,即使用 HTTP 協議實作一個私有的 DNS 系統,這樣的方案和通用的 DNS優缺點正好相反,

硬體負載均衡

硬體負載均衡是通過單獨的硬體設備來實作負載均衡功能,這類設備和路由器交換機類似,可以理解為一個用于負載均衡的基礎網路設備,目前業界典型的硬體負載均衡設備有兩款 : FS 和 A10 ,這類設備性能強勁,功能強大,但價格都不便宜 , 一般只有“土豪” 公司才會考慮使 用此類設備,普通業務量級的公司一是負擔不起,二是業務量沒那么大,用這些設備也是浪費,

硬體負載均衡的優缺點如下

  • 功能強大 : 全面支持各層級的負載均衡,支持全面的負載均衡演算法,支持全域負載均衡
  • 性能強大 : 對比一下,軟體負載均衡支持到 10萬級井發己經很厲害了,硬體負載均 衡可以支持 100 萬以上的并發
  • 穩定性高 : 商用硬體負載均衡,經過了良好的嚴格測驗,經過大規模使用, 在穩定性方面高
  • 支持安全防護 : 硬體均衡設備除具備負載均衡功能外,還具備防火墻、防 DDOS 攻 擊等安全功能
  • 價格昂貴 : 幾十萬上百萬
  • 擴展能力差:硬體設備,可以根據業務進行配置 , 但無法進行擴展和定制

軟體負載均衡

  • 軟體負載均衡通過負載均衡軟體來實作負載均衡功能,常見的有Nginx和LVS, 其中Nginx 是軟體的 7 層負載均衡,LVS是 Linux內核的4層負載均衡,4層和7層的區別就在于協議和 靈活性, Nginx支持HTTP、E-mail 協議, 而LVS是4層負載均衡,和協議無關 ,幾乎所有應 用都可以做,例如,聊天、資料庫等
  • 軟體和硬體的最主要區別就在于性能,硬體負載均衡性能遠遠高于軟體負載均衡性能, Ngxin的性能是萬級,一般的Linux服務器上裝一個Nginx大概能到5萬/每秒:LVS的性能是十萬級,據說可達到80萬/每秒 ;而自性能是百萬級,從200 萬/每秒到800 萬/每秒都有,當然,軟體負載均衡的最大優勢是便宜
  • 除了使用開源的系統進行負載均衡 ,如果業務 比較特殊, 也可能基于開源系統進行定制(例如, Nginx 插件),甚至進行自研,
    Nginx 的負載均衡架構
    在這里插入圖片描述

軟體負載均衡的優缺點如下:

  • 簡單:無論部署,還是維護都比較簡單
  • 便宜:只要買個 Linux 服務器,裝上軟體即可
  • 靈活: 4層和7層負載均衡可以根據業務進行選擇;也可以根絕業務進行比較方便的擴展,例如,可以通過 Nginx 的插件來實作業務的定制化功能
  • 性能一般 : 一個 Nginx 大約能支撐 5 萬并發
  • 功能沒有硬體負載均衡那么強大
  • 一般不具備防火墻和防 DDOS 攻擊等安全功能

負載均衡架構

DNS 負載均衡、硬體負載均衡、軟體負載均衡, 每種方式都有一些優缺點,但并不意味著在實際應用中只能基于它們的優缺點進行非此即彼的選擇,反而是基于它們的優缺點進行組合使用 , 具體來說,組合的基本原則為 : DNS 負載均衡 用于實作地理級別的負載均衡;硬體負載均衡用于實作集群級別的負載均衡;軟體負載均衡用于實作機器級別的負載均衡

在這里插入圖片描述

負載均衡演算法

負載均衡演算法數量較多,而且可以根據-些業務特性進行定制開發,拋開細節上的差異, 根據演算法期望達到的目的,大體上可以分為如下幾類:

  • 任務平分類 : 負載均衡系統將收到的任務平均分配給服務器進行處理,這里的“平均” 可以是絕對數量的平均,也可以是比例或權重上的平均
  • 負載均衡類 : 負載均衡系統根據服務器的負載來進行分配,這里的負載井不一定是通 常意義上我們說的接數、I/O使用率、網卡吞吐量等來衡量系統的壓力
  • 性能最優類 : 負載均衡系統根據服務器的回應時間來進行任務分配,優先將新任務分配給回應最快的服務器
  • Hash類:負載均衡系統根據任務中的某些關鍵資訊進行Hash運算,將相同Hash值的請求分配到同一臺服務器上 ,常見的有源地址Hash、目標地址hash 、session id hash 、用戶id hash等

輪詢

負載均衡系統收到請求后,按照順序輪流分配到服務器上,輪詢是最簡單的一個策略,無須關注服務器本身的狀態,例如:

  • 某個服務器當前因為觸發了程式bug進入了死回圈導致CPU負載很高,負載均衡系統是不感知的,還是會繼續將請求源源不斷地發送給它
  • 集群中有新的機器是32核的,老的機器是16核的,負載均衡系統也是不關注的,新老機器分配的任務數是一樣的

需要注意的是負載均衡系統無須關注“服務器本身狀態”,這里的關鍵詞是“本身”,也就是說,只要服務器在運行,運行狀態是不關注的,但如果服務器直接巖機了,或者服務器和負 載均衡系統斷連了,則負載均衡系統是能夠感知的,也需要做出相應的處理,例如,將服務器 從可分配服務器串列中洗掉,否則就會出現服務器都巖機了,任務還不斷地分配給它,這明顯 是不合理的,總而言之,“簡單”是輪詢演算法的優點, 也是它的缺點

加權輪詢

負載均衡系統根據服務器權重進行任務分配,這里的權重一般是根據硬體配置進行靜態配置的,采用動態的方式計算會更加契合業務,但復雜度也會更高,加權輪詢是輪詢的一種特殊形式,其主要目的就是為了解決不同服務器處理能力有差異的問題 , 例如,集群中有新的機器是32核的,老的機器是16核的,那么理論上我們可以假設新機器的處理能力是老機器的2倍,負載均衡系統就可以按照 2 : 1 的比例分配更多的任務給新機 器,從而充分利用新機器的性能,

加權輪詢解決了輪詢演算法中無法根據服務器的配置差異進行任務分配的問題,但同樣存在 無法根據服務器的狀態差異進行任務分配的問題 ,

負載最低優先

負載均衡系統將任務分配給當前負載最低的服務器,這里的負載根據不同的任務型別和業 務場景,可以用不同的指標來衡量,例如:

  • LVS 這種 4 層網路負載均衡設備,可以以“連接數”來判斷服務器的狀態,服務器連接 數越大,表明服務器壓力越大
  • Nginx這種 7 層網路負載系統,可以以“ HTTP 請求數”來判斷服務器狀態 CNginx 內 置的負載均衡演算法不支持這種方式,需要進行擴展)
  • 如果我們自己開發負載均衡系統,可以根據業務特點來選擇指標衡量系統壓力 , 如果是 CPU 密集型,可以以“ CPU負載”來衡量系統壓力:如果是 I/O 密集型 ,則可以以“IIO 負載”來衡量系統壓力

負載最低優先的演算法解決了輪詢演算法中無法感知服務器狀態的問題,由此帶來的代價是復 雜度要增加很多 , 例如:

  • 最少連接數優先的演算法要求負載均衡系統統計每個服務器當前建立的連接,其應用場景僅限于負載均衡接收的任何連接請求都會轉發給服務器進行處理,否則如果負載均衡系 統和服務器之間是固定的連接池方式,就不適合采取這種演算法,例如,LVS 可以采取這 種演算法進行負載均衡,而一個通過連接池的方式連接MySQL集群的負載均衡系統就不適合采取這種演算法進行負載均衡,
  • CPU 負載最低優先的演算法要求負載均衡系統以某種方式收集每個服務器的CPU負載, 而且要確定是以1分鐘的負載為標準,還是以15分鐘的負載為標準,不存在1分鐘肯定比15分鐘要好或差,不同業務最優的時間間隔是不一樣的,時間間隔太短容易造成頻繁波動,時間間隔太長又可能造成峰值來臨時回應緩慢

負載最低優先演算法基本上能夠比較完美地解決輪詢演算法的缺點,因為采用這種演算法后,負載均衡系統需要感知服務器當前的運行狀態 ,當然,其代價是復雜度大幅上升,通俗來講,輪詢可能是5行代碼就能實作的演算法,而負載最低優先演算法可能要 1000 行才能實作,甚至需要負載均衡系統和服務器都要開發代碼 ,負載最低優先演算法如果本身沒有設計好,或者不適合業務的運行特點,演算法本身就可能成為性能的瓶頸,或者引發很多莫名其妙的問題 , 所以負載最低優先演算法雖然效果看起來很美好, 但實際上真正應用的場景反而沒有輪詢(包括加權輪詢)那么多

性能最優類

負載最低優先類演算法是站在服務器的角度來進行分配的,而性能最優優先類演算法則是站在客戶端的角度來進行分配的,優先將任務分配給處理速度最快的服務器,通過這種方式達到最 快回應客戶端的目的 ,
和負載最低優先類演算法類似,性能最優優先類演算法本質上也是感知了服務器的狀態,只是 通過回應時間這個外部標準來衡量服務器狀態而己,因此性能最優優先類演算法存在 的問題和負 載最低優先類演算法類似,復雜度都很高,主要體現在:

  • 負載均衡系統需要收集和分析每個服務器每個任務的回應時間,在大量任務處理的場景下,這種收集和統計本身也會消耗較多的性能
  • 為了減少這種統計上的消耗,可以采取采樣的方式來統計,即不統計所有任務的回應時間, 而是抽樣統計部分任務的回應時間來估算整體任務的回應時間,采樣統計雖然能夠減少性 能消耗,但使得復雜度進一步上升, 因為要確定合適的采樣率,來樣率太低會導致結果不準確,采樣率太高會導致性能消耗較大,找到合適的來樣率也是一件復雜的事情
  • 無論全部統計,還是采樣統計,都需要選擇合適的周期: 是10秒內性能最優,還是1分鐘內性能最優 ,還是5分鐘內性能最優……沒有放之四海而皆準的周期,需要根據實際業務進行判斷和選擇, 這也是一件比較復雜的事情,甚至出現系統上線后需要不斷地調優才能達到最優設計

Hash 類

負載均衡系統根據任務中的某些關鍵資訊進行 Hash 運算,將相同 Hash 值的請求分配到同一臺服務器上,這樣做的目的主要是為了滿足特定的業務需求, 例如:

  • 源地址 Hash
    將來源于同一個源IP地址的任務分配給同一個服務器進行處理,適合于存在事務、會話的業務, 例如,當我們通過瀏覽器登錄網上銀行時,會生成一個會話資訊,這個會話是臨時的, 關閉瀏覽器后就失效,網上銀行后臺無須持久化會話資訊,只需要在某臺服 務器上臨時保存這個會話就可以了,但需要保證用戶在會話存在期間,每次都能訪問到同一個服務器,這種業務場景就可以用源地址 Hash 來實作
  • ID Hash
    將某個ID標識的業務分配到同一個服務器中進行處理,這里的ID一般是臨時性資料的ID(例如 ,session id)例如,上述的網上銀行登錄的例子,用session id hash同樣可以實作同一個會話期間,用戶每次都是訪問到同一臺服務器的目的

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/37229.html

標籤:java

上一篇:通過RabitMQ實作分布式事務

下一篇:高煥堂《嵌入式UML設計》讀書筆記_第一章

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more