限流的幾種方案-有解無憂

文章目錄

限流基本概念
- QPS和連接數控制
- 傳輸速率
- 黑白名單
- 分布式環境
限流方案常用演算法
- 令牌桶演算法
- 漏桶演算法
- 滑動視窗
常用的限流方案
- Nginx限流
- 中間件限流
- 限流組件
- 合法性驗證限流
- Guava限流
- 網關層限流
從架構維度考慮限流設計
具體的實作限流的手段：
- Tomcat限流

限流基本概念

對一般的限流場景來說它具有兩個維度的資訊：

時間限流基于某段時間范圍或者某個時間點，也就是我們常說的“時間視窗”，比如對每分鐘、每秒鐘的時間視窗做限定
資源基于可用資源的限制，比如設定最大訪問次數，或最高可用連接數

上面兩個維度結合起來看，限流就是在某個時間視窗對資源訪問做限制，比如設定每秒最多100個訪問請求，但在真正的場景里，我們不止設定一種限流規則，而是會設定多個限流規則共同作用，主要的幾種限流規則如下：

QPS和連接數控制

對于連接數和QPS)限流來說，我們可設定IP維度的限流，也可以設定基于單個服務器的限流，

在真實環境中通常會設定多個維度的限流規則，比如設定同一個IP每秒訪問頻率小于10，連接數小于5，再設定每臺機器QPS最高1000，連接數最大保持200，更進一步，我們可以把某個服務器組或整個機房的服務器當做一個整體，設定更high-level的限流規則，這些所有限流規則都會共同作用于流量控制，

最全面的Java面試網站

傳輸速率

對于“傳輸速率”大家都不會陌生，比如資源的下載速度，有的網站在這方面的限流邏輯做的更細致，比如普通注冊用戶下載速度為100k/s，購買會員后是10M/s，這背后就是基于用戶組或者用戶標簽的限流邏輯，

黑白名單

黑白名單是各個大型企業應用里很常見的限流和放行手段，而且黑白名單往往是動態變化的，舉個例子，如果某個IP在一段時間的訪問次數過于頻繁，被系統識別為機器人用戶或流量攻擊，那么這個IP就會被加入到黑名單，從而限制其對系統資源的訪問，這就是我們俗稱的“封IP”，

我們平時見到的爬蟲程式，比如說爬知乎上的美女圖片，或者爬券商系統的股票分時資訊，這類爬蟲程式都必須實作更換IP的功能，以防被加入黑名單，

有時我們還會發現公司的網路無法訪問12306這類大型公共網站，這也是因為某些公司的出網IP是同一個地址，因此在訪問量過高的情況下，這個IP地址就被對方系統識別，進而被添加到了黑名單，使用家庭寬帶的同學們應該知道，大部分網路運營商都會將用戶分配到不同出網IP段，或者時不時動態更換用戶的IP地址，

白名單就更好理解了，相當于御賜金牌在身，可以自由穿梭在各種限流規則里，暢行無阻，比如某些電商公司會將超大賣家的賬號加入白名單，因為這類賣家往往有自己的一套運維系統，需要對接公司的IT系統做大量的商品發布、補貨等等操作，

分布式環境

分布式區別于單機限流的場景，它把整個分布式環境中所有服務器當做一個整體來考量，比如說針對IP的限流，我們限制了1個IP每秒最多10個訪問，不管來自這個IP的請求落在了哪臺機器上，只要是訪問了集群中的服務節點，那么都會受到限流規則的制約，

我們最好將限流資訊保存在一個“中心化”的組件上，這樣它就可以獲取到集群中所有機器的訪問狀態，目前有兩個比較主流的限流方案：

網關層限流將限流規則應用在所有流量的入口處
中間件限流將限流資訊存盤在分布式環境中某個中間件里（比如Redis快取），每個組件都可以從這里獲取到當前時刻的流量統計，從而決定是拒絕服務還是放行流量
sentinel，springcloud生態圈為微服務量身打造的一款用于分布式限流、熔斷降級等組件

限流方案常用演算法

令牌桶演算法

Token Bucket令牌桶演算法是目前應用最為廣泛的限流演算法，顧名思義，它有以下兩個關鍵角色：

令牌獲取到令牌的Request才會被處理，其他Requests要么排隊要么被直接丟棄
桶用來裝令牌的地方，所有Request都從這個桶里面獲取令牌主要涉及到2個程序：
令牌生成

這個流程涉及到令牌生成器和令牌桶，前面我們提到過令牌桶是一個裝令牌的地方，既然是個桶那么必然有一個容量，也就是說令牌桶所能容納的令牌數量是一個固定的數值，

對于令牌生成器來說，它會根據一個預定的速率向桶中添加令牌，比如我們可以配置讓它以每秒100個請求的速率發放令牌，或者每分鐘50個，注意這里的發放速度是勻速，也就是說這50個令牌并非是在每個時間視窗剛開始的時候一次性發放，而是會在這個時間視窗內勻速發放，

在令牌發放器就是一個水龍頭，假如在下面接水的桶子滿了，那么自然這個水（令牌）就流到了外面，在令牌發放程序中也一樣，令牌桶的容量是有限的，如果當前已經放滿了額定容量的令牌，那么新來的令牌就會被丟棄掉，

本文已經收錄到Github倉庫，該倉庫包含計算機基礎、Java基礎、多執行緒、JVM、資料庫、Redis、Spring、Mybatis、SpringMVC、SpringBoot、分布式、微服務、設計模式、架構、校招社招分享等核心知識點，歡迎star~

Github地址

如果訪問不了Github，可以訪問gitee地址，

gitee地址

令牌獲取

每個訪問請求到來后，必須獲取到一個令牌才能執行后面的邏輯，假如令牌的數量少，而訪問請求較多的情況下，一部分請求自然無法獲取到令牌，那么這個時候我們可以設定一個“緩沖佇列”來暫存這些多余的令牌，

緩沖佇列其實是一個可選的選項，并不是所有應用了令牌桶演算法的程式都會實作佇列，當有快取佇列存在的情況下，那些暫時沒有獲取到令牌的請求將被放到這個佇列中排隊，直到新的令牌產生后，再從佇列頭部拿出一個請求來匹配令牌，

當佇列已滿的情況下，這部分訪問請求將被丟棄，在實際應用中我們還可以給這個佇列加一系列的特效，比如設定佇列中請求的存活時間，或者將佇列改造為PriorityQueue，根據某種優先級排序，而不是先進先出，

漏桶演算法

Leaky Bucket，又是個桶，限流演算法是跟桶杠上了，那么漏桶和令牌桶有什么不同呢,

漏桶演算法的前半段和令牌桶類似，但是操作的物件不同，令牌桶是將令牌放入桶里，而漏桶是將訪問請求的資料包放到桶里，同樣的是，如果桶滿了，那么后面新來的資料包將被丟棄，

漏桶演算法的后半程是有鮮明特色的，它永遠只會以一個恒定的速率將資料包從桶內流出，打個比方，如果我設定了漏桶可以存放100個資料包，然后流出速度是1s一個，那么不管資料包以什么速率流入桶里，也不管桶里有多少資料包，漏桶能保證這些資料包永遠以1s一個的恒定速度被處理，

漏桶 vs 令牌桶的區別

根據它們各自的特點不難看出來，這兩種演算法都有一個“恒定”的速率和“不定”的速率，令牌桶是以恒定速率創建令牌，但是訪問請求獲取令牌的速率“不定”，反正有多少令牌發多少，令牌沒了就干等，而漏桶是以“恒定”的速率處理請求，但是這些請求流入桶的速率是“不定”的，

從這兩個特點來說，漏桶的天然特性決定了它不會發生突發流量，就算每秒1000個請求到來，那么它對后臺服務輸出的訪問速率永遠恒定，而令牌桶則不同，其特性可以“預存”一定量的令牌，因此在應對突發流量的時候可以在短時間消耗所有令牌，其突發流量處理效率會比漏桶高，但是導向后臺系統的壓力也會相應增多，

滑動視窗

比如說，我們在每一秒內有5個用戶訪問，第5秒內有10個用戶訪問，那么在0到5秒這個時間視窗內訪問量就是15，如果我們的介面設定了時間視窗內訪問上限是20，那么當時間到第六秒的時候，這個時間視窗內的計數總和就變成了10，因為1秒的格子已經退出了時間視窗，因此在第六秒內可以接收的訪問量就是20-10=10個，

滑動視窗其實也是一種計算器演算法，它有一個顯著特點，當時間視窗的跨度越長時，限流效果就越平滑，打個比方，如果當前時間視窗只有兩秒，而訪問請求全部集中在第一秒的時候，當時間向后滑動一秒后，當前視窗的計數量將發生較大的變化，拉長時間視窗可以降低這種情況的發生概率

常用的限流方案

合法性驗證限流

比如驗證碼、IP 黑名單等，這些手段可以有效的防止惡意攻擊和爬蟲采集；

Guawa限流

在限流領域中，Guava在其多執行緒模塊下提供了以RateLimiter為首的幾個限流支持類，但是作用范圍僅限于“當前”這臺服務器，也就是說Guawa的限流是單機的限流，跨了機器或者jvm行程就無能為力了比如說，目前我有2臺服務器[Server 1，Server 2]，這兩臺服務器都部署了一個登陸服務，假如我希望對這兩臺機器的流量進行控制，比如將兩臺機器的訪問量總和控制在每秒20以內，如果用Guava來做，只能獨立控制每臺機器的訪問量<=10，

盡管Guava不是面對分布式系統的解決方案，但是其作為一個簡單輕量級的客戶端限流組件，非常適合來講解限流演算法

網關層限流

服務網關，作為整個分布式鏈路中的第一道關卡，承接了所有用戶來訪請求，因此在網關層面進行限流是一個很好的切入點上到下的路徑依次是：

用戶流量從網關層轉發到后臺服務
后臺服務承接流量，呼叫快取獲取資料
快取中無資料，則訪問資料庫

流量自上而下是逐層遞減的，在網關層聚集了最多最密集的用戶訪問請求，其次是后臺服務，

然后經過后臺服務的驗證邏輯之后，刷掉了一部分錯誤請求，剩下的請求落在快取上，如果快取中沒有資料才會請求漏斗最下方的資料庫，因此資料庫層面請求數量最小（相比較其他組件來說資料庫往往是并發量能力最差的一環，阿里系的MySQL即便經過了大量改造，單機并發量也無法和Redis、Kafka之類的組件相比）

目前主流的網關層有以軟體為代表的Nginx，還有Spring Cloud中的Gateway和Zuul這類網關層組件

Nginx限流

在系統架構中，Nginx的代理與路由轉發是其作為網關層的一個很重要的功能，由于Nginx天生的輕量級和優秀的設計，讓它成為眾多公司的首選，Nginx從網關這一層面考慮，可以作為最前置的網關，抵擋大部分的網路流量，因此使用Nginx進行限流也是一個很好的選擇，在Nginx中，也提供了常用的基于限流相關的策略配置.

Nginx 提供了兩種限流方法：一種是控制速率，另一種是控制并發連接數，

控制速率

我們需要使用 limit_req_zone 用來限制單位時間內的請求數，即速率限制，

因為Nginx的限流統計是基于毫秒的，我們設定的速度是 2r/s，轉換一下就是500毫秒內單個IP只允許通過1個請求，從501ms開始才允許通過第2個請求，

控制速率優化版

上面的速率控制雖然很精準但是在生產環境未免太苛刻了，實際情況下我們應該控制一個IP單位總時間內的總訪問次數，而不是像上面那樣精確到毫秒，我們可以使用 burst 關鍵字開啟此設定

burst=4意思是每個IP最多允許4個突發請求

控制并發數

利用 limit_conn_zone 和 limit_conn 兩個指令即可控制并發數

其中 limit_conn perip 10 表示限制單個 IP 同時最多能持有 10 個連接；limit_conn perserver 100 表示 server 同時能處理并發連接的總數為 100 個，

注意：只有當 request header 被后端處理后，這個連接才進行計數，

中間件限流

對于分布式環境來說，無非是需要一個類似中心節點的地方存盤限流資料，打個比方，如果我希望控制介面的訪問速率為每秒100個請求，那么我就需要將當前1s內已經接收到的請求的數量保存在某個地方，并且可以讓集群環境中所有節點都能訪問，那我們可以用什么技術來存盤這個臨時資料呢？

那么想必大家都能想到，必然是redis了，利用Redis過期時間特性，我們可以輕松設定限流的時間跨度（比如每秒10個請求，或者每10秒10個請求），同時Redis還有一個特殊技能–腳本編程，我們可以將限流邏輯撰寫成一段腳本植入到Redis中，這樣就將限流的重任從服務層完全剝離出來，同時Redis強大的并發量特性以及高可用集群架構也可以很好的支持龐大集群的限流訪問，【reids + lua】

限流組件

除了上面介紹的幾種方式以外，目前也有一些開源組件提供了類似的功能，比如Sentinel就是一個不錯的選擇，Sentinel是阿里出品的開源組件，并且包含在了Spring Cloud Alibaba組件庫中，Sentinel提供了相當豐富的用于限流的API以及可視化管控臺，可以很方便的幫助我們對限流進行治理

從架構維度考慮限流設計

在真實的專案里，不會只使用一種限流手段，往往是幾種方式互相搭配使用，讓限流策略有一種層次感，達到資源的最大使用率，在這個程序中，限流策略的設計也可以參考前面提到的漏斗模型，上寬下緊，漏斗不同部位的限流方案設計要盡量關注當前組件的高可用，

以我參與的實際專案為例，比如說我們研發了一個商品詳情頁的介面，通過手機淘寶導流，app端的訪問請求首先會經過阿里的mtop網關，在網關層我們的限流會做的比較寬松，等到請求通過網關抵達后臺的商品詳情頁服務之后，再利用一系列的中間件+限流組件，對服務進行更加細致的限流控制

具體的實作限流的手段

1）Tomcat 使用 maxThreads來實作限流，

2）Nginx的limit_req_zone和 burst來實作速率限流，

3）Nginx的limit_conn_zone和 limit_conn兩個指令控制并發連接的總數，

4）時間視窗演算法借助 Redis的有序集合可以實作，

5）漏桶演算法可以使用Redis-Cell來實作，

6）令牌演算法可以解決Google的guava包來實作，

需要注意的是借助Redis實作的限流方案可用于分布式系統，而guava實作的限流只能應用于單機環境，如果你覺得服務器端限流麻煩，可以在不改任何代碼的情況下直接使用容器限流（Nginx或Tomcat），但前提是能滿足專案中的業務需求，

Tomcat限流

Tomcat 8.5 版本的最大執行緒數在 conf/server.xml 配置中，maxThreads 就是 Tomcat 的最大執行緒數，當請求的并發大于此值（maxThreads）時，請求就會排隊執行，這樣就完成了限流的目的，

注意：

maxThreads 的值可以適當的調大一些，Tomcat默認為 150（Tomcat 版本 8.5），但這個值也不是越大越好，要看具體的服務器配置，需要注意的是每開啟一個執行緒需要耗用 1MB 的 JVM 記憶體空間用于作為執行緒堆疊之用，并且執行緒越多 GC 的負擔也越重，

最后需要注意一下，作業系統對于行程中的執行緒數有一定的限制，Windows 每個行程中的執行緒數不允許超過 2000，Linux 每個行程中的執行緒數不允許超過 1000，

最后給大家分享一個Github倉庫，上面有大彬整理的300多本經典的計算機書籍PDF，包括C語言、C++、Java、Python、前端、資料庫、作業系統、計算機網路、資料結構和演算法、機器學習、編程人生等，可以star一下，下次找書直接在上面搜索，倉庫持續更新中~

Github地址

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/548598.html

標籤：其他

上一篇：Python面向物件-高級用法

下一篇：【Visual Leak Detector】配置項 SkipHeapFreeLeaks