限流常見方案
我歌月徘徊,我舞影零亂,
醒時相交歡,醉后各分散,
一、限流思路
常見的系統服務限流模式有:熔斷、服務降級、延遲處理和特殊處理四種,
1、熔斷
將熔斷措施嵌入到系統設計中,當系統出現問題時,若短時間內無法修復,系統會自動開啟熔斷開關,拒絕流量訪問,避免大流量對后端的過載請求,
除此之外,系統還能夠動態監測后端程式的修復情況,當程式已恢復穩定時,就關閉熔斷開關,恢復正常服務,
常見的熔斷組件有 Hystrix 以及阿里的 Sentinel,
在Spring Cloud框架里,熔斷機制通過Hystrix實作,Hystrix會監控微服務間呼叫的狀況,當失敗的呼叫到一定閾值,預設是5秒內20次呼叫失敗,就會啟動熔斷機制, 熔斷機制的注解是@HystrixCommand,Hystrix會找有這個注解的方法,并將這類方法關聯到和熔斷器連在一起的代理上,2、服務降級
將系統的所有功能服務進行一個分級,當系統出現問題需要緊急限流時,可將不是那么重要的功能進行降級處理,停止服務,保障核心功能正常運作,
例如在電商平臺中,如果突發流量激增,可臨時將商品評論、積分等非核心功能進行降級,停止這些服務,釋放出機器和 CPU 等資源來保障用戶正常下單,
這些降級的功能服務可以等整個系統恢復正常后,再來啟動,進行補單/補償處理,
除了功能降級以外,還可以采用不直接操作資料庫,而全部讀快取、寫快取的方式作為臨時降級方案,
熔斷&降級
-
相同點:
目標一致 都是從可用性和可靠性出發,為了防止系統崩潰;
用戶體驗類似,最終都讓用戶體驗到的是某些功能暫時不可用,
-
不同點:
觸發原因不同,服務熔斷一般是某個服務(下游服務,即被呼叫的服務)故障引起;
-
而服務降級一般是從整體負荷考慮,
3、延遲處理
延遲處理需要在系統的前端設定一個流量緩沖池,將所有的請求全部緩沖進這個池子,不立即處理,后端真正的業務處理程式從這個池子中取出請求依次處理,常見的可以用佇列模式來實作,
這就相當于用異步的方式去減少了后端的處理壓力,但是當流量較大時,后端的處理能力有限,緩沖池里的請求可能處理不及時,會有一定程度延遲,
4、特權處理
這個模式需要將用戶進行分類,通過預設的分類,讓系統優先處理需要高保障的用戶群體,其它用戶群的請求就會延遲處理或者直接不處理,
二、限流演算法
常見的限流演算法有三類:計數器演算法、漏桶演算法和令牌桶演算法,
1、計數器演算法

計數器演算法是限流演算法中最簡單最容易的一種,如上圖每分鐘只允許100個請求,第一個請求進去的時間為startTime,在startTime + 60s內只允許100個請求 ,
當60s內超過十個請求后,則拒絕請求;不超過的允許請求,到第60s 則重新設定時間,
1 package com.todaytalents.rcn.parser.util;
2
3 import java.util.concurrent.atomic.AtomicInteger;
4
5 /**
6 * 計數器實作限流:
7 * 每分鐘只允許100個請求,第一個請求進去的時間為startTime,在startTime + 60s內只允許100個請求
8 * 60s內超過100個請求后,則拒絕請求,
9 * 不超過,允許請求,到第60s 重新設定時間,
10 *
11 * @author: Arafat
12 * @date: 2021/12/29
13 * @company: 澳B99999
14 **/
15 public class CalculatorCurrentLimiting {
16
17 /**
18 * 限流個數
19 */
20 private int maxCount = 100;
21 /**
22 * 指定的時間內:秒
23 */
24 private long specifiedTime = 60;
25 /**
26 * 原子類計數器
27 */
28 private AtomicInteger atomicInteger = new AtomicInteger(0);
29 /**
30 * 起始時間
31 */
32 private long startTime = System.currentTimeMillis();
33
34 /**
35 * @param maxCount 限流個數
36 * @param specifiedTime 指定的時間內
37 * @return 回傳true 不限流,回傳false 則限流
38 */
39 public boolean limit(int maxCount, int specifiedTime) {
40 atomicInteger.addAndGet(1);
41 if (1 == atomicInteger.get()) {
42 startTime = System.currentTimeMillis();
43 atomicInteger.addAndGet(1);
44 return true;
45 }
46 // 超過時間間隔,重新開始計數
47 if (System.currentTimeMillis() - startTime > specifiedTime * 1000) {
48 startTime = System.currentTimeMillis();
49 atomicInteger.set(1);
50 return true;
51 }
52 // 還在時間間隔內,檢查是否超過限流數量
53 if (maxCount < atomicInteger.get()) {
54 return false;
55 }
56 return true;
57 }
58
59 }
View Code
利用計數器演算法比如要求某一個介面,1分鐘內的請求不能超過100次,
可以在開始時設定一個計數器,每次請求,該計數器+1;如果該計數器的值大于10并且與第一次請求的時間間隔在1分鐘內,那么說明請求過多則限制請求直接回傳或不處理,反之,
如果該請求與第一次請求的時間間隔大于1分鐘,并且該計數器的值還在限流范圍內,那么重置該計數器,
計算器演算法雖然簡單,但它有一個狠致命的臨界問題,

上圖可以看出假若有一個惡意用戶,他在0:59時,瞬間發送了100個請求,并且在1:00時,又瞬間發送了100個請求,那么其實這個用戶在 1秒里面,瞬間發送了200個請求,
而上述計數器演算法規定的是1分鐘最多100個請求,也就是每秒鐘最多1.7個請求,而用戶通過在時間視窗的重置節點處突發請求,可以瞬間超過限流的速率限制,這個漏洞可能會瞬間壓垮服務應用,
上述漏洞問題其實是因為計數器限流演算法統計的精度太低,可以借助滑動視窗演算法將臨界問題的影響降低,
2、滑動視窗

上圖中,整個紅色的矩形框表示一個時間視窗,在計數器演算法限流的例子中,一個時間視窗就是一分鐘,在這里將時間視窗進行劃分,比如圖中,將滑動視窗劃成了6格,每格代表的是10秒鐘,每過10秒鐘,時間視窗就會往右滑動一格,每一個格子都有自己獨立的計數器counter,比如當一個請求在0:35秒的時候到達,那么0:30~0:39對應的counter就會加1,
那么滑動視窗怎么解決剛才的臨界問題的呢?
上圖,0:59到達的100個請求會落在灰色的格子中,而1:00到達的請求會落在橘黃色的格子中,當時間到達1:00時,視窗會往右移動一格,那么此時時間視窗內的總請求數量一共是200個,超過了限定的100個,所以此時能夠檢測出來觸發了限流,
經比較發現發現,計數器演算法其實就是滑動視窗演算法,只是它沒有對時間視窗做進一步地劃分,所以只有1格,所以,當滑動視窗的格子劃分的越多,則滑動視窗的滾動就越平滑,限流的統計就會越精確,
3、漏桶演算法

漏桶演算法思路很簡單,水(請求)先進入到漏桶里,漏桶以一定的速度出水,當水流入速度過大會超過桶可接納的容量時直接溢位,可以看出漏桶演算法能強行限制資料的傳輸速率,
使用漏桶演算法,可以保證介面會以一個常速速率來處理請求,所以漏桶演算法必定不會出現臨界問題,
漏桶演算法實作類:
1 import java.util.concurrent.atomic.AtomicInteger;
2
3 /**
4 * 漏桶演算法:把水滴看成請求
5 *
6 * @author: Arafat
7 * @date: 2021/12/29
8 **/
9 public class LeakyBucket {
10 /**
11 * 桶的容量
12 */
13 private int capacity = 100;
14 /**
15 * 桶剩余的水滴的量(初始化的時候桶為空)
16 */
17 private AtomicInteger water = new AtomicInteger(0);
18 /**
19 * 水滴的流出的速率 每1000毫秒流出1滴
20 */
21 private int leakRate;
22 /**
23 * 第一次請求之后,木桶在這個時間點開始漏水
24 */
25 private long leakTimeStamp;
26
27 public LeakyBucket(int leakRate) {
28 this.leakRate = leakRate;
29 }
30
31 public boolean acquire() {
32 // 如果是空桶,就用當前時間作為桶開始漏出的時間
33 if (water.get() == 0) {
34 leakTimeStamp = System.currentTimeMillis();
35 water.addAndGet(1);
36 return capacity == 0 ? false : true;
37 }
38 // 先執行漏水,計算剩余水量
39 int waterLeft = water.get() - ((int) ((System.currentTimeMillis() - leakTimeStamp) / 1000)) * leakRate;
40 water.set(Math.max(0, waterLeft));
41 // 重新更新leakTimeStamp
42 leakTimeStamp = System.currentTimeMillis();
43 // 嘗試加水,并且水還未滿
44 if ((water.get()) < capacity) {
45 water.addAndGet(1);
46 return true;
47 } else {
48 // 水滿,拒絕加水,直接溢位
49 return false;
50 }
51 }
52
53 }
View Code
使用漏桶限流:
1 /**
2 * @author Arafat
3 */
4 @Slf4j
5 @RestController
6 @AllArgsConstructor
7 @RequestMapping("/test")
8 public class TestController {
9
10 /**
11 * 漏桶:水滴的漏出速率是每秒 1 滴
12 */
13 private LeakyBucket leakyBucket = new LeakyBucket(1);
14
15 private UserService userService;
16
17 /**
18 * 漏桶限流
19 *
20 * @return
21 */
22 @RequestMapping("/searchUserInfoByLeakyBucket")
23 public Object searchUserInfoByLeakyBucket() {
24 // 限流判斷
25 boolean acquire = leakyBucket.acquire();
26 if (!acquire) {
27 log.info("請您稍后再試!");
28 return Reply.success("請您稍后再試!");
29 }
30 // 若沒有達到限流的要求,直接呼叫介面查詢
31 return Reply.success(userService.search());
32 }
33
34 }
View Code
漏桶演算法的兩個優點:
- 削峰:有大量流量進入時,會發生溢位,從而限流保護服務可用,
- 緩沖:不至于直接請求到服務器,緩沖壓力,消費速度固定,因為計算性能固定,
4、令牌桶演算法
令牌桶演算法思想:以固定速率產生令牌,放入令牌桶,每次用戶請求都得申請令牌,令牌不足則拒絕請求或等待,

上圖,令牌桶演算法會以一個恒定的速度往桶里放入令牌,而如果請求需要被處理,則需要先從桶里獲取一個令牌,當桶里沒有令牌可取時,則拒絕服務,
1 import java.util.concurrent.Executors;
2 import java.util.concurrent.ScheduledExecutorService;
3 import java.util.concurrent.TimeUnit;
4
5 /**
6 * 令牌桶演算法限流
7 *
8 * @author: Arafat
9 * @date: 2021/12/30
10 **/
11 public class TokensLimiter {
12
13 /**
14 * 最后一次令牌發放時間
15 */
16 public long timeStamp = System.currentTimeMillis();
17 /**
18 * 桶的容量
19 */
20 public int capacity = 10;
21 /**
22 * 令牌生成速度10/s
23 */
24 public int rate = 10;
25 /**
26 * 當前令牌數量
27 */
28 public int tokens ;
29 /**
30 * 周期性執行緒池
31 */
32 private ScheduledExecutorService scheduledExecutorService = Executors.newScheduledThreadPool(5);
33
34 /**
35 * 執行緒池每0.5s發送亂數量的請求,
36 * 每次請求計算當前的令牌數量,
37 * 請求令牌數量超出當前令牌數量,則限流,
38 */
39 public void acquire() {
40 scheduledExecutorService.scheduleWithFixedDelay(() -> {
41 long now = System.currentTimeMillis();
42 // 當前令牌數
43 tokens = Math.min(capacity, (int) (tokens + (now - timeStamp) * rate) / 1000);
44 //每隔0.5秒發送亂數量的請求
45 int permits = (int) (Math.random() * 9) + 1;
46 System.out.println("請求令牌數:" + permits + ",當前令牌數:" + tokens);
47 timeStamp = now;
48 if (tokens < permits) {
49 // 若不到令牌,則拒絕
50 System.out.println("限流了");
51 } else {
52 // 還有令牌,領取令牌
53 tokens -= permits;
54 System.out.println("剩余令牌=" + tokens);;
55 }
56 }, 1000, 500, TimeUnit.MILLISECONDS);
57 }
58
59 public static void main(String[] args) {
60 TokensLimiter tokensLimiter = new TokensLimiter();
61 tokensLimiter.acquire();
62 }
63
64 }
View Code
令牌桶演算法默認從桶里移除令牌是不需要耗費時間的,如果給移除令牌設定一個延時時間,那么實際上又采用了漏桶演算法的思路,
至于臨界問題的場景,在0:59秒的時候,由于桶內積滿了100個token,所以這100個請求可以瞬間通過,但是由于token是以較低的速率填充的,所以在1:00的時候,桶內的token數量不可能達到100個,那么此時不可能再有100個請求通過,所以令牌桶演算法可以很好地解決臨界問題,
漏桶與令牌桶演算法的區別
- 主要區別在于“漏桶演算法”能夠強行限制資料的傳輸速率,而“令牌桶演算法”在能夠限制資料的平均傳輸速率外,還允許某種程度的突發傳輸,
- 在“令牌桶演算法”中,只要令牌桶中存在令牌,那么就允許突發地傳輸資料直到達到用戶配置的門限,因此它適合于具有突發特性的流量,
- 令牌桶演算法由于實作簡單,且允許某些流量的突發,對用戶友好,所以被業界采用地較多,
- 具體情況具體分析,只有最合適的演算法,沒有最優的演算法,
基于谷歌RateLimiter實作限流
Google開源工具包Guava提供了限流工具類RateLimiter,該類基于令牌桶演算法(Token Bucket)來完成限流,非常易于使用,RateLimiter經常用于限制對一些物理資源或者邏輯資源的訪問速率,它支持兩種獲取permits介面,一種是如果拿不到立刻回傳false(tryAcquire()),另一種會阻塞等待一段時間看能不能拿到(tryAcquire(long timeout, TimeUnit unit)),
1 import com.google.common.util.concurrent.RateLimiter;
2 import lombok.AllArgsConstructor;
3 import lombok.extern.slf4j.Slf4j;
4 import org.springframework.web.bind.annotation.RequestMapping;
5 import org.springframework.web.bind.annotation.RestController;
6
7 import java.util.concurrent.TimeUnit;
8
9 /**
10 * @author Arafat
11 */
12 @Slf4j
13 @RestController
14 @AllArgsConstructor
15 @RequestMapping("/test")
16 public class TestController {
17
18 /**
19 * 每秒鐘放入n個令牌,相當于每秒只允許執行n個請求
20 * n = 1
21 * n == 5
22 */
23 //private static final RateLimiter RATE_LIMITER = RateLimiter.create(1);
24 private static final RateLimiter RATE_LIMITER = RateLimiter.create(5);
25
26 public static void main(String[] args) {
27 // 每秒中限制1個請求 0:表示等待超時時間,設定0表示不等待,直接拒絕請求
28 boolean tryAcquire = RATE_LIMITER.tryAcquire(0, TimeUnit.SECONDS);
29 // false表示沒有獲取到token
30 if (!tryAcquire) {
31 System.out.println("現在搶購的人數過多,請稍等一下下哦!");
32 }
33
34 // tryAcquire 模擬有20個請求
35 for (int i = 0; i < 20; i++) {
36 /**
37 * 嘗試從令牌桶中獲取令牌,
38 * 若獲取不到則等待300毫秒看能不能獲取到
39 */
40 boolean request = RATE_LIMITER.tryAcquire(300, TimeUnit.MILLISECONDS);
41 if (request) {
42 // 獲取成功,執行相應邏輯
43 handle(i);
44 }
45 }
46
47 // acquire 模擬有20個請求
48 for (int i = 0; i < 20; i++) {
49 // 從令牌桶中獲取一個令牌,若沒有獲取到會阻塞直到獲取到為止,所以所有的請求都會被執行
50 RATE_LIMITER.acquire();
51 // 獲取成功,執行相應邏輯
52 handle(i);
53 }
54 }
55
56 private static void handle(int i) {
57 System.out.println("第 " + i + " 次請求OK~~~");
58 }
59
60 }
View Code
三、集群限流
前面幾種演算法都屬于單機限流的范疇,但簡單的單機限流仍無法滿足復雜的場景,比如為了限制某個資源被每個用戶或者商戶的訪問次數,5s只能訪問2次,或者一天只能呼叫1000次,這種場景單機限流是無法實作的,這時就需要通過集群限流進行實作,
可以使用Redis實作集群限流,大概思路是每次有相關操作的時候,就向redis服務器發送一個incr命令,
redisOperations.opsForValue().increment()
比如需要限制某個用戶訪問某個詳情/details介面的次數,只需要拼接用戶id和介面名,加上當前服務名的前綴作為redis的key,每次該用戶訪問此介面時,只需要對這個key執行incr命令,再這個key帶上過期時間,就可以實作指定時間的訪問頻率,
我歌月徘徊,我舞影零亂,
醒時相交歡,醉后各分散,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/400297.html
標籤:Java

