主頁 > 後端開發 > Redis精通系列——LFU演算法詳述(Least Frequently Used - 最不經常使用)

Redis精通系列——LFU演算法詳述(Least Frequently Used - 最不經常使用)

2021-09-25 16:43:39 後端開發

本文已收錄于專欄

??《Redis精通系列》??

上千人點贊收藏,全套Redis學習資料,大廠必備技能!


目錄

1、簡介

2、實作方式

2.1 LRU實作方式

2.2 LFU實作方式

3、LFU使用

3.1 組態檔開啟LFU淘汰演算法


1、簡介

LRU有一個明顯的缺點,它無法正確的表示一個Key的熱度,如果一個key從未被訪問過,僅僅發生記憶體淘汰的前一會兒被用戶訪問了一下,在LRU演算法中這會被認為是一個熱key,
例如如下圖,keyA與keyB同時被set到Redis中,在記憶體淘汰發生之前,keyA被頻繁的訪問,而keyB只被訪問了一次,但是這次訪問的時間比keyA的任意一次訪問時間都更接近記憶體淘汰觸發的時間,如果keyA與keyB均被Redis選中進行淘汰,keyA將被優先淘汰,我想大家都不太希望keyA被淘汰吧,那么有沒有更好的的記憶體淘汰機制呢?當然有,那就是LFU,

LRU存在的問題.png

LFU(Least Frequently Used)是Redis 4.0 引入的淘汰演算法,它通過key的訪問頻率比較來淘汰key,重點突出的是Frequently Used,
?

LRU與LFU的區別:

  • LRU -> Recently Used,根據最近一次訪問的時間比較
  • LFU -> Frequently Used,根據key的訪問頻率比較

Redis4.0之后為maxmemory_policy淘汰策略添加了兩個LFU模式(LRU請看我上一篇文章)

  • volatile-lfu:對有過期時間的key采用LFU淘汰演算法
  • allkeys-lfu:對全部key采用LFU淘汰演算法

2、實作方式

Redis分配一個字串的最小空間占用是19位元組,16位元組(物件頭)+3位元組(SDS基本欄位),Redis的記憶體淘汰演算法LRU/LFU均依靠其中的物件頭中的lru來實作,
Redis物件頭的記憶體結構:

typedef struct redisObject {
    unsigned type:4;        // 4 bits 物件的型別(zset、set、hash等)
    unsigned encoding:4;    // 4 bits 物件的存盤方式(ziplist、intset等)
    unsigned lru:24;        // 24bits 記錄物件的訪問資訊
    int refcount;            // 4 bytes 參考計數
    void *ptr;                // 8 bytes (64位作業系統),指向物件具體的存盤地址/物件body
}

Redis物件頭中的lru欄位,在LRU模式下和LFU模式下使用方式并不相同,
?

2.1 LRU實作方式

在LRU模式,lru欄位存盤的是key被訪問時Redis的時鐘server.lrulock(Redis為了保證核心單執行緒服務性能,快取了Unix作業系統時鐘,默認每毫秒更新一次,快取的值是Unix時間戳取模2^24),當key被訪問的時候,Redis會更新這個key的物件頭中lru欄位的值,
因此在LRU模式下,Redis可以根據物件頭中的lru欄位記錄的值,來比較最后一次key的訪問時間,
?

用Java代碼演示一個簡單的Redis-LRU演算法:

  • Redis物件頭
package com.lizba.redis.lru;

/**
 * <p>
 *      Redis物件頭
 * </p>
 *
 * @Author: Liziba
 * @Date: 2021/9/22 22:40
 */
public class RedisHead {

    /** 時間 */
    private Long lru;
    /** 具體資料 */
    private Object body;

    public RedisHead setLru(Long lru) {
        this.lru = lru;
        return this;
    }

    public RedisHead setBody(Object body) {
        this.body = body;
        return this;
    }


    public Long getLru() {
        return lru;
    }

    public Object getBody() {
        return body;
    }

}
  • Redis LRU實作代碼
package com.lizba.redis.lru;

import java.util.Comparator;
import java.util.List;
import java.util.concurrent.ConcurrentHashMap;
import java.util.stream.Collectors;

/**
 * <p>
 * Redis中LRU演算法的實作demo
 * </p>
 *
 * @Author: Liziba
 * @Date: 2021/9/22 22:36
 */
public class RedisLruDemo {

    /**
     * 快取容器
     */
    private ConcurrentHashMap<String, RedisHead> cache;
    /**
     * 初始化大小
     */
    private int initialCapacity;

    public RedisLruDemo(int initialCapacity) {
        this.initialCapacity = initialCapacity;
        this.cache = new ConcurrentHashMap<>(initialCapacity);
        ;
    }

    /**
     * 設定key/value 設定的時候更新LRU
     *
     * @param key
     * @param body
     */
    public void set(String key, Object body) {
        // 觸發LRU淘汰
        synchronized (RedisLruDemo.class) {
            if (!cache.containsKey(key) && cache.size() >= initialCapacity) {
                this.flushLruKey();
            }
        }
        RedisHead obj = this.getRedisHead().setBody(body).setLru(System.currentTimeMillis());
        cache.put(key, obj);
    }


    /**
     * 獲取key,存在則更新LRU
     *
     * @param key
     * @return
     */
    public Object get(String key) {

        RedisHead result = null;
        if (cache.containsKey(key)) {
            result = cache.get(key);
            result.setLru(System.currentTimeMillis());
        }

        return result;
    }


    /**
     * 清除LRU key
     */
    private void flushLruKey() {

        List<String> sortData = cache.keySet()
                .stream()
                .sorted(Comparator.comparing(key -> cache.get(key).getLru()))
                .collect(Collectors.toList());
        String removeKey = sortData.get(0);
        System.out.println( "淘汰 -> " + "lru : " + cache.get(removeKey).getLru() + " body : " + cache.get(removeKey).getBody());
        cache.remove(removeKey);
        if (cache.size() >= initialCapacity) {
            this.flushLruKey();
        }
        return;
    }


    /**
     *  獲取所有資料測驗用
     *
     * @return
     */
    public List<RedisHead> getAll() {
         return cache.keySet().stream().map(key -> cache.get(key)).collect(Collectors.toList());
    }


    private RedisHead getRedisHead() {
        return new RedisHead();
    }

}
  • 測驗代碼
package com.lizba.redis.lru;

import java.util.Random;
import java.util.concurrent.TimeUnit;

/**
 * <p>
 *      測驗LRU
 * </p>
 *
 * @Author: Liziba
 * @Date: 2021/9/22 22:51
 */
public class TestRedisLruDemo {

    public static void main(String[] args) throws InterruptedException {

        RedisLruDemo demo = new RedisLruDemo(10);
        // 先加入10個key,此時cache達到容量,下次加入會淘汰key
        for (int i = 0; i < 10; i++) {
            demo.set(i + "", i);
        }
        // 隨機訪問前十個key,這樣可以保證下次加入時隨機淘汰
        for (int i = 0; i < 20; i++) {
            int nextInt = new Random().nextInt(10);
            TimeUnit.SECONDS.sleep(1);
            demo.get(nextInt + "");
        }
        // 再次添加5個key,此時每次添加都會觸發淘汰
        for (int i = 10; i < 15; i++) {
            demo.set(i + "", i);
        }

        System.out.println("-------------------------------------------");
        demo.getAll().forEach( redisHead -> System.out.println("剩余 -> " + "lru : " + redisHead.getLru() + " body : " + redisHead.getBody()));
    }

}
  • 測驗結果

image.png

2.2 LFU實作方式

在LFU模式下,Redis物件頭的24bit lru欄位被分成兩段來存盤,高16bit存盤ldt(Last Decrement Time),低8bit存盤logc(Logistic Counter),

lru_24 bit.png


?

2.2.1 ldt(Last Decrement Time)

高16bit用來記錄最近一次計數器降低的時間,由于只有8bit,存盤的是Unix分鐘時間戳取模2^16,16bit能表示的最大值為65535(65535/24/60≈45.5),大概45.5天會折返(折返指的是取模后的值重新從0開始),
?

Last Decrement Time計算的演算法原始碼:

/* Return the current time in minutes, just taking the least significant
 * 16 bits. The returned time is suitable to be stored as LDT (last decrement
 * time) for the LFU implementation. */
// server.unixtime是Redis快取的Unix時間戳
// 可以看出使用的Unix的分鐘時間戳,取模2^16
unsigned long LFUGetTimeInMinutes(void) {
  return (server.unixtime/60) & 65535;
}

/* Given an object last access time, compute the minimum number of minutes
 * that elapsed since the last access. Handle overflow (ldt greater than
 * the current 16 bits minutes time) considering the time as wrapping
 * exactly once. */
unsigned long LFUTimeElapsed(unsigned long ldt) {
  // 獲取系統當前的LFU time
  unsigned long now = LFUGetTimeInMinutes();
  // 如果now >= ldt 直接取差值  
  if (now >= ldt) return now-ldt;
  // 如果now < ldt 增加上65535
  // 注意Redis 認為折返就只有一次折返,多次折返也是一次,我思考了很久感覺這個應該是可以接受的,本身Redis的淘汰演算法就帶有隨機性  
  return 65535-ldt+now;
}

2.2.2 logc(Logistic Counter)

低8位用來記錄訪問頻次,8bit能表示的最大值為255,logc肯定無法記錄真實的Rediskey的訪問次數,其實從名字可以看出存盤的是訪問次數的對數值,每個新加入的key的logc初始值為5(LFU_INITI_VAL),這樣可以保證新加入的值不會被首先選中淘汰;logc每次key被訪問時都會更新;此外,logc會隨著時間衰減,
?

2.2.3 logc 演算法調整

redis.conf 提供了兩個配置項,用于調整LFU的演算法從而控制Logistic Counter的增長和衰減,

image.png

  • lfu-log-factor 用于調整Logistic Counter的增長速度,lfu-log-factor值越大,Logistic Counter增長越慢,

Redis Logistic Counter增長的源代碼:

/* Logarithmically increment a counter. The greater is the current counter value
 * the less likely is that it gets really implemented. Saturate it at 255. */
uint8_t LFULogIncr(uint8_t counter) {
  // Logistic Counter最大值為255  
  if (counter == 255) return 255;
  // 取一個0~1的亂數r  
  double r = (double)rand()/RAND_MAX;
  // counter減去LFU_INIT_VAL (LFU_INIT_VAL為每個key的Logistic Counter初始值,默認為5)
  double baseval = counter - LFU_INIT_VAL;
  // 如果衰減之后已經小于5了,那么baseval < 0取0
  if (baseval < 0) baseval = 0;
  // lfu-log-factor在這里被使用
  // 可以看出如果lfu_log_factor的值越大,p越小
  // r < p的概率就越小,Logistic Counter增加的概率就越小(因此lfu_log_factor越大增長越緩慢)
  double p = 1.0/(baseval*server.lfu_log_factor+1);
  if (r < p) counter++;
  return counter;
}

如下是官網提供lfu-log-factor在不同值下,key隨著訪問次數的增加的Logistic Counter變化情況的資料:

image.png

  • lfu-decay-time 用于調整Logistic Counter的衰減速度,它是一個以分鐘為單位的數值,默認值為1,;lfu-decay-time值越大,衰減越慢,

Redis Logistic Counter衰減的源代碼:

/* If the object decrement time is reached decrement the LFU counter but
 * do not update LFU fields of the object, we update the access time
 * and counter in an explicit way when the object is really accessed.
 * And we will times halve the counter according to the times of
 * elapsed time than server.lfu_decay_time.
 * Return the object frequency counter.
 *
 * This function is used in order to scan the dataset for the best object
 * to fit: as we check for the candidate, we incrementally decrement the
 * counter of the scanned objects if needed. */
unsigned long LFUDecrAndReturn(robj *o) {
  // 獲取lru的高16位,也就是ldt
  unsigned long ldt = o->lru >> 8;  
  // 獲取lru的低8位,也就是logc  
  unsigned long counter = o->lru & 255;
  // 根據配置的lfu-decay-time計算Logistic Counter需要衰減的值
  unsigned long num_periods = server.lfu_decay_time ? LFUTimeElapsed(ldt) / server.lfu_decay_time : 0;
  if (num_periods)
    counter = (num_periods > counter) ? 0 : counter - num_periods;
  return counter;
}

2.2.4 LFU 優化

LFU 與 LRU 有一個共同點,當記憶體達到max_memory時,選擇key是隨機抓取的,因此Redis為了使這種隨機性更加準確,設計了一個淘汰池,這個淘汰池對于LFU和LRU算的都適應,只是淘汰池的排序演算法有區別而已,
Redis 3.0就對這一塊進行了優化(來自redis.io):

image.png

3、LFU使用

3.1 組態檔開啟LFU淘汰演算法

修改redis.conf組態檔,設定maxmemory-policy volatile-lfu/allkeys-lfu

image.png

重啟Redis,連接客戶端通過info指令查看maxmemory_policy的配置資訊

image.png

通過object freq key 獲取物件的LFU的Logistic Counter值

image.png

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/302771.html

標籤:java

上一篇:實作雙向鏈表(帶傀儡節點)

下一篇:集合背后的資料結構(一)

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more