從2001年DDR記憶體面世以來發展到2019年的今天,已經走過了DDR、DDR2、DDR3、DDR4四個大的規格時代了,記憶體的作業頻率也從DDR時代的266MHz進化到了今天的3200MHz,這個頻率在作業系統里叫Speed、在記憶體術語里叫等效頻率、或干脆直接簡稱頻率,這個頻率越高,每秒鐘記憶體IO的吞吐量越大,但其實記憶體有一個最最基本的頻率叫核心頻率,是實際記憶體電路的作業時的一個振蕩頻率,它是記憶體作業的基礎,很大程度上會影響記憶體的IO延遲,我今天想給大家揭開另外一面,這個叫核心頻率的東東其實在最近的18年里,基本上就沒有什么太大的進步,
記憶體Speed
在Linux上可以查看到你機器上記憶體的Speed,
dmidecode | grep -P -A16 "Memory Device"
Memory Device
Array Handle: 0x0009
Error Information Handle: Not Provided
Total Width: 72 bits
**Data Width: 64 bits**
Size: 8192 MB
Form Factor: DIMM
Set: None
Locator: DIMM02
Bank Locator: BANK02
Type: Other
Type Detail: Unknown
**Speed: 1067 MHz**
Manufacturer: Micron
Serial Number: 65ED91DC
Asset Tag: Unknown
Part Number: 36KSF1G72PZ-1G4M1
......
上述命令可以看出每一個插槽上記憶體物理設備的情況,由于結果太長我只抽取了其中一個記憶體的資訊列了出來,對于我們開發者來說,其中有兩個資料比較關鍵,
- Speed: 1067 MHz: 每秒能進行記憶體資料傳輸的速度,
- Data Width: 64 bits: 記憶體作業一次傳輸的資料寬度
我的機器上所有的記憶體條的Speed都是1067(大家別笑話,因為我的測驗機器是線上過保淘汰下來的機器,所以老了一點點), 把Data Width和Speed相乘后得到的就是資料帶寬了,我們把歷史上各個階段的記憶體的Speed和帶寬匯總了一下,如下圖,

記憶體背后的秘密-核心頻率
通過Linux我們只看到了記憶體的一個Speed,它是資料傳輸的頻率,這個頻率又叫Data Speed,或等效頻率,各個商家在記憶體的銷售頁面上也把這個頻率標在特別明顯的位置,提醒消費者他家的記憶體有多快多快,但其實從記憶體條的技術引數上來講,有個最為重要的頻率,是核心頻率,它是記憶體電路的震蕩頻率,是記憶體一切作業的基石,
我們來看一下各代記憶體的更全面詳細的資料,

我匯總了從SDR時代,一直到目前主流的DDR4的記憶體的頻率表對比,大家可以看到核心頻率已經多年沒有實質性進步了,這是受物理材料的極限限制,記憶體的核心頻率一直在133MHz~200MHz之間徘徊,,我們所看到的記憶體Speed是在這個核心頻率的基礎上,通過各種技術手段放大出來的,之所以我們感覺記憶體在越來越快,就是放大技術手段在不斷進步而已,
- SDR時代:在最古老的SDR(Single Data Rate SDRAM)年代里,一個時鐘脈沖只能在脈沖上沿時傳輸資料,所以也叫單倍資料傳輸率記憶體,這個時期記憶體的提升方法就是提升記憶體電路的核心頻率,
- DDR時代:但是記憶體制造商們發現核心頻率到了200MHz再提升的話,難度就很大了,所以在電路時鐘周期內預取2bit,輸出的時候就在上升期和下降期各傳輸一次資料,所以核心頻率不變的情況下,Speed(等效頻率)就翻倍了,
- DDR2時代:同樣是在上下沿各傳一次資料,但將Prefech提升為4,每個電路周期一次讀取4bit,所以DDR2的Speed(等效頻率)就達到了核心頻率的4倍,
- DDR3時代:同樣也是上下沿各傳一次資料,進一步將Prefect提升為8,所以DDR3的等效頻率可以達到核心頻率的8倍,
- DDR4時代:這時預取的提升已經非常困難,所以和DDR3一樣,Prefech仍然為8,記憶體制造商們又另辟蹊徑,提出了Bank Group設計,允許各個Bank Group具備獨立啟動操作讀、寫等動作特性,所以等效頻率可以提升到核心頻率的16倍,
記憶體還有個概念叫IO頻率、也叫時鐘頻率,簡單理解為將DDR記憶體的Speed頻率除以2,就是記憶體的IO頻率,這個必須和CPU的外頻相匹配才能作業,例如對于DDR3來說,假如核心頻率133Mhz的記憶體作業頻率下,匹配533MHz的CPU外頻,其IO頻率就是533Mhz,資料傳輸因為上下沿都可以傳,所以是核心頻率的8倍,也就是1066MHz,
我曾試圖在Linux下找到能查看核心頻率和IO頻率的命令,但是沒有找到,在售的各種記憶體條似乎也很少會提及它, 但我們是IT從業人員,非普通用戶,因此我覺得大家有必要來了解這個原理,(事實上,這兩個頻率會影響后面討論的記憶體的延遲引數,而延遲引數又決定了記憶體的真正性能)
匯總一句話,記憶體真正的作業頻率是核心頻率,時鐘頻率和資料頻率都是在核心頻率的基礎上,通過技術手段放大出來的,記憶體越新,放大的倍數越多,但其實這些放大手段都有一些局限性,比如你的記憶體資料存盤并不連續,這時候DDR2、DDR3的資料預取對你幫助并不大,再比如你的行程資料都存在一個Bank Group里,你的行程記憶體IO就根本不會達到DDR4廠家宣傳的速度,
擴展知識:記憶體延遲
除了頻率以外,記憶體還有幾個比較重要的引數,但是同樣在Linux里沒有找到查看的命令,記憶體的銷售頁面想找到這幾個引數也不是特別容易,
所有的記憶體條都有CL-tRCD-tRP-tRAS四個引數,其中最重要的是CL-tRCD-tRP這三個引數,只要你費點勁,所有的在售記憶體你都能找到這3個值,例如經典的DDR3-1066、DDR3-1333及DDR3-1600的CL值分別為7-7-7、8-8-8及9-9-9,現在京東上一條比較流行的臺式機記憶體金士頓(Kingston)DDR4 2400 8G,其時序是17-17-17,
第四個引數有時候會被省略,原因有二,第一:現在的開發者不需要直接和記憶體打交道,而作業系統呢又做的比較記憶體友好,很少會有這個開銷真正發生,第二,這個開銷的值要比其它的值大很多,實在不太好看,商家為了記憶體能多賣一些,干脆就避而不談了,
好了,問題來了,為什么記憶體越進步,延遲周期反而會變大了呢?
這就是因為延遲周期使用延遲時間除以記憶體時鐘周期(Speed/2)算出來的,這其實不算太科學,最直接的辦法應該是用延遲時間來評估,延遲時間很大程度上是受記憶體的核心頻率的制約的,而這些年核心頻率又基本上沒有進步,所以延遲時間也不會有實質的降低,假定延遲時間不變,而時鐘周期翻倍了,這樣延遲周期看起來就是新的記憶體更大,
今天就帶大家了解到這里,后面我會用實驗來讓你理解你的記憶體的實際延時,

開發內功修煉之記憶體篇專輯:
- 1.帶你深入理解記憶體對齊最底層原理
- 2.記憶體隨機也比順序訪問慢,帶你深入理解記憶體IO程序
- 3.從DDR到DDR4,記憶體核心頻率其實基本上就沒太大的進步
- 4.實際測驗記憶體在順序IO和隨機IO時的訪問延時差異
- 5.揭穿記憶體廠家“謊言”,實測記憶體帶寬真實表現
- 6.NUMA架構下的記憶體訪問延遲區別!
- 7.PHP7記憶體性能優化的思想精髓
- 8.一次記憶體性能提升的專案實踐
- 9.挑戰Redis單實體記憶體最大極限,“遭遇”NUMA陷阱!
我的公眾號是「開發內功修煉」,在這里我不是單純介紹技術理論,也不只介紹實踐經驗,而是把理論與實踐結合起來,用實踐加深對理論的理解、用理論提高你的技術實踐能力,歡迎你來關注我的公眾號,也請分享給你的好友~~~
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/199340.html
標籤:其他
