計算機硬體的讀寫速度差異-有解無憂

現代計算機系統
存盤器
暫存器
CPU時鐘周期
高速快取
主存
固態硬碟
機械硬碟
壓榨CPU性能帶來的問題
- 有序性問題
- 可見性問題
- 原子性問題

作者：小牛呼嚕嚕 | https://xiaoniuhululu.com
計算機內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕」

現代計算機系統

現代計算機系統與馮·諾依曼計算機差別不大，最大的區別馮·諾依曼計算機是以運算器為中心的，而現代計算機以儲存器為中心：

我們主要來看一下其中與儲存相關的組件：

存盤器

存盤器是用來存放資料和程式，存盤器包含主存和輔存

主存：直接與CPU交換資訊，就是我們熟悉的記憶體，斷電后記憶體的資料是會丟失的
輔存：輔存可作為主存的后備存盤器，不直接與CPU交換資訊，容量比主存大，但速度比主存慢，比如機械硬碟、固態硬碟等，斷電后硬碟的資料是不會丟失，硬碟是持久化存盤設備，
輔存、輸入設備、輸出設備 統稱為IO設備；主機一般包含：CPU、主存

我們先來看看存盤器的層次結構，來初步對各個儲存器部件有所認識

我們可以發現存盤器速度越快的話，相應的價格也會越發昂貴！

暫存器

CPU中還有一個常見的組件: 暫存器，是CPU內部用來存放資料的一些小型的存盤區域，用來暫時存放參與運算的資料以及運算結果，暫存器由電子線路組成，存取速度非常快，暫存器的成本較高，因而數量較少，

CPU時鐘周期

CPU時鐘周期：通常為節拍脈沖或T周期，即主頻的倒數，它是CPU中基本時間單位，平時我們打游戲常說的超頻，超的就是這個CPU主頻，

從硬體層次來說，CPU 的主頻是其實由?個晶體振蕩器來實作的，這個晶體振蕩器?成的電路信號，就是我們的時鐘信號

舉個例子，主頻為3.0GHZ的CPU，一個時鐘周期大約是0.3納秒，記憶體訪問大約需要120納秒，固態硬碟訪問大約需要50-150微秒，機械硬碟訪問大約需要1-10毫秒，最后網路訪問最慢，得幾十毫秒左右，
這個大家可能對時間不怎么敏感，那如果我們把**一個時鐘周期如果按1秒算的話，記憶體訪問大約就是6分鐘，固態硬碟大約是2-6天，傳統硬碟大約是1-12個月，網路訪問就得幾年了！ **
我們可以發現CPU的速度和記憶體等存盤器的速度，完全不是一個量級上的，

高速快取

為了彌補 CPU 與記憶體兩者之間的性能差異，就在 CPU 內部引入了 CPU Cache，也稱高速快取，
CPU Cache用的是 SRAM(Static Random-Access Memory)的芯片，也叫靜態隨機存盤器，其只要有電，資料就可以保持存在，而一旦斷電，資料就會丟失，

CPU Cache 通常分為大小不等的三級快取，分別是 L1 Cache、L2 Cache 和 L3 Cache

部件	CPU訪問所需時間	備注
L1 高速快取	2~4 個時鐘周期	每個 CPU 核心都有一塊屬于自己的 L1 高速快取，L1 高速快取通常分成指令快取和資料快取，
L2 高速快取	10~20 個時鐘周期	L2 高速快取同樣是每個 CPU 核心都有的
L3 高速快取	20~60個時鐘周期	L3 高速快取是多個 CPU 核心共用的

我們可以發現越靠近 CPU 核心的快取其訪問速度越快，

程式執行時，會先將記憶體中的資料加載到共享的 L3 Cache 中，再加載到每個核心獨有的 L2 Cache，最后進入到最快的 L1 Cache，之后才會被 CPU 讀取，層級關系如下圖：

主存

主存，直接與CPU交換資訊，就是我們熟悉的記憶體，它使用的是一種叫作 DRAM(Dynamic Random Access Memory)的芯片，也叫動態隨機存取存盤器，斷電后記憶體的資料是會丟失，
DRAM 芯片的密度更高，功耗更低，有更大的容量，造價比 SRAM 芯片便宜很多，但速度比SRAM 芯片慢的多，
記憶體速度大概在 200~300 個時鐘周期之間

固態硬碟

固體硬碟(Solid-state Disk, SSD)，資料直接存在閃存顆粒中，并且由主控單元記錄資料存盤位置和資料操作，每一個閃存顆粒的存盤容量是有限的;
但是它相比記憶體的優點是斷電后資料還是存在的，SSD固體硬碟的讀寫速度雖然比記憶體的大概慢10~1000 倍，但比機械硬碟快多了，當然價格也昂貴很多，不過隨著時代的發展，固態硬碟的價格慢慢趨向接近機械硬碟，

機械硬碟

機械硬碟（Hard Disk Drive, HDD），它是通過物理讀寫的方式來訪問資料的，機械硬碟在盤面上寫資料、磁盤轉動，機械臂移動，比較原始的資料讀寫方式，就像近現代的留聲機發聲原理一樣，
由于受限于轉盤轉速與指標尋址的時間限制，因此它訪問速度是非常慢的，它的速度比記憶體慢 10W 倍左右，
當然機械硬碟也是有其優點的：容量大，價格便宜，恢復資料難度低，因此資料放在機械硬碟中比較保險，

壓榨CPU性能帶來的問題

由于CPU速度非常快，且價格非常昂貴，我們必須得充分壓榨CPU,得像生產隊的驢一樣，讓它不停地作業

為了合理利用 CPU 的高性能，同時盡可能地節約成本，現代計算機將這些儲存器充分的結合起來，由于這些硬體的資料存取速度差異導致了計算機系統編程中的各種問題：

有序性問題

為了充分壓榨CPU的性能，CPU 會對指令亂序執行或者語言的編譯器會指令重排，讓CPU一直作業不停歇，但同時會導致有序性問題，

在CPU中為了能夠讓指令的執行盡可能地同時運行起來，采用了指令流水線，一個 CPU 指令的執行程序可以分成 4 個階段：取指、譯碼、執行、寫回，這 4 個階段分別由 4 個獨立物理執行單元來完成，
理想的情況是：指令之間無依賴，可以使流水線的并行度最大化，但是如果兩條指令的前后存在依賴關系，比如資料依賴，控制依賴等，此時后一條陳述句就必需等到前一條指令完成后，才能開始，所以CPU為了提高流水線的運行效率，對無依賴的前后指令做適當的亂序和調度，
還有一種情況編譯器會指令重排，比如java語言，JVM 的編譯器會對其指令進行重排序的優化（指令重排），
所謂指令重排是指在不改變原語意的情況下，通過調整指令的執行順序讓程式運行的更快，JVM中并沒有規定編譯器優化相關的內容，也就是說JVM可以自由的進行指令重排序的優化，
無論是編譯期的指令重排還是CPU 的亂序執行，主要都是為了讓 CPU 內部的指令流水線可以“填滿”，提高指令執行的并行度，充分利用CPU的高性能，

可見性問題

為了平衡CPU的暫存器和記憶體的速度差異，計算機的CPU 增加了高速快取，但同時導致了 可見性問題，
我們知道當程式執行時，一般CPU會去從記憶體中讀取資料，來進行計算，CPU計算完之后，需要把資料重新放回到記憶體中，
當CPU的多個核心參與一個程式的運行，從記憶體中讀取一個共享變數的資料，當不同核心間進行了各自的計算，把計算后的值放入自己的快取中而不選擇立即寫入記憶體中（CPU寫入記憶體的時機是不確定的），那么在CPU的快取中，這個共享變數有可能存放著不同的資料，這就導致了快取的可見性問題，即一個執行緒對資料的修改無法對其他執行緒可見，

原子性問題

為了平衡CPU 與 I/O 設備的速度差異，作業系統增加了行程、執行緒概念，以分時復用 CPU，但同時導致了原子性問題，

原子操作就是不可分割的操作，在計算機中，就是指不會因為執行緒調度被打斷的操作，

當一個程式去I/O 設備讀取資料，由于I/O 設備資料存入讀取速度，相比于CPU的執行速度來說度日如年，CPU這么牛逼這么昂貴的寶貝，怎么能讓它歇著，得讓它一直干活，去切換執行其他程式，也就是將CPU的時間進行分片，讓各個程式在CPU上輪轉執行，但被剝奪執行權的程式，等它從IO讀取完資料后，還是得讓CPU繼續執行的，這時需要一個資料結構來保存，以便之后恢復繼續執行，這個就是行程.

一開始行程中只有一個"執行流"，干活的人就一個，隨著任務越來越多，發現行程不夠用了，經常導致整個程式被阻塞，這時計算機讓行程有多個執行流，干活的人變多了，那程式就不會再被阻塞了，"執行流" 就是執行緒.

如何解決這3個問題，就是并發、多執行緒需要處理的事，當然這是后話，

參考資料：
《深入理解計算機系統》
《計算機組成原理》
《計算機組成原理》--唐朔飛
https://zhuanlan.zhihu.com/p/379947484

本篇文章到這里就結束啦，很感謝你能看到最后，如果覺得文章對你有幫助，別忘記關注我！更多精彩的文章

轉載請註明出處，本文鏈接：https://www.uj5u.com/caozuo/507099.html

標籤：其他

上一篇：《痞子衡嵌入式半月刊》第 61 期

下一篇：Linux命令之find、grep、echo、tar、whoami、uname