簡介
經常聽到有人說磁盤很慢、網路很卡,這都是站在人類的感知維度去表述的,比如拷貝一個檔案到硬碟需要幾分鐘到幾十分鐘,夠我去吃個飯啦;而從網路下載一部電影,有時候需要幾個小時,我都可以睡一覺了,
最為我們熟知的關于計算機不同組件速度差異的圖表,是下面這種金字塔形式:越往上速度越快,容量越小,而價格越高,這張圖只是給了我們一個直觀地感覺,并沒有對各個速度和性能做出量化的說明和解釋,而實際上,不同層級之間的差異要比這張圖大的多,這篇文章就讓你站在 CPU 的角度看這個世界,說說到底它們有多慢,

希望你看到看完這篇文章能明白兩件事情:磁盤和網路真的很慢,性能優化是個復雜的系統性的活,
tips: 所有的資料都是來自 這個地址,所有的資料會因為機器配置不同,或者硬體的更新而有出入,但是不影響我們直覺的感受,如果對這些資料比較感興趣,這個網址 給出了不同年份一些指標的數值,
資料
-
先來看看 CPU 的速度,就拿我的電腦來說,主頻是
2.6G,也就是說每秒可以執行2.6*10^9個指令,每個指令只需要0.38ns(現在很多個人計算機的主頻要比這個高,配置比較高的能達到 3.0G+),我們把這個時間當做基本單位1s,因為1s大概是人類能感知的最小時間單位,

-
一級快取讀取時間為
0.5ns,換算成人類時間大約是1.3s,大約一次或者兩次心跳的時間,這里能看出快取的重要性,因為它的速度可以趕上 CPU,程式本身的 locality 特性加上指令層級上的優化,cache 訪問的命中率很高,這最終能極大提高效率, -
分支預測錯誤需要耗時
5ns,換算成人類時間大約是13s,這個就有點久了,所以你會看到很多文章分析如何優化代碼來降低分支預測的幾率,比如 這個得分非常高的 stackoverflow 問題, -
二級快取時間就比較久了,大約在
7ns,換算成人類時間大約是18.2s,可以看到的是如果一級快取沒有命中,然后去二級快取讀取資料,時間差了一個數量級,
tips: 為什么需要多層的 CPU 快取呢? 這篇文章通過一個通俗易懂的例子給出了講解,
-
我們繼續,互斥鎖的加鎖和解鎖時間需要
25ns,換算成人類時間大約是65s,首次達到了一分鐘,并發編程中,我們經常聽說鎖是一個很耗時的東西,因為在微波爐里加熱一個東西需要一分鐘的話,你要在那傻傻地等蠻久了, -
然后就到了記憶體,每次記憶體尋址需要
100ns,換算成人類時間是260s,也就是4分多鐘,如果讀一些不需要太多思考的文章,這么久能讀完2-3千字,看起來還不算壞,不多要從記憶體中讀取一段資料需要的時間會更多,到了記憶體之后,時間就變了一個量級,CPU 和記憶體之間的速度瓶頸被稱為馮諾依曼瓶頸, -
一次 CPU 背景關系切換(系統呼叫)需要大約
1500ns,也就是1.5us(這個數字參考了這篇文章,采用的是單核 CPU 執行緒平均時間),換算成人類時間大約是65分鐘,嗯,也就是一個小時,我們也知道背景關系切換是很耗時的行為,畢竟每次浪費一個小時,也很讓人有罪惡感的,背景關系切換更恐怖的事情在于,這段時間里 CPU 沒有做任何有用的計算,只是切換了兩個不同行程的暫存器和記憶體狀態;而且這個程序 還破壞了快取,讓后續的計算更加耗時, -
在 1Gbps 的網路上傳輸 2K 的資料需要
20us,換算成人類時間是14.4小時,這么久都能把《星球大戰》六部曲看完了(甚至還加上吃飯撒尿的時間)!可以看到網路上非常少資料傳輸對于 CPU 來說,已經很漫長,而且這里的時間還是理論最大值,實際程序還要更慢一些, -
SSD 隨機讀取耗時為
150us,換算成人類時間大約是4.5天,換句話說,SSD 讀點資料,CPU 都能休假,報團參加周邊游了,雖然我們知道 SSD 要比機械硬碟快很多,但是這個速度對于 CPU 來說也是像烏龜一樣,I/O 設備從硬碟開始速度開始變得漫長,這個時候我們就想起記憶體的好處了,盡量減少 IO 設備的讀寫,把最常用的資料放到記憶體中作為快取是所有程式的通識,像memcached和redis這樣的高速快取系統近幾年的異軍突起,就是解決了這里的問題, -
從記憶體中讀取
1MB的連續資料,耗時大約為250us,換算成人類時間是7.5天,這次假期升級到國慶七天國外游了, -
同一個資料中心網路上跑一個來回需要
0.5ms,換算成人類時間大約是15天,也就是半個月的時間,如果你的程式有段代碼需要和資料中心的其他服務器互動,在這段時間里 CPU 都已經狂做了半個月的運算,減少不同服務組件的網路請求,是性能優化的一大課題, -
從 SSD 讀取
1MB的順序資料,大約需要1ms,換算成人類時間是1個月,也就是說 SSD 讀一個普通的檔案,如果要等你做完,CPU 一個月時間就荒廢了,盡管如此,SSD 已經很快啦,不信你看下面機械磁盤的表現, -
磁盤尋址時間為
10ms,換算成人類時間是10個月,剛好夠人類創造一個新的生命了,如果 CPU 需要讓磁盤泡杯咖啡,在它眼里,磁盤去生了個孩子,回來告訴它你讓我泡的咖啡好了,機械硬碟使用RPM(Revolutions Per Minute/每分鐘轉速)來評估磁盤的性能:RPM 越大,平均尋址時間更短,磁盤性能越好,尋址只是把磁頭移動到正確的磁道上,然后才能讀取指定扇區的內容,換句話說,尋址雖然很浪費時間,但其實它并沒有辦任何的正事(讀取磁盤內容), -
從磁盤讀取
1MB連續資料需要20ms,換算成人類時間是20個月, IO 設備是計算機系統的瓶頸,希望讀到這里你能更深切地理解這句話!如果還不理解,不妨想想你在網上買的東西,快遞送了將近兩年,你的心情是怎么樣的, -
而從世界上不同城市網路上走一個來回,平均需要
150ms(參考世界各地 ping 報文的時間),換算成人類時間是12.5年,不難理解,所有的程式和架構都會盡量避免不同城市甚至是跨國家的網路訪問, CDN就是這個問題的一個解決方案:讓用戶和最接近自己的服務器互動,從而減少網路上報文的傳輸時間, -
虛擬機重啟一次大約要
4s時間,換算成人類的時間是3百多年,對于此,我想到了喬布斯要死命優化 Mac 系統開機啟動時間的故事,如果機器能少重啟而且每次啟動能快一點,不僅能救人命,也能救 CPU 的命, -
物理服務器重啟一次需要
5min,換算成人類時間是2萬5千年,快趕上人類的文明史了,5 分鐘人類都要等一會了,更別提 CPU 了,所以沒事不要亂重啟服務器啊,分分鐘終結一個文明的節奏,
參考資料
- What Every Programmer Should Know About Memory
- Getting Physical With Memory
原文鏈接:https://blog.51cto.com/u_13188467/2065321
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/397112.html
標籤:Linux
