在IT基礎架構領域作業有十年了,親眼目睹和參與了上一代網路存盤架構在中國的興起和衰敗。的確,新IT浪潮已經到來,超融合就是諸多風口之一,成為了近幾年IT業界備受關注的話題。雖然超融合這個概念已經被廠商熱炒了至少兩年,但看到市場上依舊存在著很多模糊的定義和理解,所以想整理一些學習筆記和個人見解,希望這些干貨內容能對想入門的朋友有所幫助 。
一.超融合的核心特征是什么?
首先大家需要有一個概念,我們看到的這些名詞,事實上都是最早推行這些架構的廠商建立起來的,比如Nutanix最早推廣的超融合這個概念(HCI :Hyper Converge Infrastructure),目的無非是建立一個產品的品類,這是營銷慣常的手法,但老外玩兒的真的很溜很成功。
Nutanix起步的核心技術是分布式存盤,只是在部署架構上有了進一步創新,采用了這種融合的方式。其實這種創新在技術本身上并沒有大的難度,但很大程度上推進了分布式存盤的市場落地。
所以這就是超融合1.0的核心,但市場上很多人,被“融合”二字迷惑,甚至一些廠商,也就順水推舟,榷訓存盤部分(榷訓的原因是存盤真的很難做好),單純去強調融合,把一堆無關痛癢的東西集成起來。個人覺得這不是正途。
我認為真正撬動傳統IT市場的超融合1.0的特征主要是兩點:
一是,基于X86服務器架構的分布式存盤(這里先不提SDS了,會增加新的混淆);
二是,分布式存盤和計算虛擬化部署在同一服務器硬體內。
下面對比中能看到,給用戶帶來價值的重要特性中,大概70%是來自于分布式存盤,30%是超融合架構帶來的好處(比如管理簡化,使用成本的降低),但恰恰是這30%,讓用戶更愿意從傳統架構切換到分布式架構上來。
二.超融合是革命性架構么?革誰的命?
任何稱之為革命性的架構都應具備至少以下三個特征:
一是,對用戶的使用習慣會有巨大的改變;
二是,為用戶帶來巨大的價值;
三是,新的廠商可以撬動傳統老牌廠商的市場。
以上三點,超融合產品都具備,前兩點在后面分別介紹,第三個可以通過國外的Nutanix、VMware(vSAN),中國的SmartX等廠商的案例描述中看到,他們所替代的產品大量的是老牌存盤廠商EMC、HDS等公司的存盤產品。有人會說Nutanix不也自己出服務器虛擬化產品嗎?這是不是在替換VMware?但這已經是后來的故事,最初的Nutanix產品核心就是超融合架構的分布式存盤。用戶采購Nutanix并不需要替換原有的服務器品牌(比如Dell)或者虛擬化品牌(比如VMware),只有存盤(比如EMC)是一定被替換掉的。這是重要的起點和切入點。如果最初Nutanix就是想以超融合的理念替換存盤、虛擬化甚至服務器硬體,我想那會樹敵太多,幾乎沒有勝算。
三.為什么超融合的架構會在近幾年才出現?
一個革命性的技術架構出現、成熟需要至少兩個核心因素:
一是,客戶的強烈需求;
二是,相關技術的成熟。
超融合架構的客戶需求來自于商業數字化和互聯網化對IT資源的使用速度和使用要求有了大幅提升。而以下相關技術對架構的市場落地有很大關系。
1. 分布式存盤架構
這個其實在互聯網公司用了很多年,分布式存盤可以很好地基于X86服務器構建一個易擴展、高可靠的存盤資源池,是超融合的基礎。
2.SSD
毫無疑問,SSD對存盤架構的影響是巨大的,傳統機械硬碟的4K隨機性能只有300左右,而類似intel 3710這樣的SSD則可以達到超過7萬IOPS,直接高出兩個數量級。但同時雙控制器架構就會成為瓶頸,比如EMC的Unity 650 可以支持一千塊硬碟或SSD,但31塊SSD的時候就到達瓶頸,此時8:2讀寫混合最大只能達到27萬IOPS。
同樣,SSD大大減少了事務型存盤系統的機架空間,使存盤和計算節點的數量比較匹配,這是超融合架構成立的一個重要條件。
3.虛擬化
超融合架構成立的另一個重要條件就是虛擬化已經被廣泛接受,否則分布式存盤不可能和應用共存在一個物理節點上,除非是一個廠商的一體機產品。
4. CPU
最后就是大家常說的CPU更強大更廉價,可以同時解決計算和存盤的要求。
四.超融合就是分布式存盤和計算虛擬化簡單地安裝在一起嗎?
答案當然是NO。
因為要以超融合的形態去做虛擬化的存盤,還應該具備以下特征:
一是,對系統資源消耗應該少,并且可控,合理的方案不應該超過10%;
二是,支持VM資料訪問本地化,這個是超融合架構另一大優勢;
三是,既然是重點支持虛擬化平臺存盤,就應該對不同的虛擬化平臺有比較好的支持,類似VMware、KVM等。
所以,現在中國市場真正算得上超融合架構的也就是Nutanix、VMware、SmartX。國內很多廠商拿一個Ceph就包裝超融合產品,以上三點沒有一點能做好。主要的問題包括:
1.哈希演算法不能實作資料存放的精準控制,所以I/O本地化無法實作。
2.軟體I/O路徑比較長, CPU資源消耗比較多,進一步增加了延遲。
五.超融合架構和傳統架構有哪些區別?
這里我挑了SmartX的架構圖用來做對比說明,更清晰一些(以下若干圖都取自SmartX產品膠片)。對于真正的超融合產品,以下特性都是一致的的。如果有少量的特性差異,會專門描述。

六.為什么超融合架構的可靠性能比傳統雙控架構更好?
用服務器構建存盤,客戶顧慮最多的首先是可靠性,如果需要衡量可靠性:
系統的冗余度?通俗的說就是允許硬體壞多少?
出現故障后是否完全自動恢復?
恢復速度和時間?因為系統處于降級狀態下是比較危險的狀態,故障視窗越小,出現整體故障的可能性就越小。
以下給出詳細的系統冗余與恢復機制對比。

上表需要進一步說明的是:
三副本可以帶來比雙控更好的冗余度,代價當然就是損耗更多的容量。
管理的粒度部分,各家實作不同,有的是基于資源池設定兩副本或三副本,有的廠商,比如SmartX,是以卷為單位,這樣的好處就是可以在一個資源池上分配不同副本策略的卷,用于不同安全級別的VM。
熱備盤的處理方面,其實大部分分布式存盤都沒有了,而是利用已有空間進行恢復。但需要強調的是現在GlusterFS還是使用熱備盤機制,包括深信服等還是基于這樣的產品構建超融合,個人很不看好。
可以看出可靠性方面,超融合架構的優勢非常大,但其實這里的優勢都是分布式存盤本身應該具備的。
七.為什么超融合架構的隨機性能比傳統架構更高?
可以看出,超融合在性能方面的架構優勢也非常明顯,當然代價就是消耗計算資源,所以計算資源的消耗是檢驗超融合專業性的一個重要因素。
以下給出詳細的性能機制對比。

性能相關的特性中,多節點并發和性能擴展依舊是分布式存盤帶來的。而資料本地化是超融合架構獨有的,分離式的架構無法實作,當然代價就是計算資源的占用。SSD是即使傳統架構存盤都會使用的,但雙控無法發揮SSD的性能。
比如EMC Unity 650F,8:2 8K混合隨機讀寫性能最大27萬IOPS,而對于類似Nutanix、SmartX等性能比較好的超融合產品,一個節點8:2 8K混合隨機讀寫很容易達到3萬以上IOPS,通過線性擴展,10個左右節點就可以達到EMC Unity 650F的最大性能。而10個節點只是非常小的用戶規模。
八.為什么超融合架構的可擴展性比傳統架構更好?
可擴展性是分布式架構的最大優勢之一,當然擴容后的資料自動負載均衡效果并不是必然的,要看廠家的產品化程度。
以下給出詳細的系統可擴展性對比。擴展性方面的優勢,依舊是分布式存盤架構帶來的。

九.為什么超融合架構的部署運維更簡單?
超融合架構運維的簡化效果是非常顯著的,以下從幾個角度進行部署與運維對比。其中部分優勢是分布式架構帶來的,比如只維護標準商用服務硬體,而使用超融合后,可以進一步減少硬體的需求量。

十.超融合到底如何為用戶省錢?
說法在網上很多了,但以下這個實體可能更精準和量化一些,大家可以對比使用成本。這里沒有包括人員維護成本,續保等費用的成本等。人力成本方面,去掉專業存盤運維就可以節省很大一部分人員開銷。根據實際經驗值,采用超融合在人員投入至少減少50%。采購成本,超融合產品一般可以做到傳統架構70%。
以下給出使用成本與收益對比實體。


十一.超融合不適合什么場景?
傳統意義上的超融合是適合于各種虛擬化的場景,對于裸金屬服務器就不適合了。所以有一些重負載的應用,在虛擬化都不用的情況下,自然不會考慮超融合。另外,超融合的架構模式決定了計算和存盤資源應該均衡增長,否則就不是非常適合,比如海量的非結構化資料。
不過,近期的一個趨勢是,超融合廠商開始對外提供存盤介面,可以以類似Server SAN或者NAS的方式訪問,所以裸金屬的場景也可以適用了。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/56413.html
標籤:云存儲
