云計算的基本概念和常見測驗點-有解無憂

云計算的定義

對云計算的定義有很多方式，其實每種定義都能反映云計算的一些特點，比較常見的定義如下：

美國國家標準與技術研究院（NIST）：云計算是一種按使用量付費的模式，這種模式提供可用的、便捷的、按需的網路訪問，進入可配置的計算資源共享池（資源包括網路、服務、存盤、應用軟體、服務），這些資源能夠快被快速提供，只需投入很少的管理作業，或與服務進行很少的互動，
劉鵬教授對云計算給出了長、短兩種定義：
長定義是：云計算是一種商業計算模型，它將計算任務分布在大量計算機構成的資源池上，使各種應用系統能夠根據需要獲取計算力、存盤空間和資訊服務，
短定義是：云計算是通過網路按需提供可動態伸縮的廉價計算服務

云計算的特點

并行計算(Parallel Computing)、
分布式計算(Distributed Computing)
網格計算(Grid Computing)
虛擬化(Virtualization)
效用計算(Utility Computing)
將基礎設施作為服務IaaS(Infrastructureas a Service)：消費者通過internet可以從完善的的計算機基礎設施獲取服務（硬體服務器租用）
將平臺作為服務PaaS(Platform as a Service) ：軟體的個性化定制開發
將軟體作為服務SaaS(Software as a Service)：通過internet提供軟體的模式

云化的基本概念

Cloud Native概念：核心改變是應用適合基礎設施，而不是基礎設施適合應用

應用上云

微服務架構：不是開發一個巨大的單體式的應用，而是將應用分解為小的、互相連接的微服務，一個微服務一般完成某個特定的功能，如下單管理、客戶管理等，每個服務都有自己的資料庫，微服務之間的資料傳遞可以通過服務暴露出的API來完成，
Docker: 構建在LXC之上、基于行程容器的輕量級VM，非常適合微服務，

大資料上云

資料上云，一般來說有兩種經典模式：

托管模式：核心是通過云的能力簡化了集群的創建、運維，以Amazon EMR為典型代表，
服務化模式：進一步簡化了大資料的使用，用戶不用關心集群、資源這些事情，只需要將大資料任務提交給大資料云，享受相應的服務即可，經典代表是微軟的Azure Data Lake Analytics，

上云測驗

功能性測驗點

功能測驗：即確保被測系統所提供的服務符合預期，主要包括如下方面：
系統驗證測驗：端到端的測驗
用戶驗收測驗：
互操作性測驗：切換基礎設施，仍然能無縫作業

非功能性測驗點

這些非功能性硬核關鍵點和云計算的特性有著必然的關系，同時也和服務的可靠性，服務的計量和治理有著密切的關系，簡單來說你要保證你的云服務的可靠性，可用性，可管理性，必須具有一些云化后的非功能性指標，因為你業務功能再好用，不可靠，對用戶來說是沒有保障的，如下8個硬核點就是云化的非功能指標，后續一節再分別講述，這些硬核點的的定義以及如何來測驗這些點，特別是第1，第2，第3，這三個缺一不可，否則你的軟體只是搬到云端，并不具備任何云計算的特性，也就是假云，

彈性，也叫自動伸縮

說起彈性，先從常說的云服務器，ecs 說起，它就是Elastic Compute Service的縮寫，是一種處理能力可彈性伸縮的計算服務器，這是從IAAS （更偏硬體資源：CPU,記憶體，磁盤，網路）層來實作彈性，這解決了硬體或是底層資源的彈性;實際從提供云服務的軟體層現來看，還要有軟體自身的彈性，例如，需要根據時間或是其他的策略(基于流量，或是硬體資源的特定基線)橫向擴展，如高峰期，掛號服務需要10個節點才能保證支撐高峰期的并發量，非高峰期，再減少掛號服務節點，騰出計算資源做其他事情，在云上，實作集群節點的擴展是很簡單的事，配置好擴展策略即可，測驗的時候，必須把彈性作為一個check point ,如何驗證，從前面其定義就能明白，這里就不再重復了，現在問題來了，動態擴的服務，如何讓集群感知，且可用呢，請看如下第2項

服務無狀態

接上一個問題，動態擴的服務，如何讓集群感知，且可用呢?讓集群感知有兩個辦法，一是服務在橫擴的時候，向ELB（負載均衡）動態注冊(如果擴展了節點，需要手動配配置并重啟負載均勻相關組件，這不叫彈性)，或是通過服務發現注冊組件來實作，這有很多成熟的技術，這里就不多說明，重點是，新橫擴出來的服務，加到集群后，要讓他能對處提供服務，這要求服務是無狀態的 ( 比如會話session ,或其他背景關系，不依賴服務所在屬主容器，如tomcat ,jetty,weblogic ,iis等)，否則某個請求被路由到新擴的服務節點時，可能會為因為會話或背景關系的問題，導致服務在業務上不可用，測驗的時候，必須把服務無狀態作為一個 check point，如果服務實作方，是通過在負載均衡上通過“ 黏住” 策略，來實作會話共享，的話，有一個大問題，當服務節點減少，或是某些服務節點掛掉時，之前這些服務節的服務的客戶端后續的請求，轉移到其他節點，session 就會丟失，通常做法是，把session或上文下外置在服務執行緒所在容器(tomcat ,jetty,weblogic ,iis等)之外，如memcache 中，redis 中，
如何驗證這個無服務的檢查點呢?假定是一個Web 程式，通過關閉單一節點，再重啟檢查，是否為同一個session，測驗這個完全可以在非云環境來驗證，用一個單單一節點來測驗（非集群模式），比如先登錄，進入到某頁面，且準備做某個對session 有依賴的操作，這時，停下正要操作的功能，先停掉這個節點，然后重啟這個節點，，重啟后再在之前登錄的頁面上，接著做這前的作操作，并沒有提示要重登錄，或是session過期，操作成功，可以驗證；當然也可以用兩個節點來驗證(集群模式)，每個節點上，放兩個相面的頁面，在上面，列印出session id ,以及節點的名稱，先請求這頁面，記下列印的session id 及節點名，關掉任意一個節點，再重繪這頁面，看看列印的session id 一樣不，如一樣，只是節點名變了，說明服務是無狀態的，還有其他方法，這里只是拋磚引玉，提供一下思路，如純后臺API ,只要檢認證資訊是否過期，或是是否是同一個認證資訊，

多租戶支持

既然是云上的服務，必須要求不同的客戶（租戶/單位/組織）都能使用，且互不影響，實作多租戶，通常有兩種隔離方式，邏輯隔離和物理隔離；邏輯隔離指，大家其用一套系統，只是在資料庫層在表中加一個欄位，資料所屬租戶；物理隔離，這每個租戶單獨部一套系統，測驗的時候，必須把多租戶支持作為一個 check point，測驗方法，通過對隔離的闡述，自然就知道如驗證，支不支持多租戶，以及是以什么方式隔離，上面示例中，租戶注冊成功后，呼叫CloudFormation介面，自動部署的云進銷存業務系統，這實際是物理隔離

故障轉移/隔離

云服務，一定會有出故障的時候，為了保政故障產生的影響最小，必須有應對故障的策略，故障轉移也分兩個層面的，，一個是IAAS層的，一個是業務服務自身的故障轉移，如整個系統宕機，或是有故障，利用鏡像，自動重新實體化一個實體，只是網路屬性未變，這是IAAS層面的,在PAAS看來，實際是和之前是無差別的，相當于，傳統方式下，快速啟用冗余或備用的服務器、系統、或者硬體接替它們作業；另一個是軟體層面，業務服務系統，在服務不可用時，支持的重試邏輯，同時支持重試，就要求保持冪等性（簡單說，對同一個資料做同一個操作，做一次和做N次，結果是一樣的），或對出錯的服務進行隔離，不隔離會引發雪蹦效應，或是采用服務降低的錯施，一句話，測驗的時候，必須把故障轉移/隔離作為一個 check point， IAAS層的轉移，只需向云廠商確認即可，基本上云廠商這層面都已實作，軟體方面的故障處理，需要根據隔離策略來執行相應的測驗，細節具體根據具體應用再詳查，主要是不要漏過這個測驗點

服務限流保護

既然是公有云，面向的是所有你的客戶，某些情況下，訪問量會爆增，或是受到惡意的訪問攻擊，這時服務的可靠性，隱定性也必須得到保障，通過對并發訪問/請求進行限制或者一個時間視窗內的請求進行限速來保護系統，一旦達到限制速率則可以拒絕服務或者排隊等待，從而使服務不會引過多的訪問而崩潰,這就是限流，
測驗方法，通過壓測，或是增加到并發量，到系統支持的極限后，系統有沒有因訪問量太大而崩潰，測驗的時候，必須把服務限流保護作為一個 check point

應用安全

服務放云上，面向整個互連網，除了要應對惡意的攻擊，還要防止服務器被劫持，還要保證資料安全，和授權內訪問等等，安全是一個很專業的一個方向，測驗的時候，也必須把安全作為一個 check point, 測驗人員在這方面，只能做一些常規的安全測驗，如SQL 注入，XSS跨站攻擊，敏感資訊是否明文傳輸， API的訪問是否要通過驗證,一些等存級別高的業務，還需要雙向認證,甚至實名認證等，其他的則需要請專業的安全公司進行全面的安全測驗，他們能掃描出系統存在的安全漏洞和不安全的因素，并給出好的整改建議，

呼叫鏈追蹤

這要看服務是否是一個分布式應用，分布式應用中，系統存在互相呼叫的情況，形成一個呼叫鏈，通常一個請求，會引發A組件，呼叫B,組件，B組件呼叫C ，C呼叫D，可能還有更長的呼叫鏈，實話說，呼叫鏈追蹤，有點偏向于運維，在測驗時，分布式環境下，不借助呼叫鏈追蹤有些問題根本沒法定位，比如說，某個請求出錯了，實際是錯呼叫鏈的哪個節點上，或是某個功能很慢，慢在哪，不借助于呼叫鏈追蹤，你都沒辦法跟程式，就算讓研發自己打斷點，也要搞死人的，分布式加集群，同一個服務，每次呼叫時，呼叫鏈都可能不一樣，上云的應用，通常是分布式用，作為測驗人員，也有必要把呼叫鏈追蹤作為一個 check point,才能在分布式場景下，提出定位更準，更專業的問題，而不只在BUG的表像上，開源呼叫鏈追蹤有zipkin,pinpoint，skywalking等，呼叫鏈跟蹤需要研發那邊來集成，測驗這邊要get到這個點和會使用，下圖是昨天用zipkin 的一個截屏示例

可視化服務治理（可觀測，可自動健康檢查，服務優雅關閉等）

服務治理，也是偏運維的東東，他自身的定義，各位可以自行百度；在這里，我只簡單場景上來說明，服務治理的大概意思，你的服務在云上，可靠性要有保障，主要在于預防，不能抓瞎，真正問題發生了，就炸鍋了，需要通過可視化的方式，觀測到服務的狀態，健康狀態，流量情況，回應速度，并發量，資源使用情況等，并根據于些，采用自動或半自動的方式啟動彈性擴展，或是采取隔離，熔斷等措施，以保障服務的可用性，在devOps 大行其道的當下，測驗人員向運維多靠一點不是壞事，會給測驗提供更多靈感和帶來更多測驗手段，云上的服務，服務優雅關閉，順帶提一下，要關閉某個服務時，正在服務中運行相關業務執行緒會同進被關掉，也就意味著這些業務操作肯定要失敗，與之相反服務優雅關閉,指在關閉前，他會拒絕新的進求進來，同時要完成當前的所有業務后，才關閉，有點像銀行的視窗，不接受業務了，但要把當前正辦理的業務處理完，測驗人員以此作為一個 check point ，可用來驗證云服務實作水平的高低，又能為服務的可靠性測驗提代相關測驗手段/方法，這個點也要get 到，

參考文章：

大資料架構詳解從資料獲取到深度學習2016版第9章-大資料云華
https://blog.csdn.net/MYPM_AndyLiu/article/details/90170835
https://blog.csdn.net/weixin_41918841/article/details/95218043

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/233116.html

標籤：其他

上一篇：資料庫系列——MySQL主從復制配置

下一篇：Docker部署MongoDB分片+副本集集群（實戰）