容錯技術是保證系統在某些組成部分出現故障或差錯時仍能正常作業的技術,通常根據不同的系統配置方法而采用相應容錯技術:單機容錯技術 、 雙機熱備份技術和服務器集群技術,
1 單機容錯技術
容錯技術是保證系統在某些組成部分出現故障或差錯時仍能正常作業的技術,系統的故障可分為兩類:一類是 “ 致命的 ” ,不可能自行修復,例如系統的主要部件全部損壞;另一類是區域的,可能被修復,例如部分元件失效 、 線路故障 、 偶然干擾引起的差錯等,
容錯技術正是用于構造一種能夠自動排除非致命性故障的系統,即容錯系統,在單機容錯技術中,提高系統作業可靠性的方法主要有自檢技術和冗馀技術,容錯又有多種形式,如硬體容錯 、 軟體容錯 、 整機容錯等,
1.1 自檢技術
自檢指系統在發生非致命性故障時能自動發現故障和確定故障的性質 、 部位,并自動采取措施更換和隔離產生故障的部件,自檢需采用診斷技術,常用專門程式實作,屬于程式設計的范圍,容錯系統的實作要求系統必須具有重復部件或備份部件,或具有不止一個完成某種功能的通道,因此自檢技術常配合冗馀技術使用,計算機的容錯系統一般都需要應用自檢技術,
1.2 冗余技術
冗馀可分為硬體冗馀(增加硬體) 、 軟體冗馀(增加程式,如同時采用不同演算法或不同人編制的程式) 、 時間冗馀(如指令重復執行 、 程式重復執行) 、 資訊冗馀(如增加資料位)等,
冗馀技術中最常用的兩種方法是重復線路和備份線路,重復線路指用多個相同品種和規格的元件或構件并聯起來,當作一個元件或構件使用,只要有一個不出故障,系統就能夠正常作業,在并聯作業時每一個構件的可靠性概率是互相獨立的,備份線路與重復線路的差別是參加備份的構件并不接入系統,只有在處于作業狀態的構件發生故障后才把輸入和輸出接到備份構件上來,同時切斷故障構件的輸入 、 輸出,容錯技術已獲得廣泛應用,常用于對可靠性要求高的系統,特別是用于危及人身安全的關鍵部位,在這些部位大多采用雙重冗馀,也有采用三重 、 四重甚至五重冗馀的,
現代的大型復雜系統常常是容錯能力很強的系統,容錯技術在計算機中應用得最早 、 最廣泛,
2 雙機熱備份技術
雙機熱備份技術是一種軟硬體結合的較高容錯應用方案,該方案是由兩臺服務器系統和一個外接共享磁盤陣列柜和相應的雙機熱備份軟體組成,其中的外接共享磁盤陣列柜也可以沒有,而是在各自的服務器中采取 RAID ( Redundant Arrayof Independent Disk ,獨立冗馀磁盤陣列)卡,
在這個容錯方案中,作業系統和應用程式安裝在兩臺服務器的本地系統盤上,整個網路系統的資料是通過磁盤陣列集中管理和資料備份的,資料集中管理是通過雙機熱備份系統,將所有站點的資料直接從中央存盤設備讀取和存盤,并由專業人員進行管理,極大地保護了資料的安全性和保密性,用戶的資料存放在外接共享磁盤陣列中,在一臺服務器出現故障時,備機主動替代主機作業,保證網路服務不間斷,
雙機熱備份系統采用 “ 心跳 ” 方法保證主系統與備用系統的聯系,所謂 “ 心跳 ” ,指的是主 、 從系統之間相互按照一定的時間間隔發送通信信號,表明各自系統當前的運行狀態,一旦 “ 心跳 ” 信號表明主機系統發生故障,或者備用系統無法收到主機系統的 “ 心跳 ” 信號,則系統的高可用性管理軟體認為主機系統發生故障,立即將系統資源轉移到備用系統上,備用系統替代主機作業,以保證系統正常運行和網路服務不間斷,
雙機熱備份方案中,根據兩臺服務器的作業方式可以有三種不同的作業模式,即:雙機熱備模式 、 雙機互備模式和雙機雙工模式,
雙機熱備模式即目前通常所說的 active / standby 方式, active 服務器處于作業狀態;而 standby 服務器處于監控準備狀態,服務器資料包括資料庫資料同時往兩臺或多臺服務器寫入(通常各服務器采用 RAID 磁盤陣列卡),保證資料的即時同步,當 active 服務器出現故障時,通過軟體診測或手工方式將 standby 機器激活,保證應用在短時間內完全恢復正常使用,典型應用有證券資金服務器或行情服務器,這是目前采用較多的一種模式,但由于另外一臺服務器長期處于后備的狀態,所以浪費了一部分計算資源,
用戶可以根據系統的重要性及終端用戶對服務中斷的容忍程度決定是否使用雙機熱備份,例如,網路中的用戶最多能容忍多長時間恢復服務,如果服務不能很快恢復會造成什么樣的后果作為是否采用雙機熱備份的根據,對于承擔企業關鍵業務應用的服務器需要極高的穩定性和可用性,并需要提供每周7(天) ×24 (小時)不間斷服務的應用,推薦使用雙機熱備份,
雙機互備模式,是兩個相對獨立的應用在兩臺機器同時運行,但彼此均設為備機,當某一臺服務器出現故障時,另一臺服務器可以在短時間內將故障服務器的應用接管過來,從而保證了應用的持續性,但對服務器的性能要求比較高,
雙機雙工模式是集群的一種形式,兩臺服務器均處于活動狀態,同時運行相同的應用,以保證整體系統的性能,也實作了負載均衡和互為備份,通常使用磁盤柜存盤技術 ,Web 服務器或 FTP 服務器等用此種方式比較多,
3 服務器集群技術
集群技術指一組相互獨立的服務器在網路中組合成為單一的系統作業,并以單一系統的模式加以管理,此單一系統為客戶作業站提供高可靠性的服務,大多數情況下,集群中所有的計算機擁有一個共同的名稱,集群內任一系統上運行的服務可被所有的網路客戶使用,集群必須可以協調管理各分離的構件出現的錯誤和故障,并可透明地向集群中加入構件,
一個集群包含多臺(至少二臺)共享資料存盤空間的服務器,其中任何一臺服務器運行應用時,應用資料被存盤在共享的資料空間內,每臺服務器的作業系統和應用程式檔案存盤在其各自的本地儲存空間上,
集群內各節點服務器通過一個內部局域網相互通信,當一臺節點服務器發生故障時,這臺服務器上所運行的應用程式將在另一節點服務器上被自動接管,當一個應用服務發生故障時,應用服務將被重新啟動或被另一臺服務器接管,當以上的任一故障發生時,客戶都將能很快連接到其他應用服務器上,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/152662.html
標籤:其他
上一篇:JavaWeb開發筆記
下一篇:Linux pyhton錯誤
