1什么是分布式系統?
??在《分布式系統原理與范型》一書中有如下定義:“分布式系統是若干獨立計算機的集合,這些計算機對于用戶來說就像單個相關系統”;

??分布式系統是由一組通過網路進行通信、為了完成共同的任務而協調作業的計算機節點組成的系統,分布式系統的出現是為了用廉價的、普通的機器完成單個計算機無法完成的計算、存盤任務,其目的是利用更多的機器,處理更多的資料,
分布式系統(distributed system)是建立在網路之上的軟體系統,
??首先需要明確的是,只有當單個節點的處理能力無法滿足日益增長的計算、存盤任務的時候,且硬體的提升(加記憶體、加磁盤、使用更好的CPU)高昂到得不償失的時候,應用程式也不能進一步優化的時候,我們才需要考慮分布式系統,因為,分布式系統要解決的問題本身就是和單機系統一樣的,而由于分布式系統多節點、通過網路通信的拓撲結構,會引入很多單機系統沒有的問題,為了解決這些問題又會引入更多的機制、協議,帶來更多的問題,,,
Dubbo檔案
隨著互聯網的發展,網站應用的規模不斷擴大,常規的垂直應用架構已無法應對,分布式服務架構以及流動計算架構勢在必行,急需一個治理系統確保架構有條不紊的演進,
在Dubbo的官網檔案有這樣一張圖

單一應用架構
??當網站流量很小時,只需一個應用,將所有功能都部署在一起,以減少部署節點和成本,此時,用于簡化增刪改查作業量的資料訪問框架(ORM)是關鍵,

適用于小型網站,小型管理系統,將所有功能都部署到一個功能里,簡單易用,
缺點:
??1、性能擴展比較難
??2、協同開發問題
??3、不利于升級維護
垂直應用架構
??當訪問量逐漸增大,單一應用增加機器帶來的加速度越來越小,將應用拆成互不相干的幾個應用,以提升效率,此時,用于加速前端頁面開發的Web框架(MVC)是關鍵,

??通過切分業務來實作各個模塊獨立部署,降低了維護和部署的難度,團隊各司其職更易管理,性能擴展也更方便,更有針對性,
缺點:公用模塊無法重復利用,開發性的浪費
分布式服務架構
??當垂直應用越來越多,應用之間互動不可避免,將核心業務抽取出來,作為獨立的服務,逐漸形成穩定的服務中心,使前端應用能更快速的回應多變的市場需求,此時,用于提高業務復用及整合的分布式服務框架(RPC)是關鍵,

流動計算架構
??當服務越來越多,容量的評估,小服務資源的浪費等問題逐漸顯現,此時需增加一個調度中心基于訪問壓力實時管理集群容量,提高集群利用率,此時,用于提高機器利用率的資源調度和治理中心(SOA)[ Service Oriented Architecture]是關鍵,

2什么是RPC?
http: 通信協議
rpc:通信協議

??RPC【Remote Procedure Call】是指遠程程序呼叫,是一種行程間通信方式,他是一種技術的思想,而不是規范,它允許程式呼叫另一個地址空間(通常是共享網路的另一臺機器上)的程序或函式,而不用程式員顯式編碼這個遠程呼叫的細節,即程式員無論是呼叫本地的還是遠程的函式,本質上撰寫的呼叫代碼基本相同,
??也就是說兩臺服務器A,B,一個應用部署在A服務器上,想要呼叫B服務器上應用提供的函式/方法,由于不在一個記憶體空間,不能直接呼叫,需要通過網路來表達呼叫的語意和傳達呼叫的資料,為什么要用RPC呢?就是無法在一個行程內,甚至一個計算機內通過本地呼叫的方式完成的需求,比如不同的系統間的通訊,甚至不同的組織間的通訊,由于計算能力需要橫向擴展,需要在多臺機器組成的集群上部署應用,RPC就是要像呼叫本地的函式一樣去調遠程函式;
RPC基本原理

步驟決議:

RPC兩個核心模塊:通訊,序列化,

3如何給老婆解釋什么是RPC
- 一個陽光明媚的早晨,老婆又在翻看我訂閱的技術雜志,
- “老公,什么是RPC呀,為什么你們程式員那么多黑話!”,老婆還是一如既往的好奇,
- “RPC,就是Remote Procedure Call的簡稱呀,翻譯成中文就是遠程程序呼叫嘛”,我一邊看著書,一邊漫不經心的回答著,
- “啥?你在說啥?誰不知道翻譯成中文是什么意思?你個廢柴,快給我滾去洗碗!”
- “我去,,,”,我如夢初醒,我對面坐著的可不是一個程式員,為了不去洗碗,我瞬間調動起全部腦細胞,星辰大海在我腦中匯聚,靈感涌現…
- "是這樣,遠程程序呼叫,自然是相對于本地程序呼叫來說的嘛,
- “嗯哼,那先給老娘講講,本地程序呼叫是啥子?”
- “本地程序呼叫,就好比你現在在家里,你要想洗碗,那你直接把碗放進洗碗機,打開洗碗機開關就可以洗了,這就叫本地程序呼叫,”
- “哎呦,我可不干,那啥是遠程程序呼叫?”
- “遠程嘛,那就是你現在不在家,跟姐妹們浪去了,突然發現碗還沒洗,打了個電話過來,叫我去洗碗,這就是遠程程序呼叫啦”,多么通俗易懂的解釋,我真是天才!
- “哦!我明白了”,說著,老婆開始收拾包包,
- “你這是干啥去哦”
- “我?我要出門浪去呀,待會記得接收我的遠程呼叫哦,哦不,咱們要專業點,應該說,待會記得接收我的RPC哦!
4什么是Dubbo
??是一個Jar包
??Apache Dubbo 是一款高性能、輕量級的開源Java RPC框架,它提供了三大核心能力:面向介面的遠程方法呼叫,智能容錯和負載均衡,以及服務自動注冊和發現,
dubbo官網 http://dubbo.apache.org/zh-cn/index.html
??1.了解Dubbo的特性
??2.查看官方檔案
dubbo基本概念

??專業的事,交給專業的人來做~不靠譜!
??服務提供者(Provider):暴露服務的服務提供方,服務提供者在啟動時,向注冊中心注冊自己提供的服務,
??服務消費者(Consumer):呼叫遠程服務的服務消費方,服務消費者在啟動時,向注冊中心訂閱自己所需的服務,服務消費者,從提供者地址串列中,基于軟負載均衡演算法,選一臺提供者進行呼叫,如果呼叫失敗,再選另一臺呼叫,
??注冊中心(Registry):注冊中心回傳服務提供者地址串列給消費者,如果有變更,注冊中心將基于長連接推送變更資料給消費者
??監控中心(Monitor):服務消費者和提供者,在記憶體中累計呼叫次數和呼叫時間,定時每分鐘發送一次統計資料到監控中心
呼叫關系說明
- 服務容器負責
啟動,加載,運行服務提供者, - 服務
提供者在啟動時,向注冊中心注冊自己提供的服務, - 服務
消費者在啟動時,向注冊中心訂閱自己所需的服務, - 注冊中心回傳服務提供者地址串列給消費者,如果有變更,注冊中心將基于長連接推送變更資料給消費者,
- 服務消費者,從提供者地址串列中,基于軟負載均衡演算法,選一臺提供者進行呼叫,如果呼叫失敗,再選另一臺呼叫,
- 服務消費者和提供者,在記憶體中累計呼叫次數和呼叫時間,定時每分鐘發送一次統計資料到監控中心,
5什么是zookeeper
產生背景
??當今是個分布式、集群、云計算等名詞滿天飛的時代,造成這種局面的一個重要因素就是,單一機器的處理能力已經不能滿足我們的需求,不得不采用由多臺機器組成的服務集群,服務集群對外提供服務的程序中,可以分解處理壓力,在一定程度上打破性能瓶頸,并提高服務的可用性(不會因為一臺機器宕機而造成服務不可用),

??上圖中有三臺機器,每臺機器跑同樣的一個應用程式,然后我們將這三臺機器通過網路將其連接起來,構成一個系統來為用戶提供服務,對用戶來說這個系統的架構是透明的,他感覺不到這個系統是一個什么樣的架構,那么我們就可以把這種系統稱作一個分布式系統,
那么,問題來了:
??1.程式的運行往往依賴很多組態檔,比如資料庫地址、黑名單控制、服務地址串列等,而且有些配置資訊需要頻繁地進行動態變更,這時候怎么保證所有機器共享的配置資訊保持一致?
??2.如果有一臺機器掛掉了,其他機器如何感知到這一變化并接管任務?如果用戶激增,需要增加機器來緩解壓力,如何做到不重啟集群而完成機器的添加?
??3.用戶數量增加或者減少,會出現有的機器資源使用率繁忙,有的卻空閑,如何讓每臺機器感知到其他機器的負載狀態從而實作負載均衡?
??4.在一臺機器上要多個行程或者多個執行緒操作同一資源比較簡單,因為可以有大量的狀態資訊或者日志資訊提供保證,比如兩個A和B行程同時寫一個檔案,加鎖就可以實作,但是分布式系統怎么辦?需要一個三方的分配鎖的機制,幾百臺worker都對同一個網路中的檔案寫操作,怎么協同?還有怎么保證高效的運行?
??除了上面列舉的幾種,還有很多細思極恐的問題,分布式系統到底有多然人抓狂,可以想想你第一次接觸多執行緒的感覺;
計劃中的多執行緒

現實中的多執行緒

分布式系統可以看作多執行緒的N級加強版……
ZooKeeper的前世今生
??分布式系統的很多難題,都是由于缺少協調機制造成的,
??目前,在分布式協調技術方面做得比較好的就是Google的Chubby還有Apache的ZooKeeper,有人會問既然有了Chubby為什么還要弄一個ZooKeeper,難道Chubby做得不夠好嗎?主要是Chubby是非開源的,Google自家用,后來雅虎模仿Chubby開發出了ZooKeeper,也實作了類似的分布式鎖的功能,并且將ZooKeeper作為一種開源的程式捐獻給了Apache,那么這樣就可以使用ZooKeeper所提供鎖服務,而且在分布式領域久經考驗,它的可靠性,可用性都是經過理論和實踐的驗證的,

??至于這個神器為什么叫ZooKeeper,與外國人一貫的幽默精神有關,
??眾所周知,外國人喜歡給用一個動物作為吉祥物,在IT界也不例外,比如,負責大資料作業的Hadoop是一個黃色的大象;負責資料倉庫的Hive是一個虛擬蜂巢;負責資料分析的Apache Pig是一頭聰明的豬;負責管理web容器的tomcat是一只雄貓……那好,負責分布式協調作業的角色就叫ZooKeeper(動物園飼養員)吧,
ZooKeeper能干什么
官方說辭是:
??ZooKeeper 分布式服務框架是Apache Hadoop 的一個子專案,它主要是用來解決分布式應用中經常遇到的一些資料管理問題,如:統一命名服務、狀態同步服務、集群管理、分布式應用配置項的管理等,簡化分布式應用協調及其管理的難度,提供高性能的分布式服務,ZooKeeper的目標就是封裝好復雜 易出錯的關鍵服務,將簡單易用的介面和性能高效、功能穩定的系統提供給用戶,
ZooKeeper在一致性、可用性、容錯性的保證,也是ZooKeeper的成功之處,它獲得的一切成功都與它采用的協議——Zab協議是密不可分的,
??為了實作前面提到的各種服務,比如分布式鎖、配置維護、組服務等,ZooKeeper設計了一種新的資料結構——Znode,然后在該資料結構的基礎上定義了一些原語,也就是一些關于該資料結構的一些操作,有了這些資料結構和原語還不夠,因為ZooKeeper作業在分布式環境下,服務是通過訊息以網路的形式發送給分布式應用程式,所以還需要一個通知機制——Watcher機制,總結一下,ZooKeeper所提供的服務主要是通過:資料結構 + 原語 + watcher機制,三個部分來實作的,
6安裝dubbo-admin
??是一個監控管理后臺~查看我們注冊了哪些服務,哪些服務被消費了
??dubbo本身并不是一個服務軟體,它其實就是一個jar包,能夠幫你的java程式連接到zookeeper,并利用zookeeper消費、提供服務,
??但是為了讓用戶更好的管理監控眾多的dubbo服務,官方提供了一個可視化的監控程式dubbo-admin,不過這個監控即使不裝也不影響使用,
這里來安裝一下:
下載dubbo-admin
地址 :https://github.com/apache/dubbo-admin/tree/master



解壓進入目錄
修改 dubbo-admin\src\main\resources \application.properties 指定zookeeper地址


在專案目錄下打包dubbo-admin
清除并打包
mvn clean package -Dmaven.test.skip=true


打包完成

啟動jar 包

記得啟動zookeeper

訪問
http://localhost:7001/

用戶名和密碼都是root

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/400490.html
標籤:其他
上一篇:寫在2022第一天 —— 位元組面試經驗、2021的年終總結
下一篇:實時數倉分層之DWM存在的意義
