主頁 > 軟體設計 > 【大廠求職必看】太強了!Tomcat執行緒模型全網最清晰講解!

【大廠求職必看】太強了!Tomcat執行緒模型全網最清晰講解!

2021-07-29 07:57:32 軟體設計

UNIX系統的I/O模型

同步阻塞I/O、同步非阻塞I/O、I/O多路復用、信號驅動I/O和異步I/O,

什么是 I/O

就是計算機記憶體與外部設備之間拷貝資料的程序,

為什么需要 I/O

CPU訪問記憶體的速度遠遠高于外部設備,因此CPU是先把外部設備的資料讀到記憶體里,然后再進行處理,
當你的程式通過CPU向外部設備發出一個讀指令,資料從外部設備拷貝到記憶體需要一段時間,這時CPU沒事干,你的程式是:

  • 主動把CPU讓給別人
  • 還是讓CPU不停查:資料到了嗎?資料到了嗎?…

這就是I/O模型要解決的問題,

Java I/O模型

對于一個網路I/O通信程序,比如網路資料讀取,會涉及兩個物件:

  • 呼叫這個I/O操作的用戶執行緒
  • 作業系統內核

一個行程的地址空間分為用戶空間和內核空間,用戶執行緒不能直接訪問內核空間,
當用戶執行緒發起I/O操作后(Selector發出的select呼叫就是一個I/O操作),網路資料讀取操作會經歷兩個步驟:

  1. 用戶執行緒等待內核將資料從網卡拷貝到內核空間
  2. 內核將資料從內核空間拷貝到用戶空間

有人會好奇,內核資料從內核空間拷貝到用戶空間,這樣會不會有點浪費?
畢竟實際上只有一塊記憶體,能否直接把記憶體地址指向用戶空間可以讀取?
Linux中有個叫mmap的系統呼叫,可以將磁盤檔案映射到記憶體,省去了內核和用戶空間的拷貝,但不支持網路通信場景!

各種I/O模型的區別就是這兩個步驟的方式不一樣,

同步阻塞I/O

用戶執行緒發起read呼叫后就阻塞了,讓出CPU,內核等待網卡資料到來,把資料從網卡拷貝到內核空間,接著把資料拷貝到用戶空間,再把用戶執行緒叫醒,

同步非阻塞I/O

用戶行程主動發起read呼叫,這是個系統呼叫,CPU由用戶態切換到內核態,執行內核代碼,
內核發現該socket上的資料已到內核空間,將用戶執行緒掛起,然后把資料從內核空間拷貝到用戶空間,再喚醒用戶執行緒,read呼叫回傳,

用戶執行緒不斷發起read呼叫,資料沒到內核空間時,每次都回傳失敗,直到資料到了內核空間,這次read呼叫后,在等待資料從內核空間拷貝到用戶空間這段時間里,執行緒還是阻塞的,等資料到了用戶空間再把執行緒叫醒,

I/O多路復用

用戶執行緒的讀取操作分成兩步:

  • 執行緒先發起select呼叫,問內核:資料準備好了嗎?
  • 等內核把資料準備好了,用戶執行緒再發起read呼叫
    在等待資料從內核空間拷貝到用戶空間這段時間里,執行緒還是阻塞的

為什么叫I/O多路復用?
因為一次select呼叫可以向內核查多個資料通道(Channel)的狀態,

NIO API可以不用Selector,就是同步非阻塞,使用了Selector就是IO多路復用,

異步I/O

用戶執行緒發起read呼叫的同時注冊一個回呼函式,read立即回傳,等內核將資料準備好后,再呼叫指定的回呼函式完成處理,在這個程序中,用戶執行緒一直沒有阻塞,

信號驅動I/O

可以把信號驅動I/O理解為“半異步”,非阻塞模式是應用不斷發起read呼叫查詢資料到了內核沒有,而信號驅動把這個程序異步了,應用發起read呼叫時注冊了一個信號處理函式,其實是個回呼函式,資料到了內核后,內核觸發這個回呼函式,應用在回呼函式里再發起一次read呼叫去讀內核的資料,
所以是半異步,

NioEndpoint組件

Tomcat的NioEndpoint實作了I/O多路復用模型,

作業流程

Java的多路復用器的使用:

  1. 創建一個Selector,在其上注冊感興趣的事件,然后呼叫select方法,等待感興趣的事情發生
  2. 感興趣的事情發生了,比如可讀了,就創建一個新的執行緒從Channel中讀資料

NioEndpoint包含LimitLatch、Acceptor、Poller、SocketProcessor和Executor共5個組件,

LimitLatch

連接控制器,控制最大連接數,NIO模式下默認是8192,

當連接數到達最大時阻塞執行緒,直到后續組件處理完一個連接后將連接數減1,
到達最大連接數后,os底層還是會接收客戶端連接,但用戶層已不再接收,
核心代碼:

public class LimitLatch {
    private class Sync extends AbstractQueuedSynchronizer {
     
        @Override
        protected int tryAcquireShared() {
            long newCount = count.incrementAndGet();
            if (newCount > limit) {
                count.decrementAndGet();
                return -1;
            } else {
                return 1;
            }
        }

        @Override
        protected boolean tryReleaseShared(int arg) {
            count.decrementAndGet();
            return true;
        }
    }

    private final Sync sync;
    private final AtomicLong count;
    private volatile long limit;
    
    // 執行緒呼叫該方法,獲得接收新連接的許可,執行緒可能被阻塞
    public void countUpOrAwait() throws InterruptedException {
      sync.acquireSharedInterruptibly(1);
    }

    // 呼叫這個方法來釋放一個連接許可,則前面阻塞的執行緒可能被喚醒
    public long countDown() {
      sync.releaseShared(0);
      long result = getCount();
      return result;
   }
}

用戶執行緒呼叫LimitLatch#countUpOrAwait拿到鎖,若無法獲取,則該執行緒會被阻塞在AQS佇列,
AQS又是怎么知道是阻塞還是不阻塞用戶執行緒的呢?
由AQS的使用者決定,即內部類Sync決定,因為Sync類重寫了AQS#tryAcquireShared():若當前連接數count < limit,執行緒能獲取鎖,回傳1,否則回傳-1,

如何用戶執行緒被阻塞到了AQS的佇列,由Sync內部類決定什么時候喚醒,Sync重寫AQS#tryReleaseShared(),當一個連接請求處理完了,又可以接收新連接,這樣前面阻塞的執行緒將會被喚醒,

LimitLatch用來限制應用接收連接的數量,Acceptor用來限制系統層面的連接數量,首先是LimitLatch限制,應用層處理不過來了,連接才會堆積在作業系統的Queue,而Queue的大小由acceptCount控制,

Acceptor

Acceptor實作了Runnable介面,因此可以跑在單獨執行緒里,在這個死回圈里呼叫accept接收新連接,一旦有新連接請求到達,accept方法回傳一個Channel物件,接著把Channel物件交給Poller去處理,

一個埠號只能對應一個ServerSocketChannel,因此這個ServerSocketChannel是在多個Acceptor執行緒之間共享的,它是Endpoint的屬性,由Endpoint完成初始化和埠系結,
可以同時有過個Acceptor呼叫accept方法,accept是執行緒安全的,

初始化

protected void initServerSocket() throws Exception {
    if (!getUseInheritedChannel()) {
        serverSock = ServerSocketChannel.open();
        socketProperties.setProperties(serverSock.socket());
        InetSocketAddress addr = new InetSocketAddress(getAddress(), getPortWithOffset());

        serverSock.socket().bind(addr,getAcceptCount());
    } else {
        // Retrieve the channel provided by the OS
        Channel ic = System.inheritedChannel();
        if (ic instanceof ServerSocketChannel) {
            serverSock = (ServerSocketChannel) ic;
        }
        if (serverSock == null) {
            throw new IllegalArgumentException(sm.getString("endpoint.init.bind.inherited"));
        }
    }
    // 阻塞模式
    serverSock.configureBlocking(true); //mimic APR behavior
}
  • bind方法的 getAcceptCount() 引數表示os的等待佇列長度,當應用層的連接數到達最大值時,os可以繼續接收連接,os能繼續接收的最大連接數就是這個佇列長度,可以通過acceptCount引數配置,默認是100

ServerSocketChannel通過accept()接受新的連接,accept()方法回傳獲得SocketChannel物件,然后將SocketChannel物件封裝在一個PollerEvent物件中,并將PollerEvent物件壓入Poller的Queue里,
這是個典型的“生產者-消費者”模式,Acceptor與Poller執行緒之間通過Queue通信,

Poller

本質是一個Selector,也跑在單獨執行緒里,

Poller在內部維護一個Channel陣列,它在一個死回圈里不斷檢測Channel的資料就緒狀態,一旦有Channel可讀,就生成一個SocketProcessor任務物件扔給Executor去處理,

內核空間的接收連接是對每個連接都產生一個channel,該channel就是Acceptor里accept方法得到的scoketChannel,后面的Poller在用selector#select監聽內核是否準備就緒,才知道監聽內核哪個channel,

維護了一個 Queue:

SynchronizedQueue的方法比如offer、poll、size和clear都使用synchronized修飾,即同一時刻只有一個Acceptor執行緒讀寫Queue,
同時有多個Poller執行緒在運行,每個Poller執行緒都有自己的Queue,
每個Poller執行緒可能同時被多個Acceptor執行緒呼叫來注冊PollerEvent,
Poller的個數可以通過pollers引數配置,

職責

  • Poller不斷的通過內部的Selector物件向內核查詢Channel狀態,一旦可讀就生成任務類SocketProcessor交給Executor處理

  • Poller回圈遍歷檢查自己所管理的SocketChannel是否已超時,若超時就關閉該SocketChannel

SocketProcessor

Poller會創建SocketProcessor任務類交給執行緒池處理,而SocketProcessor實作了Runnable介面,用來定義Executor中執行緒所執行的任務,主要就是呼叫Http11Processor組件處理請求:Http11Processor讀取Channel的資料來生成ServletRequest物件,

Http11Processor并非直接讀取Channel,因為Tomcat支持同步非阻塞I/O、異步I/O模型,在Java API中,對應Channel類不同,比如有AsynchronousSocketChannel和SocketChannel,為了對Http11Processor屏蔽這些差異,Tomcat設計了一個包裝類叫作SocketWrapper,Http11Processor只呼叫SocketWrapper的方法去讀寫資料,

Executor

執行緒池,負責運行SocketProcessor任務類,SocketProcessor的run方法會呼叫Http11Processor來讀取和決議請求資料,我們知道,Http11Processor是應用層協議的封裝,它會呼叫容器獲得回應,再把回應通過Channel寫出,

Tomcat定制的執行緒池,它負責創建真正干活的作業執行緒,就是執行SocketProcessor#run,即決議請求并通過容器來處理請求,最終呼叫Servlet,

Tomcat的高并發設計

高并發就是能快速地處理大量請求,需合理設計執行緒模型讓CPU忙起來,盡量不要讓執行緒阻塞,因為一阻塞,CPU就閑了,
有多少任務,就用相應規模執行緒數去處理,
比如NioEndpoint要完成三件事情:接收連接、檢測I/O事件和處理請求,關鍵就是把這三件事情分別定制執行緒數處理:

  • 專門的執行緒組去跑Acceptor,并且Acceptor的個數可以配置
  • 專門的執行緒組去跑Poller,Poller的個數也可以配置
  • 具體任務的執行也由專門的執行緒池來處理,也可以配置執行緒池的大小

總結

I/O模型是為了解決記憶體和外部設備速度差異,

  • 所謂阻塞或非阻塞是指應用程式在發起I/O操作時,是立即回傳還是等待
  • 同步和異步,是指應用程式在與內核通信時,資料從內核空間到應用空間的拷貝,是由內核主動發起還是由應用程式來觸發,

Tomcat#Endpoint組件的主要作業就是處理I/O,而NioEndpoint利用Java NIO API實作了多路復用I/O模型,
讀寫資料的執行緒自己不會阻塞在I/O等待上,而是把這個作業交給Selector,

當客戶端發起一個HTTP請求時,首先由Acceptor#run中的

socket = endpoint.serverSocketAccept();

接收連接,然后傳遞給名稱為Poller的執行緒去偵測I/O事件,Poller執行緒會一直select,選出內核將資料從網卡拷貝到內核空間的 channel(也就是內核已經準備好資料)然后交給名稱為Catalina-exec的執行緒去處理,這個程序也包括內核將資料從內核空間拷貝到用戶空間這么一個程序,所以對于exec執行緒是阻塞的,此時用戶空間(也就是exec執行緒)就接收到了資料,可以決議然后做業務處理了,

參考

  • https://blog.csdn.net/historyasamirror/article/details/5778378

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/290703.html

標籤:其他

上一篇:資料可視化----ECharts初體驗(一)

下一篇:C語言實作井字棋

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more