主頁 > 軟體設計 > 物聯網海量設備心跳注冊,脫網清除——多執行緒高并發互斥鎖落地

物聯網海量設備心跳注冊,脫網清除——多執行緒高并發互斥鎖落地

2020-09-11 05:47:46 軟體設計

物聯網海量設備心跳注冊,脫網清除——多執行緒高并發互斥鎖落地

目錄

  • 物聯網海量設備心跳注冊,脫網清除——多執行緒高并發互斥鎖落地
  • 1.應用背景
  • 2.整體框架
    • 2.1.心跳注冊框架
      • 2.1.1.海量設備
      • 2.1.2.心跳上報Handler流程
    • 2.2.脫網清理框架
      • 2.2.1.激活字典表清理脫網設備方法
      • 2.2.2.脫網清理流程圖
  • 3.多執行緒與高并發說明
    • 3.1.多執行緒說明
    • 3.2.高并發說明
  • 4.多執行緒高并發造成的例外現象
    • 4.1.空參考
    • 4.2.字典表里元素賦值不成功
    • 4.3.統計設備總數不正確
  • 5.分析例外原因
    • 5.1.造成空參考的原因
    • 5.2.設備IP賦值不成功原因
    • 5.3.統計設備總數不正確原因
  • 6.解決思路
  • 7.代碼實作
  • 8.小結

1.應用背景

在物聯網應用場景中,需要維護很多個設備的連接,比如基于TCP socket通信的長連接,目的是為了獲取設備采集的資訊,反向控制設備的數字開關或者模擬量,我們把這些TCP長連接都放入了基于執行緒安全的ConcurrentDictionary激活字典表中,IP地址作為key,設備箱領域模型作為value,我們需要把激活設備箱的字典表維護好,需要將超時沒有心跳的設備,我們可以稱之為脫網設備,給清理出激活字典表,寫入到脫網告警字典表中去,當脫網設備下次再有心跳時,可以再次移入到激活字典表中,從而再產生恢復告警,進行一系列其他動作,

2.整體框架

2.1.心跳注冊框架

2.1.1.海量設備

因為要模擬海量設備的TCP場景,我們利用模擬器生成了12000臺模擬設備,8臺真實設備,

2.1.2.心跳上報Handler流程

詳細心跳上報流程詳見上述框架圖

  • 第一次建立TCP長連接,并且上報心跳報文;
  • socket快取會先處理TCP中存在的粘包,具體方法可參見此篇博文 TCP粘包處理現象及其解決方案——基于NewLife.Net網路庫的管道式幀長粘包處理方法
  • 然后會觸發OnReceive中的e事件,從而傳入粘包處理后的message;
  • 判斷包有效性,因為這方面比較簡單,根據不同協議寫一個類來處理即可,這里不再展開;
  • 包有效載荷的CRC判斷,具體實作可參見此篇博文 基于Modbus三種CRC16校驗方法的性能對比;
  • 包型別決議(這里特指決議出心跳包);
  • 心跳包決議,具體可參見這兩篇博文,深入淺出C#結構體——封裝以太網心跳包的結構為例, 類與結構體性能對比測驗——以封裝網路心跳包為例
  • 最終將設備新增激活字典表(第一次心跳)或者在激活字典表重繪心跳時間(非第一次心跳),

突然發現我可以寫一個物聯網的采集系統的系列了,組織一個目錄,希望自己堅持下去吧,

2.2.脫網清理框架

2.2.1.激活字典表清理脫網設備方法

原理很簡單,遍歷字典表中超過設定的檢測周期,篩選到一個字典的IEnumerable中去,然后在激活字典表中洗掉對應超時key(這里就是指IP地址)即可,當然這里的_internal周期可以*N,多個周期,自行在組態檔中設定即可,組態檔如下:

 "ipboxNumStaticInternal": 12
    public static void DeleteDeadBoxFromActiveBox(in _internal)
    {
        {
            var outTime = DateTime.Now.AddSeconds(-_internal);
            var iboxTimeOutList = iboxActiveDictionary.Where(q => (outTime > q.Value.UpdateTime));//.Select(x=> iboxActiveDictionary[x.Key]) ;
            foreach (var item in iboxTimeOutList)
            {
                iboxActiveDictionary.Remove(item.Key);
            }               
        }
    }

2.2.2.脫網清理流程圖

這里主要開啟了一個系統定時器,主動會去呼叫清理脫網設備方法,呼叫時間間隔即ipboxNumStaticInternal,代碼如下:

    public void systemTimerStart()
    {
        var interval = ReadTheInternalFromSetting();
        _systemTimer = new Timer(state =>
        {               
            IBoxActiveDicManager.DeleteDeadBoxFromActiveBo(_internal);
            Console.WriteLine("{1},激活設備數量:{0}\n",IBoxActiveDicManager.iboxActiveDictionary.Count,DateTime.Now);
        }, null, interval, interval);
        Console.WriteLine("PemsCom采集系統時鐘已經開啟");
        LoggerHelper.Info("PemsCom采集系統時鐘已經開啟");
    }

    /// <summary>
    /// 組態檔讀入時間間隔方法
    /// </summary>
    /// <returns></returns>
    private int ReadTheInternalFromSetting()
    {
        _internal = int.Parse(Appsettings.app(new string[] {"ipboxNumStaticInternal" }));
        Console.WriteLine("PemsCom采集系統時鐘配置引數已經讀");
        LoggerHelper.Info("PemsCom采集系統時鐘配置引數已經讀");
        return Convert.ToInt32(TimeSpan.FromSecond(_internal).TotalMilliseconds);
    }

3.多執行緒與高并發說明

3.1.多執行緒說明

這里會有很多的執行緒讓CPU來輪片執行,比如:

  • 12008個Receive事件觸發執行緒;
  • 定時清除脫網設備執行緒;
  • 主執行緒,監控命令列輸入,并執行對應的命令;

舉個實際的例子,以圖為證

12008臺設備,每秒處理接受網路包的峰峰值是9218個包,就是在某一秒,CPU共輪片執行了9218個執行緒,比如是雙核4執行緒的,則9218/4=2304.5,即CPU在1秒輪片執行了2305次,即0.43毫秒就輪片執行一次,

3.2.高并發說明

其實3.1已經解釋了高并發,在某一秒,需要處理的接收事件有接近1萬件,而這一時刻的執行順序是無序的,9218里的這么多執行緒,我們不知道哪個先執行,哪個后執行,如果不認為地加一些邏輯控制,比如我們今天要介紹的互斥鎖,就會出現一些例外現象,

4.多執行緒高并發造成的例外現象

這里只描述現象,原因會在下面5.分析例外原因 做具體描述,

4.1.空參考

例外所在的位置:心跳處理類如下,

    public class HeartHandler
    {
        static string _deviceIndex = Appsettings.app(new string[] { "DeviceIndex" });
        private static IBoxActive iboxActive;
        public static void Register(TcpHeartPacket heartPacket,int sessId)
        {
            UInt32 IP;
            UInt64 mac;
            if (_deviceIndex == "IP")
            {
         
                IP =(UInt32)BitConverter.ToUInt32(heartPacket.IP, 0);
                if (IBoxActiveDicManager.GetBoxActive(IP, out iboxActive) != true)
                {       
                    IBoxActiveDicManager.iboxActiveDictionary.TryAdd(IP, iboxActive);
                    iboxActive.SessID = sessId;
                }
               
            }
            else
            {
                 mac = (UInt64)BitConverter.ToUInt64(heartPacket.Mac, 0);
                if (IBoxActiveDicManager.GetBoxActive(mac, out iboxActive) != true)
                {
                    IBoxActiveDicManager.iboxActiveDictionary.TryAdd(mac, iboxActive);
                    iboxActive.SessID = sessId;
                }
            }

            //參考型別,智能指標,使用方便
            iboxActive.UpdateTime = DateTime.Now;

           
        }
    }

4.2.字典表里元素賦值不成功

        /// <summary>
        /// 查詢激活設備箱字典中是否有存在上報的設備箱,
        /// 存在回傳true,不存在回傳false,并且新建好設備箱模型
        /// </summary>
        /// <param name="mac"></param>
        /// <param name="iboxActive"></param>
        /// <returns></returns>
        public static bool GetBoxActive(UInt32 IP, out IBoxActive iboxActive)
        {
 
            if (iboxActiveDictionary.TryGetValue(IP, outiboxActive))
            {
                return true;
            }
            
            iboxActive = new IBoxActive();
           
            iboxActive.IP = IP;

            if (iboxActive.IP != IP)
            {
                LoggerHelper.Error(string.Format("實體化賦值不成功.iboxActive.IP:{0};IP{1}", iboxActive.IP, IP));
            }

            return false;
        }

有沒有感覺很奇怪,上一句都賦值了,下一句對比就不相等,但是在多執行緒大并發里就是有這種可能,下面會詳細分析,

4.3.統計設備總數不正確

因為12008臺大并發時很容易出錯,所以改成了1000臺,如下統計資料會有出錯情況,這同樣也是因為多執行緒高并發引起的錯誤,

5.分析例外原因

5.1.造成空參考的原因

其實第4的三點原因都是同一個原因造成,所以在5.1會詳細闡述,5.2,,5.3只做簡單闡述,這里敲下黑板,分析多執行緒高并發的例外問題,程式運行的特點就是見縫就插,就像個老司機一樣,概括起來就是執行緒與執行緒之間的無序性,比如我們設備心跳執行緒正在更新設備心跳時間的時候,脫網清理執行緒就把該設備給清理掉了,如此一來,時間沒法賦值給空物件(已被脫網執行緒給清理),因此只能報空參考例外,對沒錯,就是這么簡單,耗費了我很長時間去debug跟思考這個例外,

5.2.設備IP賦值不成功原因

同樣,在創建了設備實體之后,IP賦值完成,剛好脫網清除設備執行緒運行清除了設備,當對比的時候,參考原來的地址,字典的原來地址已經存了其他設備箱的IP,所以IP地址不相等,

5.3.統計設備總數不正確原因

原因其實是5.2造成的,沒法成功注冊,當然數量就不對啦,

6.解決思路

就是當我在創建激活設備實體(第一次心跳注冊)或者更新心跳時間的時候(非第一次注冊),不要讓無序的脫網清除執行緒運行,敲黑板:就是保證心跳處理注冊程序的原子性,對,其實這里很像關系型資料庫的事務,原子性,原子性就是對抗程式無序造成例外的有力武器,我們可以在注冊心跳處理方法上加個互斥鎖,讓編譯器跟運行時去安排更加合理的執行順序,

7.代碼實作

代碼很簡單,

    //定義一把鎖
    public static Mutex activeIpboxDicMutex = new Mutex();
    //設備箱注冊加鎖,例外全部消除
    IBoxActiveDicManager.activeIpboxDicMWaitOne();
    HeartHandler.Register(tcpHeartPacsessionId);
    IBoxActiveDicManager.activeIpboxDicMReleaseMutex();

這里插入一下事務的使用,也是很類似的,把我們的主業務加中中間,類比方便大家理解記憶,就像夾心餅干(瞎扯),

            unitOfWork.BeginTransaction();

            // Adds new device
            unitOfWork.DeviceRepository.Add(device);

            // Commit transaction
            unitOfWork.Commit();

當然也可以給設備箱脫網清除執行緒加鎖,

     IBoxActiveDicManager.activeIpboxDicMutex.WaitOne();
     IBoxActiveDicManager.DeleteDeadBoxFromActiveBox(_internal);
     IBoxActiveDicManager.activeIpboxDicMutex.ReleaseMutex();

考慮到脫網清除執行緒會損耗部分性能,我也測驗了去掉該鎖的情況,也不會有第4的3個例外,至此問題全部解決,

8.小結

  • 模擬設備數量小測不出這個問題,如此看出海量設備的重要性,因為現實情況肯定會出現以上三個問題,而且都是很嚴重很致命的問題,好的測驗方法可以把問題扼殺在搖籃中;

  • 多執行緒高并發時容易出現這樣那樣的例外,要懷著敬畏之心去思考,去解決問題;


著作權宣告:本文為博主原創文章,遵循 CC 4.0 BY-SA 著作權協議,轉載請附上原文出處鏈接和本宣告,

本文鏈接:https://www.cnblogs.com/JerryMouseLi/p/12709048.html

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/4520.html

標籤:架構設計

上一篇:15分鐘從零開始搭建支持10w+用戶的生產環境(一)

下一篇:OA辦公系統 Springboot Activiti6 作業流 集成代碼生成器 vue.js 前后分離 跨域

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more