主頁 > 後端開發 > rt下降40%?程式并行優化六步法

rt下降40%?程式并行優化六步法

2023-05-23 07:49:10 後端開發

1 背景

性能優化是我們日常作業中很重要的一部分,主要有以下原因:

  • 降低服務器和帶寬等硬體成本:用更少的資源處理更多的請求
  • 提高現實世界的運行效率:人機處理效率存在數量級的偏差,同樣機器世界的效率提升能帶來現實世界效率提升的方法效果
  • 提高用戶的體驗:解決回應緩慢、宕機等問題

而并行優化在改善程式介面回應時間和吞吐量指標方面是個利器,所以本次結合前段時間做的一段長鏈路執行邏輯代碼的優化,給大家講講程式并行優化的步驟及方法論,

2 多執行緒優化六步法

2.1 定位優化點

一般是通過全鏈路監控、火焰圖、自定義打點、生產報警等先找到耗時長的性能問題點,之后通過多執行緒并行化的方式達到優化程式回應時長和吞吐量的目的,

2.2 執行鏈路分析

對問題點的執行鏈路進行分析,主要分幾方面:

  • 鏈路里涉及的操作節點;
  • 節點自身的耗時;是io密集型還是cpu密集型;是否依賴和修改外部變數;此節點是否是核心路徑;
  • 節點間彼此依賴關系;

2.3 異步鏈路設計

  • 將鏈路根據依賴關系進行重排,把被依賴的放在前面;
  • 彼此不依賴有相同起點的節點并行化;設計并行任務結果獲取及后續依賴節點的通知機制
  • 如果有指定回應時間目標的鏈路,為核心路徑節點設計降級方案;根據回應時間要求及已耗時資料對非核心路徑節點呼叫進行舍棄;
  • 將對變數修改的邏輯收攏,且盡量在主執行緒中處理,避免需要做的多執行緒變數可見性和時序性同步

2.4 并發框架選擇

1.執行緒池

描述:具體業務任務繼承介面 Runnable、Callable ,在呼叫 ExecutorService.submit 介面時,會提交任務到 ExecutorService 內部的一個任務佇列中,同時,在 ExecutorService 內部還存在一個預先申請的執行緒池(Thread Pool),執行緒池中的執行緒會從任務佇列中領取一個任務來執行,

優點:復用執行緒,減少執行緒創建銷毀成本及減少請求時延

注意點:cpu密集型和io密集型任務應進行不同的執行緒池配置;為避免不同任務相互干擾重要業務最好獨立使用執行緒池;不同執行緒之間要注意操作的有序和資料的可見性

2.AKKA

描述:每個 Actor 代表的是可以被調度執行的輕量單元,如圖中所示,Actor A 和 Actor C 在向 Actor B 發送訊息時,所有訊息會被底層框架發送到 Actor B 的 Mailbox 中,然后底層的 Akka 框架調度代碼會觸發 Actor B,來接收并執行訊息的后續處理,這樣,基于 Actor 模型的這套并發框架,首先就保證了訊息可以被安全地在各個 Actor 之間傳遞,同時也保證了每個 Actor 實體可以串行處理接收到的所有訊息,

優點:不需要關注多執行緒之間并發同步和資料一致性;輕量級高并發

注意點:actor任務粒度要小,避免承接太多業務邏輯;計算密集型任務更能發揮出AKKA的優勢

3.REACTOR

描述:輸入流 Flux 就是 Reactor 中典型的異步訊息流,它代表了一個包含 0 個到 N 個的訊息序列,另外,圖中的 Rule 代表的是一個基于訊息的處理邏輯或規則,輸入流中的訊息可以被中間多個處理邏輯組合連續加工之后,再生成一個包含 0 個到 N 個的輸出訊息流 Flux,

優點:rule采用pull處理訊息,避免訊息積壓;異步非阻塞io,避免阻塞當前執行緒

注意點:函式式編程,會有一定的語法學習成本和理解成本;針對訊息流處理的、基于 IO 密集型的異步互動場景比較有優勢

2.5 并發工具選擇

多執行緒執行涉及到一系列細節問題,如共享變數可見性,執行順序,結果的獲取、后續操作的通知等,所以要結合需求使用一系列相關的并發工具類做多執行緒執行正確性的保障

2.6 效果驗證

1.壓測

一般通過jmeter、loadrunner等后端性能測驗軟體,不斷對系統施加壓力,并驗證系統化處于或長期處于臨界飽和階段的穩定性以及性能指標,并試圖找到系統處于臨界狀態時的主要瓶頸點,

注意點:

  • 完全相同的環境以及測驗負載
  • 注意混部情況其他服務可能對驗證服務造成的影響
  • 通過加壓減壓調整請求量觀察服務器處理能力的變化及穩定性

2.性能指標驗證

  • 驗證并發用戶數、回應時間及吞吐量這種調優目標量;
  • 觀察服務器的負載指標,防止因優化帶來服務器超出負載能力;
  • 觀察上下游服務的業務指標和服務器負載,防止因優化帶來上下游超出負載能力

3.業務結果驗證

一般通過diff工具通過采集相同請求的回應對比判別是否影響業務;也可通過qa輔助構建針對改動的測驗集去做驗證

3 舉例

以我們前段時間進行的商品主資料下發消費能力調優進行舉例說明整個優化程序:

3.1 優化點定位

主資料程式接收商品批量下發處理緩慢,觸發下發積壓報警

3.2 執行鏈路分析

梳理各步驟對入參和保存時需要的變數的處理,分析各步驟相互依賴關系,是否可并行,進行執行程序優化調整,

商品主資料處理步驟分析:

3.3 異步鏈路設計

  1. 1、 3、4、5異步并行處理,且因對其他變數修改邏輯無依賴,放在最前面提交,
  2. 2、7、8、9、10、11根據依賴關系,把相關性的邏輯收攏,把被依賴的邏輯提前,
  3. 13也異步提交,最后通過completionService.take().get()遍歷獲取各任務執行結果進行合并回傳最終結果

3.4 并發框架選擇

出于團隊知識堆疊及框架應用場景綜合考慮,這里選擇了執行緒池作為并發框架,并結合多io場景做了執行緒池引數配置,

/**
     * io任務執行緒池
     */
    public static ThreadPoolExecutor threadPoolExecutorForIO= new ThreadPoolExecutor(Runtime.getRuntime().availableProcessors(),Runtime.getRuntime().availableProcessors()*2,1, TimeUnit.MINUTES,new ArrayBlockingQueue(2014),new ThreadPoolExecutor.CallerRunsPolicy());

3.5 并發工具選擇

這里使用CompletionService來獲取多執行緒的執行結果,并進行結果歸集,
CompletionService通過在執行緒結果完成時提交到阻塞佇列,避免通過遍歷future結果的方式導致先提交的任務耗時長造成的阻塞等待,

        CountingExecutorCompletionService<Boolean> completionService= new CountingExecutorCompletionService(ExecutorCollector.threadPoolExecutorForIO);
        //任務提交
 completionService.submit(callableA);
//結果歸集
   boolean result=true;
        for(int i = 0; i<completionService.getSubmittedTaskCount(); i++)
        {
            result&=completionService.take().get();
   }

3.6 效果驗證

1.壓測

采用jmeter對兩臺相同配置的服務器(分別部署優化版本和原始版本)加壓,觀察服務負載情況

2.性能指標驗證

1)耗時和吞吐量異步版本要優于同步版本

異步版本耗時在80-100ms,同步版本耗時在120-160ms
異步版本吞吐量在17000/5分鐘,同步版本吞吐量在15000/5分鐘

2)cpu使用率異步版本略高一點,執行緒數異步版本比較高
執行緒數高的原因:用到了執行緒池,預置的核心執行緒數為邏輯核數64,因為涉及到io操作較多,最大執行緒數配成了128,

3.業務結果驗證

因為公司框架不支持http的diff,此處采用了自己抽檢請求結果及qa協助走查和code review的方式保證業務結果的準確性

4 總結

程式性能優化方法關系到方方面面,而多執行緒異步優化無疑是其中很重要的一種途徑,它不光關系到并發框架的選擇、多種執行緒工具類的使用,還關系到對整個處理鏈路的業務理解和編排分析,希望通過這一課可以幫大家理清相關的思路,作為日常優化作業的一個參考,

作者:京東物流 馮鴻儒

內容來源:京東云開發者社區

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/553036.html

標籤:Java

上一篇:IntelliJ IDEA上手這一篇就夠了,從入門到上癮

下一篇:返回列表

標籤雲
其他(159443) Python(38156) JavaScript(25441) Java(18081) C(15230) 區塊鏈(8267) C#(7972) AI(7469) 爪哇(7425) MySQL(7204) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4574) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1975) 功能(1967) Web開發(1951) HtmlCss(1940) C++(1919) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1878) .NETCore(1861) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • rt下降40%?程式并行優化六步法

    并行優化在改善程式介面回應時間和吞吐量指標方面是個利器,所以本次結合前段時間做的一段長鏈路執行邏輯代碼的優化,給大家講講程式并行優化的步驟及方法論。 ......

    uj5u.com 2023-05-23 07:49:10 more
  • IntelliJ IDEA上手這一篇就夠了,從入門到上癮

    ### 前言 >每次換電腦,最最最頭疼的事情莫過于安裝各種軟體和搭建開發環境。這算是不想換電腦的一個原因吧(最主要還是窮)。除非是電腦壞了開不了機或者點一下卡一下,真不想換電腦。每次換電腦都得折騰好久。 ![](https://img2023.cnblogs.com/blog/2381533/202 ......

    uj5u.com 2023-05-23 07:41:37 more
  • go語言中實作生產者-消費者模式有哪些方法呢

    # 1. 簡介 本文將介紹在 Go 語言中實作生產者消費者模式的多種方法,并重點探討了通道、條件變數的適用場景和優缺點。我們將深入討論這些方法的特點,以幫助開發者根據應用程式需求選擇最適合的方式。通過靈活運用 Go 語言提供的并發原語,我們能夠實作高效、可靠的生產者消費者模式,提升系統的并發性能和可 ......

    uj5u.com 2023-05-23 07:39:25 more
  • freemodbus移植進STM32(包含HAL庫和標準庫兩種方法)

    #freemodbus移植 >基于freemodbus1.6 >使用HAL庫 >軟體:stm32cubemx stm32cubeide >>后續會更新標準庫的移植。以及rtos下的移植(盡量) ##下載freemodbus1.6 這個獲取方法網上到處都是,不細說了。 ##cubemx新建工程 新建工 ......

    uj5u.com 2023-05-23 07:38:32 more
  • 【重學C++】03 | 手擼C++智能指標實戰教程

    ## 文章首發 [【重學C++】03 | 手擼C++智能指標實戰教程](https://mp.weixin.qq.com/s/B85A_AFIAeOlfLzXOXydAw) ## 前言 大家好,今天是【重學C++】的第三講,書接上回,第二講《[02 脫離指標陷阱:深入淺出 C++ 智能指標](htt ......

    uj5u.com 2023-05-23 07:32:52 more
  • 獻給轉java的c#和java程式員的資料庫orm框架

    # 獻給轉java的c#和java程式員的資料庫orm框架 一個好的程式員不應被語言所束縛,正如我現在開源java的orm框架一樣,如果您是一位轉java的c#程式員,那么這個框架可以帶給你起碼沒有那么差的業務撰寫和強型別體驗。如果您是一位java程式員,那么該框架可以提供比`Mybatis-Plu ......

    uj5u.com 2023-05-22 08:27:33 more
  • SICP:惰性求值、流和尾遞回(Python實作)

    在上一篇博客中,我們介紹了用Python對來實作一個Scheme求值器。然而,我們跳過了部分特殊形式(special forms)和基本程序(primitive procedures)實作的介紹,如特殊形式中的delay、cons-stream,基本程序中的force、streawn-car、str... ......

    uj5u.com 2023-05-22 07:35:15 more
  • 使用 Async Rust 構建簡單的 P2P 節點

    # 使用 Async Rust 構建簡單的 P2P 節點 ### P2P 簡介 - P2P:peer-to-peer - P2P 是一種網路技術,可以在不同的計算機之間共享各種計算資源,如 CPU、網路帶寬和存盤。 - P2P 是當今用戶在線共享檔案(如音樂、影像和其他數字媒體)的一種非常常用的方法 ......

    uj5u.com 2023-05-22 07:33:10 more
  • 用go設計開發一個自己的輕量級登錄庫/框架吧(拓展篇)

    用go設計開發一個自己的輕量級登錄庫/框架吧(拓展篇),給自己的庫/框架拓展一下吧,主庫:https://github.com/weloe/token-go ......

    uj5u.com 2023-05-22 07:30:30 more
  • Java 網路編程 —— 實作非阻塞式的客戶端

    ## 創建阻塞的 EchoClient 客戶程式一般不需要同時建立與服務器的多個連接,因此用一個執行緒,按照阻塞模式運行就能滿足需求 ```java public class EchoClient { private SocketChannel socketChannel = null; public ......

    uj5u.com 2023-05-21 07:32:01 more