菜單

主頁 > 其他 > AI推理實踐丨多路極致性能目標檢測最佳實踐設計解密

AI推理實踐丨多路極致性能目標檢測最佳實踐設計解密

2023-07-08 08:02:22 其他

摘要：基于CANN的多路極致性能目標檢測最佳實踐設計解密，

本文分享自華為云社區《基于CANN的AI推理最佳實踐丨多路極致性能目標檢測應用設計解密》，作者：昇騰CANN ，

當前人工智能領域，最熱門的無疑是以ChatGPT為代表的各種“新貴”大模型，它們高高在上，讓你無法觸及，但在人們的日常生活中，實際應用需求最大的還是以Yolo模型為代表的目標檢測“豪強”，它們每天都在以各種方式落地、應用于我們日常生活的方方面面，

目標檢測是計算機視覺領域的一項關鍵技術，它的任務是找出影像中所有感興趣的目標，確定它們的類別和位置，隨著人工智能潛移默化地滲入人們的生活中，各行各業競相通過引入目標檢測等技術打開市場空間，關于目標檢測的各類人工智能需求也奔涌而來，比如：

在交通領域，目標檢測可以用來檢測道路上的行人、車輛、交通標志等物體，提升行駛安全和通行便利性，
在安全領域，目標檢測可以用來檢測關鍵特征、特定行為或者可疑物體，以便快速發現和識別安全威脅，
在醫療領域，目標檢測可以用來識別身體部位、病灶、心電圖、CT影像等，以便快速輔助診斷，
在生活領域，目標檢測可以用于智能購物、智能家居等場景，提升人們生活的便利性，

但AI應用開發門檻高，周期長，各類AI軟體堆疊理解成本高、AI演算法模型與業務結合難度高、對開發人員的技能要求也較高，如何提升AI推理應用的開發效率，降低開發門檻，是亟需改善的現狀，為此，昇騰CANN技術專家設計和開發了針對目標檢測應用的最佳實踐，讓開發者可以在昇騰平臺上快速部署目標檢測應用，輕松獲得幾十甚至上百路的檢測效果，下面我們就來詳細拆解一下這個實踐的設計思路，

基礎應用分解

我們首先從一個基礎的目標檢測推理應用場景開始，推理流程通常包含如下幾個部分：

GPU AI推理業務流程

資料輸入是攝像頭獲取的視頻資料流，一般以H.264格式為主，
然后通過FFmpeg軟體，將連續的視頻流進行拆幀和解碼，
下一階段是對解碼后的影像進行預處理，通常使用OpenCV對影像進行縮放，得到模型需要的影像規格，
模型推理環節，用戶可以選擇的方式比較多，比較典型的是使用TensorRT進行推理應用開發，
目標檢測后處理需要進行NMS計算，進行圖片畫框等操作，
資料輸出階段，用戶根據需要實作一個結果呈現形式，

推理功能適配

將上面介紹的目標檢測應用遷移到昇騰平臺，開發者僅需關注“推理”環節的適配，包括如下兩個步驟：

將推理模型檔案（onnx模型或pb模型）通過ATC工具轉化為昇騰平臺專屬的離線om檔案，
使用昇騰AscendCL語言開發模型加載和模型執行的邏輯，

基于CANN的AI推理業務流程

完成如上兩個環節后，推理應用的功能就已經遷移到昇騰平臺了，這時若整體的推理性能未達到理想預期，就需要進入性能優化提升階段，

性能提升方式一：使能DVPP硬體的高效編解碼能力

DVPP（Digital Vision Pre-Processing，數字視覺預處理）是昇騰AI處理器內置的影像處理單元，通過AscendCL媒體資料處理介面提供強大的媒體處理硬加速能力，主要包括以下功能：

VPC（Vision Preprocessing Core）：處理YUV、RGB等格式的圖片，包括縮放、摳圖、色域轉換等，
JPEGD（JPEG Decoder）：JPEG壓縮格式→YUV格式的圖片解碼，
JPEGE（JPEG Encoder）：YUV格式→JPEG壓縮格式的圖片編碼，
VDEC（Video Decoder）：H264/H265格式→YUV/RGB格式的視頻碼流解碼，
VENC（Video Encoder）：YUV420SP格式→H264/H265格式的視頻碼流編碼，
PNGD（PNG Decoder）：PNG格式→RGB格式的圖片解碼，

Ascend 310 AI處理器邏輯架構中DVPP位置

開發者可以通過DVPP對影像進行硬體解碼和處理，提升影像處理效率，另外，DVPP和執行推理的計算單元AI Core是完全獨立的硬體單元，無需擔心使用DVPP后會對推理執行的性能產生影響，

基于CANN的AI推理業務流程——使用DVPP進行資料預處理

性能提升方式二：增加推理前后資料并行，讓推理步驟一刻不停

昇騰平臺采用異構計算架構，所以要充分利用計算核心AI Core的超強能力，就需要保證AI Core計算需要的資料能夠持續不間斷供給，同時能夠無等待輸出，為了實作此能力，可以在資料預處理→模型推理，模型推理→資料后處理模塊間通過佇列的機制，增加推理模塊的并行流水，

基于CANN的AI推理業務流程——通過佇列增加推理并行流水

同理，在FFmpeg視頻拆幀和DVPP處理之間，也可以使用佇列，進一步增加并行情況，但需要注意推理側的佇列資料會消耗硬體記憶體，所以需要要合理設定，

性能提升方式三：多執行緒并發，持續釋放AI Core性能

多執行緒是提升硬體資源利用率的重要手段，通過多執行緒的支持，可以實作多路不同源的視頻輸入；針對服務器多卡的場景，同樣支持多個卡并行執行，充分釋放昇騰軟硬體的性能，

基于CANN的AI推理業務流程——多執行緒并發

基于目標檢測最佳實踐，開發者可輕松實作已有AI推理應用到昇騰平臺的遷移，并輕松達成高性能，開發者也可以參考此實踐快速上手AI開發，玩轉昇騰平臺推理應用，未來，CANN將持續致力于應用開發的易用性提升，不斷滿足開發者的訴求，

點擊Link，獲取多路高性能目標檢測最佳實踐原始碼，

點擊關注，第一時間了解華為云新鮮技術~

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/556785.html

標籤：其他

上一篇：一份保姆級的Stable Diffusion部署教程，開啟你的煉丹之路

下一篇：返回列表

標籤雲: 其他(162209) Python(38266) JavaScript(25527) Java(18291) C(15239) 區塊鏈(8275) C＃(7972) AI(7469) 爪哇(7425) MySQL(7290) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5876) 数组(5741) R(5409) Linux(5347) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4613) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2438) ASP.NET(2404) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) HtmlCss(1993) .NET技术(1986) 功能(1967) Web開發(1951) C++(1942) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1882) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽

網閘典型架構簡述
網閘架構一般分為兩種：三主機的三系統架構網閘和雙主機的2+1架構網閘。三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看，三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看，三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統，“2”分為 ......
uj5u.com 2020-09-10 02:00:44 more
如何從xshell上傳檔案到centos linux虛擬機里
如何從xshell上傳檔案到centos linux虛擬機里及：虛擬機CentOs下執行 yum -y install lrzsz命令，出現錯誤：鏡像無法找到軟體包前言一、安裝lrzsz步驟二、上傳檔案三、遇到的問題及解決方案總結前言提示：其實很簡單，往虛擬機上安裝一個上傳檔案的工具 ......
uj5u.com 2020-09-10 02:00:47 more
一、SQLMAP入門
一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號， sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入從文本中加載http請求，SQLMAP可以從一個文本檔案中 ......
uj5u.com 2020-09-10 02:00:50 more
Metasploit 簡單使用教程
metasploit 簡單使用教程浩先生， 2020-08-28 16:18:25 分類專欄： kail 網路安全 linux 文章標簽： linux資訊安全編輯著作權 metasploit 使用教程前言一、Metasploit是什么？二、準備作業三、具體步驟前言 Msfconsole ......
uj5u.com 2020-09-10 02:00:53 more
游戲逆向之驅動層與用戶層通訊
驅動層代碼： #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......
uj5u.com 2020-09-10 02:00:56 more
北斗電力時鐘（北斗授時服務器）讓網路資料更精準
北斗電力時鐘（北斗授時服務器）讓網路資料更精準北斗電力時鐘（北斗授時服務器）讓網路資料更精準京準電子科技官微——ahjzsz 近幾年，資訊技術的得了快速發展，互聯網在逐漸普及，其在人們生活和生產中都得到了廣泛應用，并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用，一方面使電力系統的運行 ......
uj5u.com 2020-09-10 02:01:03 more
【CTF】CTFHub 技能樹彩蛋 writeup
?碎碎念 CTFHub：https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺，后來才有了CTFHub。感覺不論是網頁UI設計，還是題目質量，賽事跟蹤，工具軟體都做得很不錯。而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。個人還是非常喜歡這個 ......
uj5u.com 2020-09-10 02:04:05 more
02windows基礎操作
我學到了一下幾點 Windows系統目錄結構與滲透的作用常見Windows的服務詳解 Windows埠詳解常用的Windows注冊表詳解 hacker DOS命令詳解（net user / type /md /rd/ dir /cd /net use copy、批處理等）利用dos命令制作 ......
uj5u.com 2020-09-10 02:04:18 more
03.Linux基礎操作
我學到了以下幾點 01Linux系統介紹02系統安裝，密碼啊破解03Linux常用命令04LAMP 01LINUX windows： win03 8 12 16 19 配置不繁瑣 Linux：redhat,centos(紅帽社區版)，Ubuntu server,suse unix:金融機構，證券，銀 ......
uj5u.com 2020-09-10 02:04:30 more
05HTML
01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼懂得挖掘漏洞（POST注入/XSS漏洞上傳）3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題，描述 ......
uj5u.com 2020-09-10 02:04:36 more

最新发布

AI推理實踐丨多路極致性能目標檢測最佳實踐設計解密
摘要：基于CANN的多路極致性能目標檢測最佳實踐設計解密。本文分享自華為云社區《基于CANN的AI推理最佳實踐丨多路極致性能目標檢測應用設計解密》，作者：昇騰CANN 。當前人工智能領域，最熱門的無疑是以ChatGPT為代表的各種“新貴”大模型，它們高高在上，讓你無法觸及。但在人們的日常生活中 ......
uj5u.com 2023-07-08 08:02:22 more
一份保姆級的Stable Diffusion部署教程，開啟你的煉丹之路
在經歷了一系列的探索后，我為你總結出了一套零基礎的、非常好上手的借助京東云GPU云主機部署安裝Stable Diffusion WebUI以及相關工具和插件的保姆集教程，請查收。 ......
uj5u.com 2023-07-08 08:02:04 more
以科技創新驅動高質量發展，天翼云作業系統獲國資委權威認證！
近日，國資委發布《中央企業科技創新成果產品手冊（2022年版）》（后稱手冊），天翼云作業系統成功入選基礎軟體領域創新成果，獲國資委權威認可。 ......
uj5u.com 2023-07-08 08:01:47 more
Kurator v0.4.0版本更新4大內容，滿足多云環境的復雜需求
摘要：在最新發布的 v0.4.0 版本中，Kurator 進一步豐富了分布式云原生場景下的應用統一管理能力，以便更好地滿足多云環境的復雜需求。本文分享自華為云社區《Kurator v0.4.0：引領分布式云原生管理的全新篇章》，作者：華為云云原生團隊。 Kurator 是一款開源的分布式云原生平臺 ......
uj5u.com 2023-07-08 08:01:37 more
北斗衛星授時器(NTP時間源服務器, GPS網路校時系統)技術引數描述
北斗衛星授時器(NTP時間源服務器, GPS網路校時系統)技術引數描述北斗衛星授時器(NTP時間源服務器, GPS網路校時系統)技術引數描述京準電子科技官微——ahjzsz 1.1.1. 系統概述時鐘系統采用系統論和程序論的設計思想，應用當今世界上先進的通信及計算機技術，采用分布式結構，設計出 ......
uj5u.com 2023-07-08 08:01:09 more
用寫代碼的方式畫圖-試下PlantUML吧
為大家推薦一個專注于“畫圖”本身的工具 PlantUML，通過寫代碼的方式完成滿足各種需求場景的畫圖作業，將人的精力集中到思想的表達與傳遞，避免無謂的圖形頁面樣式修改調整，進而提升作業效率 ......
uj5u.com 2023-07-08 08:00:42 more
中國對鎵和鍺實施出口管制：全球半導體行業的新挑戰與機遇
隨著全球半導體行業的競爭日益激烈，中國近日宣布對鎵和鍺實施出口管制，這是對美國對中國半導體行業技術封鎖的回應。這一決定可能會對全球半導體供應鏈產生深遠影響，引發一場全球范圍內的科技和經濟震動。 ......
uj5u.com 2023-07-08 08:00:33 more
京東統一頭尾管理系統探索實踐
你瀏覽過的每一個網頁的背后都是有許多個業務系統在支撐，并由專門的研發團隊來負責維護。而各業務系統為了能夠保持統一的網頁風格，往往都會使用相同的頁面頭部和尾部，我們稱之為公共頭尾。 ......
uj5u.com 2023-07-08 08:00:27 more
最近很火的開源培訓系統，支持免費商用，3個月1000star！
專案簡介 PlayEdu 開源培訓系統自發布以來，3個月內幫助上千位開發者部署了私有化培訓平臺，并在 Github 上獲得了1000star。專案地址 Github 地址：https://github.com/PlayEdu/PlayEdu GItee 地址：https://gitee.com/p ......
uj5u.com 2023-07-08 08:00:05 more
SkyEye處理器仿真系列：龍芯2K1000處理器
??SkyEye簡介：天目全數字實時仿真軟體SkyEye作為基于可視化建模的硬體行為級仿真平臺，能夠為嵌入式軟體提供虛擬化運行環境，開發、測驗人員可在該虛擬運行環境上進行軟體開發、軟體測驗和軟體驗證活動。小到芯片，大到系統，SkyEye均可進行模擬。 01.背景介紹 1936年，被譽為“計算機科學 ......
uj5u.com 2023-07-08 07:53:55 more

友情鏈接

有解無憂