主頁 >  其他 > AI推理實踐丨多路極致性能目標檢測最佳實踐設計解密

AI推理實踐丨多路極致性能目標檢測最佳實踐設計解密

2023-07-08 08:04:20 其他

摘要:基于CANN的多路極致性能目標檢測最佳實踐設計解密,

本文分享自華為云社區《基于CANN的AI推理最佳實踐丨多路極致性能目標檢測應用設計解密》,作者: 昇騰CANN ,

當前人工智能領域,最熱門的無疑是以ChatGPT為代表的各種“新貴”大模型,它們高高在上,讓你無法觸及,但在人們的日常生活中,實際應用需求最大的還是以Yolo模型為代表的目標檢測“豪強”,它們每天都在以各種方式落地、應用于我們日常生活的方方面面,

目標檢測是計算機視覺領域的一項關鍵技術,它的任務是找出影像中所有感興趣的目標,確定它們的類別和位置,隨著人工智能潛移默化地滲入人們的生活中,各行各業競相通過引入目標檢測等技術打開市場空間,關于目標檢測的各類人工智能需求也奔涌而來,比如:

  • 在交通領域,目標檢測可以用來檢測道路上的行人、車輛、交通標志等物體,提升行駛安全和通行便利性,
  • 在安全領域,目標檢測可以用來檢測關鍵特征、特定行為或者可疑物體,以便快速發現和識別安全威脅,
  • 在醫療領域,目標檢測可以用來識別身體部位、病灶、心電圖、CT影像等,以便快速輔助診斷,
  • 在生活領域,目標檢測可以用于智能購物、智能家居等場景,提升人們生活的便利性,

但AI應用開發門檻高,周期長,各類AI軟體堆疊理解成本高、AI演算法模型與業務結合難度高、對開發人員的技能要求也較高,如何提升AI推理應用的開發效率,降低開發門檻,是亟需改善的現狀,為此,昇騰CANN技術專家設計和開發了針對目標檢測應用的最佳實踐,讓開發者可以在昇騰平臺上快速部署目標檢測應用,輕松獲得幾十甚至上百路的檢測效果,下面我們就來詳細拆解一下這個實踐的設計思路,

基礎應用分解

我們首先從一個基礎的目標檢測推理應用場景開始,推理流程通常包含如下幾個部分:

GPU AI推理業務流程

  1. 資料輸入是攝像頭獲取的視頻資料流,一般以H.264格式為主,
  2. 然后通過FFmpeg軟體,將連續的視頻流進行拆幀和解碼,
  3. 下一階段是對解碼后的影像進行預處理,通常使用OpenCV對影像進行縮放,得到模型需要的影像規格,
  4. 模型推理環節,用戶可以選擇的方式比較多,比較典型的是使用TensorRT進行推理應用開發,
  5. 目標檢測后處理需要進行NMS計算,進行圖片畫框等操作,
  6. 資料輸出階段,用戶根據需要實作一個結果呈現形式,

推理功能適配

將上面介紹的目標檢測應用遷移到昇騰平臺,開發者僅需關注“推理”環節的適配,包括如下兩個步驟:

  1. 將推理模型檔案(onnx模型或pb模型)通過ATC工具轉化為昇騰平臺專屬的離線om檔案,
  2. 使用昇騰AscendCL語言開發模型加載和模型執行的邏輯,

基于CANN的AI推理業務流程

完成如上兩個環節后,推理應用的功能就已經遷移到昇騰平臺了,這時若整體的推理性能未達到理想預期,就需要進入性能優化提升階段,

性能提升方式一:使能DVPP硬體的高效編解碼能力

DVPP(Digital Vision Pre-Processing,數字視覺預處理)是昇騰AI處理器內置的影像處理單元,通過AscendCL媒體資料處理介面提供強大的媒體處理硬加速能力,主要包括以下功能:

  • VPC(Vision Preprocessing Core):處理YUV、RGB等格式的圖片,包括縮放、摳圖、色域轉換等,
  • JPEGD(JPEG Decoder):JPEG壓縮格式→YUV格式的圖片解碼,
  • JPEGE(JPEG Encoder):YUV格式→JPEG壓縮格式的圖片編碼,
  • VDEC(Video Decoder):H264/H265格式→YUV/RGB格式的視頻碼流解碼,
  • VENC(Video Encoder):YUV420SP格式→H264/H265格式的視頻碼流編碼,
  • PNGD(PNG Decoder):PNG格式→RGB格式的圖片解碼,

Ascend 310 AI處理器邏輯架構中DVPP位置

開發者可以通過DVPP對影像進行硬體解碼和處理,提升影像處理效率,另外,DVPP和執行推理的計算單元AI Core是完全獨立的硬體單元,無需擔心使用DVPP后會對推理執行的性能產生影響,

基于CANN的AI推理業務流程——使用DVPP進行資料預處理

性能提升方式二:增加推理前后資料并行,讓推理步驟一刻不停

昇騰平臺采用異構計算架構,所以要充分利用計算核心AI Core的超強能力,就需要保證AI Core計算需要的資料能夠持續不間斷供給,同時能夠無等待輸出,為了實作此能力,可以在資料預處理→模型推理,模型推理→資料后處理模塊間通過佇列的機制,增加推理模塊的并行流水,

基于CANN的AI推理業務流程——通過佇列增加推理并行流水

同理,在FFmpeg視頻拆幀和DVPP處理之間,也可以使用佇列,進一步增加并行情況,但需要注意推理側的佇列資料會消耗硬體記憶體,所以需要要合理設定,

性能提升方式三:多執行緒并發,持續釋放AI Core性能

多執行緒是提升硬體資源利用率的重要手段,通過多執行緒的支持,可以實作多路不同源的視頻輸入;針對服務器多卡的場景,同樣支持多個卡并行執行,充分釋放昇騰軟硬體的性能,

基于CANN的AI推理業務流程——多執行緒并發

基于目標檢測最佳實踐,開發者可輕松實作已有AI推理應用到昇騰平臺的遷移,并輕松達成高性能,開發者也可以參考此實踐快速上手AI開發,玩轉昇騰平臺推理應用,未來,CANN將持續致力于應用開發的易用性提升,不斷滿足開發者的訴求,

點擊Link,獲取多路高性能目標檢測最佳實踐原始碼,

 

點擊關注,第一時間了解華為云新鮮技術~

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/556793.html

標籤:其他

上一篇:中國對鎵和鍺實施出口管制:全球半導體行業的新挑戰與機遇

下一篇:返回列表

標籤雲
其他(162217) Python(38266) JavaScript(25527) Java(18291) C(15239) 區塊鏈(8275) C#(7972) AI(7469) 爪哇(7425) MySQL(7290) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5876) 数组(5741) R(5409) Linux(5347) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4613) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2438) ASP.NET(2404) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) HtmlCss(1993) .NET技术(1986) 功能(1967) Web開發(1951) C++(1942) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1882) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • AI推理實踐丨多路極致性能目標檢測最佳實踐設計解密

    摘要:基于CANN的多路極致性能目標檢測最佳實踐設計解密。 本文分享自華為云社區《基于CANN的AI推理最佳實踐丨多路極致性能目標檢測應用設計解密》,作者: 昇騰CANN 。 當前人工智能領域,最熱門的無疑是以ChatGPT為代表的各種“新貴”大模型,它們高高在上,讓你無法觸及。但在人們的日常生活中 ......

    uj5u.com 2023-07-08 08:04:20 more
  • 中國對鎵和鍺實施出口管制:全球半導體行業的新挑戰與機遇

    隨著全球半導體行業的競爭日益激烈,中國近日宣布對鎵和鍺實施出口管制,這是對美國對中國半導體行業技術封鎖的回應。這一決定可能會對全球半導體供應鏈產生深遠影響,引發一場全球范圍內的科技和經濟震動。 ......

    uj5u.com 2023-07-08 08:04:10 more
  • 北斗衛星授時器(NTP時間源服務器, GPS網路校時系統)技術引數描述

    北斗衛星授時器(NTP時間源服務器, GPS網路校時系統)技術引數描述 北斗衛星授時器(NTP時間源服務器, GPS網路校時系統)技術引數描述 京準電子科技官微——ahjzsz 1.1.1. 系統概述 時鐘系統采用系統論和程序論的設計思想,應用當今世界上先進的通信及計算機技術,采用分布式結構,設計出 ......

    uj5u.com 2023-07-08 08:03:48 more
  • 一份保姆級的Stable Diffusion部署教程,開啟你的煉丹之路

    在經歷了一系列的探索后,我為你總結出了一套零基礎的、非常好上手的借助京東云GPU云主機部署安裝Stable Diffusion WebUI以及相關工具和插件的保姆集教程,請查收。 ......

    uj5u.com 2023-07-08 08:03:40 more
  • Kurator v0.4.0版本更新4大內容,滿足多云環境的復雜需求

    摘要:在最新發布的 v0.4.0 版本中,Kurator 進一步豐富了分布式云原生場景下的應用統一管理能力,以便更好地滿足多云環境的復雜需求。 本文分享自華為云社區《Kurator v0.4.0:引領分布式云原生管理的全新篇章》,作者:華為云云原生團隊。 Kurator 是一款開源的分布式云原生平臺 ......

    uj5u.com 2023-07-08 08:03:31 more
  • 京東統一頭尾管理系統探索實踐

    你瀏覽過的每一個網頁的背后都是有許多個業務系統在支撐,并由專門的研發團隊來負責維護。而各業務系統為了能夠保持統一的網頁風格,往往都會使用相同的頁面頭部和尾部,我們稱之為公共頭尾。 ......

    uj5u.com 2023-07-08 08:03:26 more
  • 最近很火的開源培訓系統,支持免費商用,3個月1000star!

    專案簡介 PlayEdu 開源培訓系統自發布以來,3個月內幫助上千位開發者部署了私有化培訓平臺,并在 Github 上獲得了1000star。 專案地址 Github 地址:https://github.com/PlayEdu/PlayEdu GItee 地址:https://gitee.com/p ......

    uj5u.com 2023-07-08 08:03:18 more
  • AI重塑千行百業,華為云發布盤古大模型3.0和昇騰AI云服務

    【中國,東莞,2023年7月7日】華為開發者大會2023(Cloud)7月7日在中國東莞正式揭開帷幕,并同時在全球10余個國家、中國30多個城市設有分會場,邀請全球開發者共聚一堂,就AI浪潮之下的產業新機會和技術新實踐開展交流分享。 在7日下午舉行的大會主題演講中,華為常務董事、華為云CEO張平安重 ......

    uj5u.com 2023-07-08 08:02:40 more
  • AI推理實踐丨多路極致性能目標檢測最佳實踐設計解密

    摘要:基于CANN的多路極致性能目標檢測最佳實踐設計解密。 本文分享自華為云社區《基于CANN的AI推理最佳實踐丨多路極致性能目標檢測應用設計解密》,作者: 昇騰CANN 。 當前人工智能領域,最熱門的無疑是以ChatGPT為代表的各種“新貴”大模型,它們高高在上,讓你無法觸及。但在人們的日常生活中 ......

    uj5u.com 2023-07-08 08:02:22 more
  • 一份保姆級的Stable Diffusion部署教程,開啟你的煉丹之路

    在經歷了一系列的探索后,我為你總結出了一套零基礎的、非常好上手的借助京東云GPU云主機部署安裝Stable Diffusion WebUI以及相關工具和插件的保姆集教程,請查收。 ......

    uj5u.com 2023-07-08 08:02:04 more