主頁 >  其他 > 昇騰實戰丨DVPP媒體資料處理視頻解碼問題案例

昇騰實戰丨DVPP媒體資料處理視頻解碼問題案例

2023-05-09 08:09:30 其他

摘要:本期就分享幾個關于DVPP視頻解碼問題的典型案例,并給出原因分析及解決方法

本文分享自華為云社區《DVPP媒體資料處理視頻解碼問題案例》,作者:昇騰CANN ,

DVPP(Digital Vision Pre-Processing)是昇騰AI處理器內置的影像處理單元,通過AscendCL媒體資料處理介面提供強大的媒體處理硬加速能力,主要功能包括影像編解碼、視頻編解碼、影像摳圖縮放等,

本期就分享幾個關于DVPP視頻解碼問題的典型案例,并給出原因分析及解決方法:

  1. 視頻解碼行程卡死,無法退出
  2. retCode回傳值設定錯誤,導致視頻解碼例外
  3. 視頻解碼無報錯,但無解碼結果資料,且CPU占用率高

01 視頻解碼行程卡死,無法退出

現象描述

用戶行程卡死,無法退出,查看應用類日志,一直重復提示資訊“fault kernel_name=DvppSendVdecFrame”、“Kernel task happen error, retCode=0x28, [aicpu timeout]”,表示AI CPU例外,無法處理視頻解碼任務,導致任務超時,

日志片段舉例如下:

[ERROR] RUNTIME(pid,pName):DateTimeMS [task.cc:878]1827 PreCheckTaskErr:[DVPP][DEFAULT]Kernel task happen error, retCode=0x28, [aicpu timeout].
[ERROR] RUNTIME(pid,pName):DateTimeMS [task.cc:676]1827 PrintAicpuErrorInfo:[DVPP][DEFAULT]Aicpu kernel execute failed, device_id=0, stream_id=177, task_id=4, fault so_name=libdvpp_kernels.so, fault kernel_name=DvppSendVdecFrame, fault op_name=, extend_info=.
[ERROR] RUNTIME(pid,pName):DateTimeMS [task.cc:878]1831 PreCheckTaskErr:[DVPP][DEFAULT]Kernel task happen error, retCode=0x28, [aicpu timeout].
[ERROR] RUNTIME(pid,pName):DateTimeMS [task.cc:676]1831 PrintAicpuErrorInfo:[DVPP][DEFAULT]Aicpu kernel execute failed, device_id=0, stream_id=170, task_id=8, fault so_name=libdvpp_kernels.so, fault kernel_name=DvppSendVdecFrame, fault op_name=, extend_info=.
[ERROR] RUNTIME(pid,pName):DateTimeMS [engine.cc:960]1766 ReportExceptProc:[DVPP][DEFAULT]Task exception! device_id=0, stream_id=107, task_id=8, type=1, retCode=0x28.
[ERROR] RUNTIME(pid,pName):DateTimeMS [engine.cc:960]1773 ReportExceptProc:[DVPP][DEFAULT]Task exception! device_id=0, stream_id=130, task_id=4, type=1, retCode=0x28.

可能原因

Device記憶體不足,AI CPU無法處理視頻解碼任務,導致任務超時,

處理步驟

1.在使用媒體資料處理V1版本的視頻解碼功能前,可參考性能指標說明頁面中的“每路VDEC解碼的記憶體消耗計算公式”,預估需使用的Device記憶體,并合理規劃Device上的記憶體,
您可以在頁面左上側切換版本,查看對應版本的性能指標說明,

2.優化應用程式的代碼邏輯,增加例外處理機制,獲取視頻解碼例外資訊,強制退出行程,

在呼叫aclinit介面初始化之后、呼叫aclvdecSendFrame介面解碼之前,定義例外回呼函式,并呼叫aclrtSetExceptionInfoCallback介面設定例外回呼函式,用于獲取任務例外資訊,以便在例外分支中根據任務例外資訊來判斷是否退出應用行程,

  • 定義例外回呼函式,回呼函式原型為:typedef void (*aclrtExceptionInfoCallback)(aclrtExceptionInfo *exceptionInfo)
  • 實作例外回呼函式,在例外回呼函式fn內呼叫aclrtGetDeviceIdFromExceptionInfo、aclrtGetStreamIdFromExceptionInfo、aclrtGetTaskIdFromExceptionInfo介面分別獲取Device ID、Stream ID、Task ID,

根據Stream ID、Task ID判斷Device是否例外,若例外,則強制退出行程,

例外回呼函式實作示例如下:

void dvpp_callback(aclrtExceptionInfo * exception_info)
{
    uint32_t taskId = aclrtGetTaskIdFromExceptionInfo(exception_info);
    uint32_t streamId = aclrtGetStreamIdFromExceptionInfo(exception_info);
    uint32_t deviceId = aclrtGetDeviceIdFromExceptionInfo(exception_info);
 if(taskId == 0xffffffff) || (streamId == 0xffffffff) {
 //Device例外,強制退出行程
 } else {
 //任務例外,如果頻繁出現(例如,統計1秒內觸發例外回呼函式的次數),行程退出
 }
 return;
}

3.呼叫aclrtSetExceptionInfoCallback介面設定例外回呼函式,

02 retCode回傳值設定錯誤,導致視頻解碼例外

現象描述

呼叫aclvdecSendFrame介面發送一幀碼流后,繼續復用輸出圖片描述資訊,進行后續幀碼流的解碼操作,結果反復出現解碼不成功、解碼例外的情況,

日志片段舉例如下:

Channel[0]: success to aclvdecSendFrame, loop=1, count=7
get frame success, totalCount=7
packet.size is 26084.
Channel[0]: begin to send frame, loop=1, count=8
acldvppGetPicDescRetCode, retCode: 2.
Vdec ERROR!!!!!!!!!!!!!!!!
errCount is 3. total count is 3.
!!!!!!!!!!!!!!!!!!acldvppGetPicDescRetCode, retCode: 2.right_count:0,fail_count:3,total_count:3
Channel[0]: success to aclvdecSendFrame, loop=1, count=8
get frame success, totalCount=8
packet.size is 27927.
Channel[0]: begin to send frame, loop=1, count=9
acldvppGetPicDescRetCode, retCode: 2.
Vdec ERROR!!!!!!!!!!!!!!!!
errCount is 4. total count is 4.
!!!!!!!!!!!!!!!!!!acldvppGetPicDescRetCode, retCode: 2.right_count:0,fail_count:4,total_count:4

可能原因

根據日志中的提示,通過acldvppGetPicDescRetCode介面獲取到的retCode為2,retCode為非0值時,表示解碼例外,

再查看代碼邏輯時,發現由于前一幀碼流解碼失敗,retCode被置為2,在復用輸出圖片描述資訊時,retCode也繼承了前一幀解碼失敗的狀態值2,導致AscendCL在解碼后續幀時,獲取到retCode值為2,就一直判斷解碼是失敗,

處理步驟

如果存在復用輸出圖片描述資訊的場景,需先呼叫acldvppSetPicDescRetCode設定為0,防止前一幀解碼例外的狀態影響后續解碼,

03 視頻解碼無報錯,但無解碼結果資料、CPU占用率高

現象描述

查看應用類日志,無ERROR報錯、無解碼結果資料輸出,另外,在運行應用程式的Linux服務器上執行top命令,該應用行程的CPU占用率持續升高,

可能原因

1. 無ERROR、無解碼結果資料輸出,初步判斷可能是因為解碼發幀介面aclvdecSendFrame呼叫正常,但未觸發回呼函式,無法獲取解碼結果資料,

2. 檢查觸發回呼函式的代碼邏輯,

按照視頻解碼的介面呼叫邏輯:由用戶提前創建一個單獨的執行緒,并自定義執行緒函式,在執行緒函式內呼叫aclrtProcessReport介面,通過該介面配置超時時間,等待指定的超時時間后,觸發回呼函式,獲取解碼結果資料,

Channel[0]: success to aclvdecSendFrame, loop=1, count=7
get frame success, totalCount=7
void *ThreadFunc(aclrtContext sharedContext)
{
 if (sharedContext == nullptr) {
 ERROR_LOG("sharedContext can not be nullptr");
 return ((void*)(-1));
 }
 INFO_LOG("use shared context for this thread");
 aclError ret = aclrtSetCurrentContext(sharedContext);
 if (ret != ACL_SUCCESS) {
 ERROR_LOG("aclrtSetCurrentContext failed, errorCode = %d", static_cast<int32_t>(ret));
 return ((void*)(-1));
 }
 INFO_LOG("thread start ");
 while (runFlag) {
 // Notice: timeout 1000ms
 (void)aclrtProcessReport(1000);
 }
 return (void*)0;
}

3. 如果觸發回呼函式的介面呼叫邏輯正確,則在aclrtProcessReport介面處增加日志列印,判斷應用運行程序中執行緒是否成功呼叫了aclrtProcessReport介面,只有成功呼叫aclrtProcessReport介面,才會觸發回呼函式,

示例代碼如下:

while (runFlag) {
 // Notice: timeout 1000ms
 aclError ret = aclrtProcessReport(1000);
 printf("aclrtProcessReport failed, ret=%d.\n", ret);
}

4. 修改代碼后,重新編譯運行應用,

在終端螢屏重復出現以下列印資訊,表示呼叫aclrtProcessReport介面失敗:

aclrtProcessReport failed, ret = 107012

查閱該介面的回傳值說明,107012表示執行緒未訂閱或重復訂閱,

5. 檢查代碼邏輯,檢查是否呼叫aclvdecSetChannelDescThreadId介面系結用戶新建的執行緒,按照VDEC視頻解碼的介面呼叫邏輯,只有呼叫該介面系結用戶執行緒,才可以觸發呼叫aclrtProcessReport介面,進而觸發回呼函式,

6. 修改代碼后,重新編譯運行應用,視頻解碼正常,正常輸出解碼結果資料,同時CPU占用率下降,

處理步驟

參見視頻解碼的介面呼叫流程頁面或者參考VDEC功能樣例開發視頻解碼功能,您可以在頁面左上側切換版本,查看對應版本的介面呼叫流程,

其中,需關注以下注意點:

  • 創建新執行緒,并自定義執行緒函式,在執行緒函式內呼叫aclrtProcessReport介面,等待指定時間后,觸發回呼函式中的回呼函式,
  • 需呼叫aclvdecSetChannelDescThreadId介面系結用戶創建的新執行緒,
  • 釋放資源時,依次銷毀通道、銷毀通道描述資訊后,才可以銷毀中用戶創建的新執行緒,

04 更多介紹

[1]昇騰檔案中心

[2]昇騰社區在線課程

[3]昇騰論壇

 

點擊關注,第一時間了解華為云新鮮技術~

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/551940.html

標籤:其他

上一篇:6年測開經驗,從功能測驗到測驗開發,每一步都深思熟慮...

下一篇:返回列表

標籤雲
其他(158663) Python(38123) JavaScript(25405) Java(18024) C(15222) 區塊鏈(8262) C#(7972) AI(7469) 爪哇(7425) MySQL(7171) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5336) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4567) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1965) Web開發(1951) HtmlCss(1932) python-3.x(1918) 弹簧靴(1913) C++(1912) xml(1889) PostgreSQL(1874) .NETCore(1857) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 昇騰實戰丨DVPP媒體資料處理視頻解碼問題案例

    摘要:本期就分享幾個關于DVPP視頻解碼問題的典型案例,并給出原因分析及解決方法 本文分享自華為云社區《DVPP媒體資料處理視頻解碼問題案例》,作者:昇騰CANN 。 DVPP(Digital Vision Pre-Processing)是昇騰AI處理器內置的影像處理單元,通過AscendCL媒體數 ......

    uj5u.com 2023-05-09 08:09:30 more
  • 6年測開經驗,從功能測驗到測驗開發,每一步都深思熟慮...

    ?驀然回首,軟體測驗風風雨雨的這幾年,起初每天的作業只是滑鼠點點點,我還真不知道怎么辦,閑的時候真的懷疑自己的存在價值,每天拿著7000的工資,飄蕩在繁華的深圳,吃不飽也餓不死,未來一片茫然…… ?時間荏苒,作業越久越能體會測驗才不是這么簡單,假如只會點點滑鼠,并不能走得長遠,工資也漸漸地無法滿足生 ......

    uj5u.com 2023-05-09 08:09:23 more
  • 位元組面試官心聲:個個都說會自動化,結果面試一問細節全露餡了

    今年部門要招三個自動化測驗,年前我面試了幾十位候選人。發現一個很奇怪的現象,面試中一問到元素定位、框架api、腳本撰寫之類的,很多候選人都對答如流。但是一問到實際專案,比如 “如何從0開始搭建自動化體系”、“如果讓你來推廣自動化,該如何設計方案”。大多數人都避重就輕、含糊其辭。究其原因,我認為是現在... ......

    uj5u.com 2023-05-09 08:08:42 more
  • 當Serverless遇到Regionless:現狀與挑戰

    摘要:本文嘗試基于分析現有的學術文章,剖析Serverless與Regionless并存時,在性能提升和成本控制兩個方向的現狀與挑戰 本文分享自華為云社區《當Serverless遇到Regionless:現狀與挑戰》,作者:云容器大未來。 近年來,Serverless服務崛起的趨勢是有目共睹的:從B ......

    uj5u.com 2023-05-09 08:08:12 more
  • WEB中間件常見漏洞總結

    WEB中間件常見漏洞總結 什么是WEB中間件 是一類提供系統軟體和應用軟體之間的連接,便于軟體各部件之間的溝通的軟體,應用軟體可以借助中間件在不同的技術架構之間共享資訊和資源。中間件位于客戶機服務器的作業系統之上,管理著計算資源和網路通信。中間件=平臺+通信 一、IIS中間件 1、IIS6.0 PU ......

    uj5u.com 2023-05-09 08:08:07 more
  • 「微服務」這10道Consul面試題值得一看

    前言 Consul 是一種非常強大的分布式服務發現和配置管理工具,它可以幫助開發人員和運維人員更好地管理和維護分布式系統。 但是,使用 Consul 也需要投入一定的人力和物力,需要根據實際情況進行選擇和使用。 什么是 Consul? Consul 是一種分布式服務發現和配置管理工具,它可以用于服務 ......

    uj5u.com 2023-05-09 08:08:03 more
  • 為什么一裁員就先拿測驗人員開刀,軟體測驗人員應該居安思危....(

    軟體測驗人員應該居安思危
    每當經濟不好,公司業績不好的時候,公司都可能進行裁員。 首先裁的就是測驗人員。 因為測驗人員的技術水平相對來說比較低,容易被替代,招起來也比較容易。 公司往往先拿測驗人員開刀。
    身為測驗人員,雖然我們平常的作業大部分都比較安逸。 但是千萬不能溫水煮青蛙。 應該自強不息, 要... ......

    uj5u.com 2023-05-09 08:07:17 more
  • Codeforces Round 871 (Div. 4)

    A.Love Story 題意: 給定n個長度為10的字串,問其與codeforces字串的對應下標字母不同的個數。 分析: 對于每個字串從前往后依次和“codeforces”對應字符比較然后統計不同字母數即可 code: #include <bits/stdc++.h> using name ......

    uj5u.com 2023-05-09 08:06:45 more
  • 5分鐘實作呼叫ChatGPT介面API實作多輪問答

    5分鐘實作呼叫ChatGPT介面API完成多輪問答 最近ChatGPT也是火爆例外啊,在親自使用了幾個月之后,我發現這東西是真的好用,實實在在地提高了生產力。那么對于開發人員來說,有時候可能需要在自己的代碼里加入這樣一個智能問答的功能,我最近就出現了這樣的想法和需求,所以簡單研究了一下。網上類似的方 ......

    uj5u.com 2023-05-09 08:06:16 more
  • 昇騰實戰丨DVPP媒體資料處理視頻解碼問題案例

    摘要:本期就分享幾個關于DVPP視頻解碼問題的典型案例,并給出原因分析及解決方法 本文分享自華為云社區《DVPP媒體資料處理視頻解碼問題案例》,作者:昇騰CANN 。 DVPP(Digital Vision Pre-Processing)是昇騰AI處理器內置的影像處理單元,通過AscendCL媒體數 ......

    uj5u.com 2023-05-09 08:06:09 more