主頁 >  其他 > NVIDIA Maxine Video Effects SDK 編程指南 - 實踐小記

NVIDIA Maxine Video Effects SDK 編程指南 - 實踐小記

2023-06-14 09:40:27 其他

NVIDIA Maxine Video Effects SDK 編程指南 - 實踐小記

本篇博客重點只說Video Effect的部分,此外還有Audio Effect的部分、還有AR部分,不在本篇范圍內,本文由重慶Debug原創

NVIDIA Maxine Video Effects支持基于 AI 的視覺效果,這些效果可以輸入標準網路攝像頭畫面資料,同時也可以傳入一張圖或者來自ffmpeg解碼器的幀資料,讓使用者可以輕松集成到視頻會議和視頻特效內容創建管道中;

底層深度學習模型使用 NVIDIA? TensorRT? 通過 NVIDIA AI 進行優化以實作高性能推理,使開發人員能夠在實時應用程式中應用多種效果,

NVIDIA Maxine Video Effects提供了一系列TensorRT訓練好的模型,

截止到本稿前2023年6月13日,可以做到的功能有下列5個:

1. Virtual Background 虛擬背景(摳人物)

2. Artifact Reduction 偽影減少

3. Super Resolution 超解析度

4. Upscaler 放大器(輕量版超解析度)

5. Video Noise Removal 視頻噪音消除

硬體要求:

Video Effects SDK要求必須電腦至少擁有一個GPU是基于NVIDIA Turing?或NVIDIA Ampere?或NVIDIA Ada?架構并具有TensorRT核心功能,

運行時軟體要求:

Windows系統必須滿足64-bit Windows 10或更新版本

NVIDIA Graphics Driver for Windows必須滿足版本號大于等于511.65

分發包需用戶提前去英偉達官網(NVIDIA Broadcast)下載安裝對應顯卡所需的模型及dll檔案,如下圖所示:

 

開發時軟體要求:

Microsoft Visual Studio 2017或更新的版本

CMake 3.12或更新的版本

 

 

下面分別介紹這些功能和可以調控的引數及演示效果:

1. Virtual Background 虛擬背景(摳人物)

虛擬背景可以分割和屏蔽視頻或影像中的背景區域,以啟用 AI 支持的背景去除、替換或模糊,

限制條件:

a). 用于虛擬背景的原影像的尺寸必須大于等于:512x288(即寬和高都要同時滿足大于等于這個數),

b). 虛擬背景的效果在一個人坐在相機前錄制的視頻上是可達到最佳的效果,該功能在全身視頻、場景中的多個人或與前置攝像頭偏差太大的攝像頭角度上表現會有不佳,

c). 影像檔案的縱橫比建議為 16:9,才能獲得最佳效果,

d). 輸入的影像是BGR,每個像素是一個 24 位無符號字符值,因此每個像素分量為 8 位

 

可調的引數:

Mode:

0:質量優先模式、1:性能優先模式

Composition Mode:

原圖:

0(顯示遮罩 - compMatte)


1(在前景上覆寫遮罩 - compLight)
2(復合綠色 - compGreen)
3(復合白色 - compWhite)
4(顯示輸入 - compNone)
5(在指定的背景影像上合成 - compBG)(可以自己設定背景圖片,即可替換成自己提供的圖片)
6(模糊影像的背景 - compBlur)

 

2. Artifact Reduction 偽影減少

Artifact Reduction,減少編碼視頻的壓縮偽影,同時保留原始視頻的細節,

此偽影濾波器可減少編碼器造成的偽影,例如低位元率視頻中的阻塞偽影、振鈴、蚊音,同時保留原始視頻的細節,

編碼器偽影減少已針對 H.264 編碼器進行了優化,

使用條件:

a). 輸入的影像是BGR(GPU 緩沖區中提供),每個像素分量都要求是一個 32 位浮點值(fp32),

b). 輸出影像尺寸會和輸入一致,同樣也是BGR平面格式,每個像素分量也是32位浮點值,

c). 輸入的視頻的尺寸支持區間是:90p ~ 1080p

 

可調的引數:

Mode:

0:可去除較少的偽影,更好地保留低梯度資訊(適用于更高位元率的視頻)

1:去除較多的偽影(更適合較低位元率的視頻)

 

3. Super Resolution 超解析度

全稱:超級解析度,生成具有高達 4 倍高質量縮放的細節增強視頻,同時還減少了塊狀/噪聲偽影并保留了紋理和內容, 它適用于升級有損內容,

超解析度濾鏡在保留內容的同時,提高了低解析度視頻的解析度,增強了細節,并銳化了輸出,

此超解析度過濾器可增強低解析度視頻的解析度,并在保留內容的同時增強細節并銳化輸出,

使用條件:

a). 輸入輸出解析度和放大倍率的限制:

 
比例(放大倍率) 輸入解析度支持范圍 輸出解析度范圍
4/3 [90p, 2160p] [120p, 2880p]
1.5 [90p, 2160p] [135p, 3240p]
2 [90p, 2160p] [180p, 4320p]
3 [90p, 720p] [270p, 2160p]
4 [90p, 540p] [360p, 2160p]

b). NVIDIA特別清楚注明了,一些低端GPU,可能沒有足夠的記憶體來支持超解析度功能允許的最大輸入解析度,而導致報錯,

c). 輸入的影像是BGR(GPU 緩沖區中提供),每個像素分量都要求是一個 32 位浮點值,

d). 輸出影像尺寸會和輸入一致,同樣也是BGR平面格式,每個像素分量也是32位浮點值,

 

可調的引數:

Strength:

strength of the upscaling effect, 浮點數 [0.0, 1.0]

Mode:

超解析度或偽影減少效果的模式,0 或 1

0 - 保守,1 - 激進,

 

效果展示:

原圖360p:

超分放大3倍后(strength=1 mode=1):

超分放大3倍后(strength=1 mode=0):

 超分放大3倍后(strength=0 mode=0):

PS:上傳到網站上被壓縮過,效果看起來所以不是很明顯,如果放大在大螢屏上進行比較的話,可以看出原圖是很多鋸齒的~

 

4. Upscaler 放大器(輕量版超解析度)

Upscaler是一種非常快速且輕量級的方法,可提供高達 4 倍的高質量縮放視頻,并具有可調節的銳化引數,

此功能可以選擇與偽影減少功能進行流水線處理,以在減少視頻偽影的同時增強比例,

 

使用條件:

a). 支持任何輸入解析度(不像超解析度那樣有各種90p以上1080p以下之類的限制),適合比較差的顯卡或者比較大尺寸的視頻

b). 放大倍率和超解析度一樣,必須是4/3x、1.5x、2x、3x 或 4x之間的一種,

c). 輸入的影像是RGBA (GPU 緩沖區中提供),每個像素分量都要求是一個8位浮點值,每個像素為 32 位,

d). 輸出影像尺寸會和輸入一致,同樣也是RGBA平面格式,每個像素分量也是8位浮點值,每個像素為 32 位,

 

可調的引數:

Artifact Reduction Mode:

偽影去除模式,0或1:

0:可去除較少的偽影,更好地保留低梯度資訊(適用于更高位元率的視頻)

1:去除較多的偽影(更適合較低位元率的視頻)

Upscale Strength:

提供介于 0.0 和 1.0 之間的浮點強度值,即為銳化引數來銳化生成的影像輸出,默認值為 0.4,

強度設定為 0 意味著沒有銳化增強,只是放大,

強度設定為 1 意味著最大的銳化增強,

 

NVIDIA關于超分SuperResolution和放大UpScaler兩種方法的選擇的建議:

1. 如果沒有編碼偽影的視頻需要快速提高解析度,請使用“UpScaler”,
2. 如果視頻沒有編碼偽影,要提高解析度,請將 SuperResolution 與 Mode=1 配合使用,以獲得更大的增強功能,
3. 如果視頻的編碼偽影較少,要去除偽影,請僅在 Mode=0 下使用偽影減少,
4. 如果視頻具有更多編碼偽影,要去除偽影,請僅在 Mode=1 中使用偽影減少,
5. 要提高帶有編碼工件的視頻的解析度,請執行以下操作:
    (1). 對于是輕微偽像的視頻,請使用 Mode=0 的超解析度,
    (2). 否則,請使用去除偽影,然后使用 Mode=1 的超解析度,

 

放大UpScaler作為輕量級的超分,效果就不展示了,

5. Video Noise Removal 視頻噪音消除

視頻噪聲消除,可從網路攝像頭視頻中消除低光相機噪聲,同時保留紋理細節,

 

使用條件:

a). 僅支持80p-1080p解析度尺寸的視頻輸入,

b). 輸入的影像是BGR(GPU 緩沖區中提供),每個像素分量都要求是一個 32 位浮點值,

c). 輸出影像尺寸會和輸入一致,同樣也是BGR平面格式,每個像素分量也是32位浮點值,

 

可調的引數:

Strength:

降噪濾波器的強度,默認值為 0,

0 的強度對應于弱效果,這更強調紋理保留,

1 的強度對應于強效果,它更強調噪聲消除,效果更明顯,

原圖:

 

降噪強度Strength=0:

 

 降噪強度Strength=1:

 

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/555103.html

標籤:其他

上一篇:Apache Http Server 路徑穿越漏洞復現(CVE-2021-41773)

下一篇:返回列表

標籤雲
其他(160936) Python(38226) JavaScript(25493) Java(18235) C(15237) 區塊鏈(8270) C#(7972) AI(7469) 爪哇(7425) MySQL(7248) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5875) 数组(5741) R(5409) Linux(5347) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4591) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2435) ASP.NET(2404) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1984) 功能(1967) HtmlCss(1964) Web開發(1951) C++(1939) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1881) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • NVIDIA Maxine Video Effects SDK 編程指南 - 實踐小記

    NVIDIA Maxine Video Effects SDK 編程指南 NVIDIA Maxine Video Effects支持基于 AI 的視覺效果,這些效果可以輸入標準網路攝像頭畫面資料,同時也可以傳入一張圖或者來自ffmpeg解碼器的幀資料,讓使用者可以輕松集成到視頻會議和視頻特效內容創建... ......

    uj5u.com 2023-06-14 09:40:27 more
  • Apache Http Server 路徑穿越漏洞復現(CVE-2021-41773)

    # Apache Http Server 路徑穿越漏洞復現 ## Apache Http Server 路徑穿越漏洞概述 ### Apache Http Server 簡介 Apache HTTP Server(簡稱 Apache)是 Apache 軟體基金會的一個開放原始碼的網頁服務器軟體,可以在大 ......

    uj5u.com 2023-06-14 09:34:49 more
  • XSS cookie偽造攻擊

    環境 系統:windows 7 靶場:DVWA 場景:chrome對firefox的個人cookie盜用偽造 IP:192.168.98.128 埠:未占用的任意埠 [1024-49151] 實施 1.首先確保firefox登錄狀態,即存在cookie 2.構造獲取cookie的js請求腳本 < ......

    uj5u.com 2023-06-14 09:28:48 more
  • Junit執行器Runner探索之旅

    單元測驗是每個程式員必備的技能,而Runner是每個單元測驗類必有屬性。本文通過解讀Junit原始碼,介紹junit中每個執行器的使用方法,讓讀者在單元測驗時,可以靈活的使用Runner執行器。 ......

    uj5u.com 2023-06-14 09:28:39 more
  • 業務程式員不建議造輪子

    不要問我是.net程式員還是java程式員,我是業務程式員。 作業多年,我覺得業務程式員,不應該造輪子。 多年以前,我就吃過造輪子的虧,有時,我作業大概60%的時間在造輪子、改輪子的BUG,40%的時間在寫業務功能。 為什么要造輪子呢,為了學技術,為了不認輸。但是造輪子的代價很大,也影響作業,寫著業 ......

    uj5u.com 2023-06-14 09:28:35 more
  • 全堆疊工程師必備技能與工具大全

    全堆疊工程師是在前端和后端 Web 開發方面具有專業知識的專業人士。他們對各種編程語言、框架和工具有深入的了解。從無到有創建 Web 應用程式,包括設計、開發、測驗和維護。據Glassdoor的調研資料顯示,在美國,全堆疊工程師的平均年薪為114,000美金,作為能夠負責Web應用程式的前端和后端的團隊 ......

    uj5u.com 2023-06-14 09:28:31 more
  • 五年磨一劍——Sealos 云作業系統正式發布!

    ## 這是個宏偉的計劃 這是一個宏偉的計劃,漫長且有趣。 2018 年的某個夜晚,夜深人靜,我揮舞鍵盤,敲下了 Sealos 的第一行代碼。當時倉庫命名為 “kubeinit”,后來覺得格局太小,我不可能只做一個安裝 Kubernetes 的工具。安裝只是更大計劃的一部分,于是更名為 [Sealos ......

    uj5u.com 2023-06-14 09:23:05 more
  • 【解決方法】銳捷EVE模擬器中VPC無法通過DHCP獲取IP地址,改用介面

    # 環境: >工具:銳捷EVE模擬器,VMware Workstation Pro 遠程工具:SecureCRT 系統版本:Windows 10 # 問題描述: >描述:一個簡單的DHCP環境,使用VPC充當PC客戶機,IP地址獲取為DHCP方式。但在發送request資料包后,服務器服務器已經把地 ......

    uj5u.com 2023-06-14 09:19:01 more
  • 架構師日記-從技術角度揭露電商大促備戰的奧秘

    今年的618大促已經如期而至,接下來我會從技術的角度,跟大家聊聊大促備戰的底層邏輯和實戰方案,希望能夠解答大家心中的一些疑惑。 ......

    uj5u.com 2023-06-14 09:18:45 more
  • 自然語言處理 Paddle NLP - 預訓練語言模型及應用

    ### 什么是語言理解? 關于疫情的一段對話: - 中國:我們這邊快完了 - 歐洲:我們這邊快完了 - 中國:我們好多了 - 歐洲:我們好多了 挑戰: - 語言的復雜性和多樣性 1. 多義/同義/歧義現象 2. 靈活多變的表達形式 - 語言背后的環境知識 1. 以前沒錢買華為,現在沒錢買華為 語言理 ......

    uj5u.com 2023-06-14 09:17:22 more