主頁 >  其他 > 第一次作業進展報告(論文閱讀:A Survey on Adaptive 360°Video Streaming: Solutions, Challenges and Opportunities)

第一次作業進展報告(論文閱讀:A Survey on Adaptive 360°Video Streaming: Solutions, Challenges and Opportunities)

2020-10-18 19:40:47 其他

第一次作業進展報告

隨著沉浸式虛擬現實(VR)技術的發展,360°視頻越來越多地被使用,然而,與傳統的視頻內容傳輸相比,其具有更高的帶寬和更低的延遲要求,如何傳輸高解析度低時延的視頻內容是虛擬現實技術發展的關鍵性問題,

在“A Survey on Adaptive 360°Video Streaming: Solutions, Challenges and Opportunities”一文中,作者從視頻投影、編碼、動態調整視口大小的自適應360°視頻流方法、傳輸360°視頻流網路相關解決方案、視口預測、體驗質量QoE評估等多方面概述了虛擬現實視頻傳輸方面的挑戰和研究機會,


在視頻投影方案中,作者介紹了四種現有的投影方法,等矩形投影(如圖1)、立方體貼圖投影(如圖2)、金字塔投影(如圖3)以及偏移立方圖投影(如圖4),等矩形投影是最為常見的投影技術,其可以表示為使用偏航角、俯仰角的值將觀察者周圍的球體展平到二維表面上,常見的例子有世界地圖,立方體貼圖投影是六邊立方體組合用于將球體的像素投影到立方體上相關像素,這種投影方式常用于游戲和視頻流媒體(如:YouTube),金字塔投影方式在視口相關投影中,顯示區域的保真度高于其它區域,這種方法將視頻的大小減少了80%,但其缺點較為突出,即當用戶的頭上下移動120°或左右旋轉180°,視頻質量會急劇下降,偏移立方圖投影與傳統的立方體貼圖技術類似,將像素投影到立方體的六個面,它具有與偏移方向相關聯的觀看區域以更高的質量顯示的特點,缺點是存盤開銷大,

圖1 圖2

圖3 圖4

在視頻編碼方面,目前高效的視頻編碼HEVC/H.265相比于VC/H.264節省了近50%的視頻位元率,其支持高效視頻流的平鋪功能,如圖5,背景一般是不動的,在這種情況下,我們的做法不是對每一幀的每一個像素編碼,而是對最初的幀編碼,然后僅對發生改變的進行編碼,與HEVC/H.265相比,下一代通用視頻編碼(VVC)標準有望將壓縮效率提高30%,

圖5 .264與H.265編碼對比

在自適應360°視頻流方案中,主要分為三類,與視口無關、與視口相關以及基于切片的流,與視口無關的流是360°視頻流傳輸的最直接的方式,因為整個幀以類似傳統視頻的同等質量傳輸整個視頻流,它的優點是不需要頭戴式顯示設備(HMD)的任何方位資訊,缺點是與視口相關的流相比,它的編碼效率低30%,需要大量的帶寬和編碼資源,與視口相關的自適應流中,終端設備僅接受特定區域的視頻幀,這些區域包含視口角度相等或更大的視覺資訊,客戶端根據網路特征和用戶的觀看方向執行自適應,在“Optimal set of 360-degree videos for viewport-adaptive streaming”一文中,描述了一種為視口相關流產生不同質量片段的實用方法,他們提出了質量強調區域(QERs)策略,以在有限數量的表示可用于流式傳輸時縮放特定區域的解析度,而在“Optimized Viewport Dependent Streaming of Stereoscopic Omnidirectional Video”一文中,提出一種通過巧妙地將不對稱質量用于立體視頻的背景和前景視圖的方法,以高質量傳輸前景視圖,以較低質量傳輸背景視圖,在基于切片的自適應流中,360°視頻被分割成相等/不相等的矩形塊,以精確地調整觀看者當前視口塊的質量,在“Towards Bandwidth Efficient Adaptive Streaming of Omnidirectional Video over HTTP: Design, Implementation, and Evaluation”一文中,研究了三種平鋪策略,即基本完全交付、高級完全交付和部分交付,使用最先進的視頻編解碼器有效地節省了360個視頻中未觀看部分的資源,如圖6所示,基本完全交付是在用戶當前視口中可見的所有圖塊都以最高可能的質量表示(綠色圖塊)進行請求,而此時不可見的所有其他圖塊都以最低可用質量表示(紅色圖塊)進行請求,高級完全交付是要求預計用戶的視口將移向的圖塊(黃色圖塊)以更高的質量傳輸,部分交付是所有其他切片(即當前視口外的那些)根本不被請求,在“HEVC tile based streaming to head mounted displays”一文中,提出一種使用HEVC編碼器的基于切片的可變解析度流系統,如圖7所示,該系統將立方體貼圖360°視頻平鋪成24個網格,每個代表一個單獨的位元流,以兩個不同質量的版本被流式傳輸到客戶端,即八個高質量的瓦片和十六個低質量的瓦片,

圖6 三種平鋪策略

圖7 基于切片的可變解析度流系統

在傳輸360°視頻流網路相關解決方案中,“Fov-aware edge caching for adaptive 360 video streaming”一文基于其他用戶的觀看行為,為360°視頻引入了一種流行的內容(如FoV)快取策略,次策略中客戶端的質量適應有兩個主要組成部分:FoV預測和吞吐量估計,自適應演算法每100毫秒從客戶的FoV中提取樣本,并使用10個最近的FoV樣本作為加權線性回歸(WLR)方法的輸入,以預測未來的FoV,吞吐量估計中,吞吐量樣本是下載一個視頻片段時達到的估計吞吐量,網路吞吐量估計是通過平均最后三個吞吐量樣本來完成的,文中提出基于優先級的取舍方式,優先級與當前的網路吞吐量以及是否位于客戶端的FoV內有關,當快取已滿時,移除具有最低優先級的切片,而“MUVR: Supporting multi-user mobile virtual reality with resource constrained edge cloud”一文提出了多用戶虛擬現實(MUVR)框架,其中邊緣云自適應地存盤和重用冗余VR幀,以減少計算和傳輸負載,例如在每個用戶端有一個小的本地快取,在邊緣有一個相當大的中央快取,這種快取設計通過為所有用戶生成背景視圖,盡可能重用框架來減少記憶體需求,

在視口預測中,可根據與視頻內容相不相關進行分類,與視頻內容不相關的方法一般使用觀看者的頭部運動資料進行視口預測,在“Delay Impact on MPEG OMAF’s tile-based viewport-dependent 360?video streaming”一文中,考慮了兩種預測變數:角速度和角加速度,用于根據用戶的先前方位資料來估計他/她的未來頭部方位,而在“Predictive View Generation to Enable Mobile 360-degree and VR Experiences”一文提出一種預測視頻生成的方法,提取預測視圖并提前傳輸,從而同時減少帶寬和延遲,本文收集來自三星虛擬現實網站上的36000多名觀眾的19段視頻的頭部運動資料,將用戶視野使用基于平鋪的格式來表現視點特征,每個網路尺寸為30°×30°,則360°可分為72塊,根據過去2s的視點軌跡來預測視點,設計one-hot編碼,將視點表示為72×10的矩陣V,V的元素為0或1,先前的視點分片序列輸入本文提出的多層LSTM模型中,最終輸出72個分片上的預測概率,選擇m個概率最高的分片,組合成預測視場,高質量地傳輸預測視場,其余分片保存空白,在實驗部分,文中比較了LSTM模型FOV的預測精度與SAE、BT、kNN模型FOV的預測精度,得出在低運動序列、中等運動序列和高運動序列中,LSTM模型FOV的預測精度優于SAE、BT、kNN模型的實驗結論,并相較于上述模型擁有更大的像素節省,達到減少帶寬和延遲的目的,

對于與視頻內容相關的視口預測方法,“Fixation Prediction for 360 Video Streaming in Head-Mounted Virtual Reality”一文提出一種預測網路,可以同時利用傳感器和視頻內容相關的特性來預測未來觀眾的視口,視頻內容相關包括影像顯著圖和運動圖,作者提出訓練深度神經網路來預測顯著圖,網路模型的前三層是預訓練的VGG-16,在VGG-16后面接著兩個附加層,以提高模糊影像顯著圖的泛化能力,而觀看者的頭部位置資訊由HMD中的傳感器采集,包括偏航角(yaw)、俯仰角(pitch)、翻滾角(roll),文中的視口預測網路使用的是LSTM模型,網路的功能是預測觀眾在未來的視頻中最有可能看哪里,如圖8所示,本文提出兩種LSTM網路,第一種網路的輸入是顯著圖、運動圖以及頭部資訊,第二種網路的輸入是顯著圖、運動圖以及當前觀看者視口位置資訊,兩種網路的輸出都是預測未來視頻幀中觀看者的觀看概率,兩種網路都以滑動視窗中m個過去視頻幀的特征作為輸入,并以預測視窗中n個未來視頻幀為輸出來預測切片的觀看概率,文中使用的資料集是自己采集的12個觀看者的資訊,訓練程序中將資料集80%作為訓練集,20%作為測驗集,使用交叉熵損失函式,

圖8 兩種LSTM網路模型

在體驗質量QoE評估中,作者介紹了兩種評估方法,主觀評估和客觀評估,在“Subjective and objective quality assessment of panoramic videos in virtual reality environments”一文中,提出了一種全景視頻主觀評價方法SAMPVIQ,此方法第一步為訓練階段,首先將參考視頻16給觀察者看,然后我們通知并播放了視頻16從高到低質量的視頻序列,目的是給觀察者基本的預期得分,第二階段預測驗階段我們選擇了三組視頻16,每組包含一個參考視頻和三個經過處理的視頻,視頻播放完后,觀察者打分,然后作業人員記錄分數,完成三套后,我們比較了記錄的分數和預期的分數,如果記錄的分數與所有三組的預期相匹配,觀察者就可以進入測驗階段,第三階段測驗階段每個觀察者觀看6類全景視頻,每類視頻包含八組視頻序列,每組包含一個參考視頻和三個隨機播放的已處理視頻,視頻播放時,觀察者打分,然后作業人員記錄分數,所有視頻序列播放完畢后,測驗結束,評分等級為0-5,最終結果可以描述為平均意見得分(mean opinion score,MOS),而客觀評估方法中,“Quality metric for spherical panoramic video”一文提出了一個克拉斯特拋物線投影-PSNR (CPP-PSNR)度量標準,通過將像素重新映射到CPP投影而不改變空間解析度并計算實際像素位置的PSNR來比較各種投影方案,而在“Impact of V arious Motion Interpolation Algorithms on 360?Video QoE”一文中指出僅僅在虛擬現實中測量視覺質量對于一個完整的QoE框架來說是不夠的,找到其他因素的影響也很重要,例如網路疾病、生理癥狀、用戶不適、HMD權重、可用性、VR音頻、視口退化率、網路特性(例如延遲、抖動、帶寬等),

總結:高質量的360°視頻內容的創建、分發和流式傳輸依然是一個關鍵性問題,除了上述提及的研究方向及其解決方法外,仍有許多問題可以進一步研究,例如:可以利用基于機器學習的帶寬預測方法來捕獲位元率分配的實際帶寬模式,此外,基于多路徑的高解析度360°切片傳輸可以通過最佳可用路徑提供高優先級切片,從而帶來更好的性能和更大的靈活性,使用mmWave通信的自適應計算卸載研究可以支持室內和室外環境中的同步360°流,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/178631.html

標籤:AI

上一篇:一、SVN服務器的下載與安裝與使用(創建專案、用戶、分組)

下一篇:如何下載學習通上老師們放在學習章節中的PDF?

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more