主頁 >  其他 > ZEGO 即構音樂場景降噪技術決議

ZEGO 即構音樂場景降噪技術決議

2023-06-22 07:45:16 其他

隨著線上泛娛樂的興起,語聊房、在線 KTV 以及直播等場景在人們的日常生活中占據越來越重要的地位,用戶對于音質的要求也越來越高,因此超越傳統語音降噪演算法的 AI 降噪演算法應運而生,所以目前各大 RTC 廠商普遍使用 AI 技術進行降噪處理,使用 AI 降噪技術消除除人聲外的一切聲音,

但對于一些特殊場景,如在線 KTV、線上直播等聲卡場景,或者彈唱、伴奏、樂器等使用場景中,我們可以明顯的感受到,一般降噪處理或 AI 降噪處理的程序中會將音樂/伴奏誤識別為噪音,并進行降噪處理,給用戶帶來很不好的線上體驗,因此,在此類使用場景中用戶越來越不滿足于背景降噪,而是提出更高要求,那就是深度降噪的同時保留音樂的音質,為了滿足用戶消噪與音樂音質高保真的需求,ZEGO 即構科技自研了一套自適應降噪方案,能在音樂與非音樂場景中智能切換,既保證了無音樂場景下的語音的質量,又保留了音樂的高保真音質,

音樂場景降噪方案簡介

首先簡單了解一下即構音樂場景降噪的方案流程:

圖片

從圖中可以看到,經過前處理后的音頻資料會被送入 AI 音樂檢測模塊,接著根據檢測結果將場景分為音樂和非音樂場景,若檢測出音樂場景則會使用傳統降噪對音頻資料進行處理,以減少對音樂的損傷,非音樂場景則繼續使用 AI 降噪進行更深度的噪聲消除,最后資料會經過自動增益模塊完成最終的語音增強,

關于 AI 音樂檢測演算法

由上文描述中可以看到,完成音樂場景降噪功能最重要的一環就是 AI 音樂檢測演算法,為了滿足音樂場景的實時切換與極高檢測率的需求,我們自研了基于AI的音樂檢測演算法 ZegoAIMusicDetecion, 演算法流程如下:

圖片

我們對資料進行幀長為 20ms,幀移為 10ms 的 STFT 處理后,使用 Bark 頻帶尺度將資料分為8 個子帶,再分別求取一階差分,二階差分和譜平坦度最終得到 25 維特征,將計算得到的特征送入到我們設計的輕量型網路模型 CRNN,模型結構如下:

圖片

這里使用多層 Conv1d 卷積層能進一步的對特征進行提取,訓練時,我們搜集了大量的開源音樂、語音與噪聲資料進行訓練,同時使用不同信噪比進行資料混合增強,確保模型有足夠的泛化性,在訓練優化器上,我們選擇了 AdamW 以更好地對模型進行正則化處理,學習率為 0.001,批大小是 64,損失函式我們使用了交叉熵函式,公式如下:

圖片

演算法效果與性能開銷

有了 AI 音樂檢測演算法的幫助,我們最終可以實作針對音樂場景的降噪方案,方案最終的效果如下:

降噪方案_001.gif

從上面的頻譜圖以及實際的聽感來看,都可以直觀的感受到即構音樂場景降噪方案對音樂音質的保護,在提供良好效果的同時,ZegoAIMusicDetecion 秉承著極輕量級模型的設計理念,整體計算量大約為 1.2M FLOPS,RTF 指標在各個平臺和終端上均控制在 0.2% 以內,在此基礎上,我們采用多幀平滑的后處理技術使音樂檢測誤檢率低于 1%,音樂檢測率達到 95% 以上,

技術展望

音樂場景在泛娛樂社交和互動中十分常見,需要注重用戶和聽眾的使用感覺,做好音樂場景降噪處理,綜上所述,ZEGO 即構科技為了同時兼顧降噪與音樂音質體驗,自研了基于 AI 的音樂檢測演算法(點這里),設計出一套音樂場景降噪方案,充分體現即構對于用戶良好體驗的高度重視,

未來,我們會結合具體行業和場景,引入更多的可行性方案,提升產品的場景適應能力,給用戶提供更好的音頻體驗!了解更多ZEGO即構IM即時通訊服務,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/555764.html

標籤:其他

上一篇:即視角|出海正當時:歐美、東南亞、中東、拉美市場觀察

下一篇:返回列表

標籤雲
其他(161452) Python(38244) JavaScript(25512) Java(18251) C(15238) 區塊鏈(8271) C#(7972) AI(7469) 爪哇(7425) MySQL(7260) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5875) 数组(5741) R(5409) Linux(5347) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4606) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2436) ASP.NET(2404) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1984) HtmlCss(1970) 功能(1967) Web開發(1951) C++(1942) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1881) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • ZEGO 即構音樂場景降噪技術決議

    隨著線上泛娛樂的興起,語聊房、在線 KTV 以及直播等場景在人們的日常生活中占據越來越重要的地位,用戶對于音質的要求也越來越高,因此超越傳統語音降噪演算法的 AI 降噪演算法應運而生,所以目前各大 RTC 廠商普遍使用 AI 技術進行降噪處理,使用 AI 降噪技術消除除人聲外的一切聲音。 但對于一些特殊 ......

    uj5u.com 2023-06-22 07:45:16 more
  • 即視角|出海正當時:歐美、東南亞、中東、拉美市場觀察

    共享即構新洞察,共建行業新動能——ZEGO即構科技基于音視頻技術領域的多年深耕,綜合面向各行業的服務經驗,推出【即視角】欄目,發布即構對行業的洞察。歡迎大家探討論道,共驅前行。 ......

    uj5u.com 2023-06-22 07:44:46 more
  • 視頻直播原始碼技術知識分享:連麥功能(一)

    我們開發視頻直播平臺就要去了解視頻直播開發相關功能知識,這對我們開發平臺有著重要的作用,連麥技術就是視頻直播原始碼重要的技術功能之一,每一個功能技術都有自己的用武之地 ......

    uj5u.com 2023-06-22 07:43:25 more
  • 自動化平臺總結(httprunner+djangorestframework+python3+Mysql+

    一、前言 最近從零搭建了一個自動化測驗平臺,雖然不是第一次從零搭建,但是也從來沒有進行過這類搭建的總結,還是記錄一下,搭建程序中的一些問題和方法。方便以后總結和翻閱 二、簡介 搭建的平臺語言使用的是Python3.6,未來有空可能考慮加個java版本。前端用的Vue,主體是httprunner2.X ......

    uj5u.com 2023-06-22 07:43:10 more
  • 花2個月時間整理了3.5W字的自動化測驗面試題(答案+學習路線)!為了找

    從5月初開始找作業到現在,先后面試了阿里巴巴、位元組跳動、網易、快手的測驗開發崗。大公司對于測驗開發的要求相比來說高很多,要求掌握的知識點的廣度和深度層次也比較高,遂整理了這兩個月的面試題目檔案供大家參考,同時也是為了方便以后自己需要的時候刷一刷,不用再去到處找題。希望大家都能找到滿意的作業,共勉之! ......

    uj5u.com 2023-06-22 07:43:04 more
  • 淺析GeoServer CVE-2023-25157 SQL注入

    GeoServer是一個開源的地圖服務器,它是遵循OpenGIS Web服務器規范的J2EE實作,通過它可以方便的將地圖資料發布為地圖服務,實作地理空間資料在用戶之間的共享。 ......

    uj5u.com 2023-06-22 07:42:40 more
  • 【技識訓累】演算法中的基本概念【一】

    博客推行版本更新,成果積累制度,已經寫過的博客還會再次更新,不斷地琢磨,高質量高數量都是要追求的,工匠精神是學習必不可少的精神。因此,大家有何建議歡迎在評論區踴躍發言,你們的支持是我最大的動力,你們敢投,我就敢肝 ......

    uj5u.com 2023-06-21 08:20:56 more
  • 現代密碼學第四版楊波著-期末復習匯總

    我將用一整天突擊,嶄新的一本書,從0到期末80+,(僅針對本校逆天考點進行總結) 完本總結:總計歷經兩天半,共計15小時,總計30+頁,僅帶來個人的復習思路與心路歷程 寫本博客原因? 馬上期末考試,整本書從來沒有看過,嘗試0基礎一天學完,突破自己。 網上沒有完全符合本課程的詳細匯總(其中一篇總結不錯 ......

    uj5u.com 2023-06-21 08:19:27 more
  • 用Python寫了一個「擁抱梅西」的小游戲

    大家好,歡迎來到 Crossin的編程教室 ! 最近有個小伙兒因為在比賽中沖進場地擁抱梅西而出名了。 這種行為當然不可取,他也為此付出了代價。但要說我沒有一丁點羨慕和佩服那是不可能的。 于是,我也尬蹭一下這個熱點,用Python寫了一個「擁抱梅西」的小游戲。 游戲效果是這樣的: 游戲規則很簡單: 不 ......

    uj5u.com 2023-06-21 08:18:35 more
  • 從0到1構造自定義限流組件

    在系統高可用設計中,介面限流是一個非常重要環節,一方面是出于對自身服務器資源的保護,另一方面也是對依萊澩的一種保護措施。比如對于 Web 應用,我限制單機只能處理每秒 1000 次的請求,超過的部分直接回傳錯誤給客戶端。雖然這種做法損害了用戶的使用體驗,但是它是在極端并發下的無奈之舉,是短暫的行為... ......

    uj5u.com 2023-06-21 08:17:26 more