AI相關
網易有道AI團隊自主設計研發了高性能端側機器學習計算庫——EMLL(Edge ML Library),并已在近日開源,EMLL 為加速端側 AI 推理而設計,提供基于端側處理器的高性能機器學習計算庫,支持fp32、fp16、int8等資料型別,已在網易有道詞典筆、翻譯王和超級詞典等智能硬體產品的 NMT、ASR、OCR 引擎中應用,大幅提高計算性能,提升用戶體驗,
EMLL和eigen在架構上處于同一層面,
開源地址:https://github.com/netease-youdao/EMLL
在開發者大會上,有道專家介紹了它們方案使用EMLL和EIGEN庫在不同平臺上的性能表現,

網易有道詞典筆、超級詞典、翻譯王均內嵌了網易有道自主研發的神經網路翻譯NMT、光學字符識別OCR、語音識別ASR、語音合成TTS等業內領先的AI技術,并且支持離線功能,

有道的應用主要幾種在語音方面,視頻方面的不多,畢竟是做文字起家的,
思必馳,思必馳也是主要做語音的,主要介紹了語音方案在智慧駕駛,智慧座艙中的應用情況,在分享中,思必馳的專家分享了一段視頻,全場景車載語音場景落地,無需要用手,只需要語音就能實作和車載電子以及控制的互動,還分享了另外一段視頻,關于智能收音機的,收音機在現在的車型中屬于比較小眾的搭配了,幾種在低端車型,5萬以下的車當中,但是經過智能化改造之后,應用還是非常的擊中痛點的,尤其對于帶小孩的家庭祝福來說,不用騰出手專門操作電子設備了,這點比較重要,畢竟,駕駛是對女人和車輛的雙重傷害,復雜的電子設備就不要橫插一杠了,
對于AI的未來技術路線, 思必馳專家認為,未來語音方面自監督學習是發展方向,并且在思必馳內部已經進行了嘗試,在部分場景中落地,
關于智慧座艙,專家還提到,方案可以抑制小聲音,閑聊的聲音以及后排的聊天聲音等等不重要的聲音,通過演算法都過濾掉了,
RK第四代NNA IP
RK的NNA技術來源于VIP,經過了四代演進,已經笑話和吸收并形成了改進的能力,第四代NPU就是其在消化吸收的基礎上對NPU做的一次性能提升,
整體架構和使用方式和VIP相似:














總體上,RKNN無論工具還是軟體架構都類似于VIP,RKNNToolkit的功能更是和acuity toolchain如出一轍,
IP結構上面,VIP分為了NN,TP,PPU(shader)三種計算單元,卷積放在NN上執行,由于NN是硬體連線,執行效率和功耗更占優,TP則是負責記憶體搬運,比如池化操作放在TP上執行,還有PPU,它類似于GPU中的 Shader單元,可以通過編成實作靈活的邏輯,有專門的指令集EVIS對其進行編程,上采樣算子以及反量化算子可以放上去跑,
當然,RK不叫這個名字,但是也僅僅是不叫這個名字,RK分別叫做 CNA, DPU,PPU,應該是換湯不換藥,功能類似,
另外,看完直播后總體感覺RK的異構算力整合能力是強于我們的,很多我之前聽都沒有聽過的IP,他們已經玩兒的很6了,不過再強大的算力整合能力,也需要軟體配合好,這方面也不弱,從下圖可以看的出來:

快啟動:

第一次知道RK3588這顆芯片,NPU算力達到6TFOPS, 4屏異顯,同時支持高清解碼,新一代的性能怪獸,


結束
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/385452.html
標籤:其他
