智能汽車的AI芯片,還有突圍機會嗎?一家名為Kneron的人工智能低功耗處理器公司給出了自己的答案,
這家公司剛剛從富士康和記憶體芯片制造商華邦電子獲得新一輪戰略投資,此前,包括李嘉誠旗下的維港投資、阿里巴巴創業基金、紅杉資本、高通等知名行業巨頭及機構參與了投資,目前,公司累計融資額約1億美元,
Kneron創始人兼首席執行官Albert Liu之前曾在高通和三星負責芯片及相關軟體研發,公司成立于2015年,目前格力空調、德國自動駕駛軟體供應商Teraki都是合作客戶,
作為戰略協議的一部分,Kneron將與富士康新推出的電動汽車開放平臺進行合作,而與華邦電子的合作將專注于基于MCU的人工智能和記憶體計算芯片,
Kneron瞄準的方向,是低功耗人工智能芯片,原因是大型GPU或CPU,功耗一直是一個大問題,而除了芯片設計,這家公司還提供AI軟體演算法支持,主打邊緣側AI處理,
一、
從去年開始全球芯片的短缺潮,使得傳統芯片巨頭忙于解決產能問題,而更多的投資者和初創公司看到了新的時間視窗期,尤其是汽車智能化對AI芯片的需求正在快速增加,
Kneron看中的,也是目前大多數芯片初創公司選擇的開源RISC-V架構,這意味著不用受到ARM、x86等架構的授權限制,更可以實作一種差異化創新布局,
而目前,全球率先上車的RISC-V架構芯片,就是零跑汽車搭載的自研凌芯01芯片,單片算力達4.2Tops,域控制器由雙片組成,總算力達8.4Tops,可實作L3級自動駕駛,
其中,CPU是阿里平頭哥玄鐵C860,采用的就是RISC-V架構,而非目前汽車芯片主流的ARM架構,功耗只有4W,制造采用了28nm制程工藝,
如今,Kneron最新發布的最新一代AI芯片KL530,就是采用RISC-V架構,同時配合谷歌在2017年提出的Vision Transformer演算法,可以滿足L1和L2級別的算力需求,

選擇RISC-V,是因為這是一個開源的精簡指令集架構,同時具備可擴展、模塊化等特點,適合小型、快速和低功耗的應用設計,這對于智能電動汽車來說,至關重要,
而拋棄傳統的卷積神經網路(CNN)并轉向Vision Transformer,在Kneron公司看來是因為后者對于連續影像識別的準確度要比CNN高出30%,目前,包括特斯拉、毫末智行等公司都在采用Transformer視覺識別技術,提升抗干擾能力和識別精度,
在Kneron公司看來,要想超越傳統的輔助駕駛能力,Transformer模型是必要的,因為它們可以進行整體推理,而不是像使用cnn那樣只基于區分資訊的關鍵特征進行推理,這意味著,系統可以實作高度精確的危險檢測,顯著提高安全性,
從KL530的IP核配置來看,除了NPU、ISP,還包括一個ARM Cortex-M4@400MHz CPU用于系統控制,在8位模式下提供0.5 TOPS峰值吞吐量,最大功耗低于500毫瓦,目前這款芯片已經拿到車規級認證,
對于KL530來說,另一個特點就是ISP處理器,可以處理1080P的高動態范圍(HDR)影像,再通過機器學習和3D識別檢測物體及更加準確的距離識別,
為此,Kneron公司在今年4月還專門收購了一家名為Vatic的影像信號處理(ISP)技術供應商,后者的產品之前已經在安防監控、汽車和消費市場有不少客戶應用,這意味著,Kneron公司具備了自主研發NPU+ISP的視覺AI處理能力,
這一點,和國內的黑芝麻智能是同樣的路線,
作為黑芝麻智能的兩大核心自研IP之一,ISP的IP顯得尤為重要,因為影像資料在給到神經網路之前如果沒有調到最佳的狀態,是很難靠后端的檢測處理達到要求,而該公司的NeuralIQ ISP,對于每個MIPI的Block都會對應一個Pipeline,并且通過演算法優化和調優,
以黑芝麻智能的A1000為例,內部的ISP可以處理12路攝像頭,帶寬30Gbps,對于夜間低光照的環境情況,內部ISP可以對影像做提亮,去噪,HDR,提升影像品質,
相比于其他芯片廠商采用第三方的ISP模塊,自研能力的保障可以繼續提升性能,而不是受制于外部供應商的通用性能限制,從這一點也可以看出未來汽車AI芯片的競爭,IP核的自研能力是一個典型的差異化競爭力,
二、
不過,對于類似Kneron這樣不斷涌現出來的AI芯片初創公司,市場驗證還需要時間,
在業內人士看來,就像所有的創業公司一樣,很多時候表面上的性能指標“聽起來”不錯,但真正的“魔鬼”在于細節,而且包括英偉達在內的傳統芯片巨頭也在不斷提升性能,并且也在快速擁抱新的技術架構,
在這一點上,不少業內人士認為,現在談論RISC-V對Arm架構帶來的競爭壓力有多大,還為時過早,比如,開源IP核目前最緊要的一件事就是如何滿足汽車功能安全規范,尤其是從驗證的角度來看,還有不少問題需要解決,
利好訊息是,目前,一些RISC-V芯片嵌入式軟體開發工具正在陸續拿到ISO26262功能安全認證,比如,IAR Systems的RISC-V開發工具鏈在今年初拿到了IEC 61508和ISO26262汽車功能安全認證,包括高度優化的IAR C/C++ Compiler?和功能豐富的C-SPY?除錯器,
同時,在芯片成本上,RISC-V的確優勢非常明顯,以去年阿里平頭哥發布的玄鐵910為例,芯片性能提高一倍以上,同時芯片成本降低一半以上,
但,RISC-V似乎并非看上去那么“簡單”,作為芯片架構設計行業的教父級人物,吉姆·凱勒認為,早期的X86和Arm,同樣是因為簡單、干凈的特點而被大規模使用,但在不斷的演程序序中,開始變得越來越復雜,“相對來說,RISC-V還處于復雜性生命周期的早期,”
不過,一些傳統汽車芯片巨頭也已經在RISC-V上進行戰略布局,
今年4月,日本汽車芯片龍頭瑞薩電子宣布與RISC-V芯片方案提供商SiFive, Inc建立戰略合作伙伴關系,共同開發下一代半導體解決方案,來滿足客戶的特定需求,
SiFive智能平臺基于SiFive RISC-V矢量處理器和AI ISA擴展,具有差異化的軟體工具鏈,能夠為AI和ML應用開發可擴展的解決方案,而瑞薩的目標是在現有Arm核的基礎上,通過采用下一代高性能RISC-V核,擴展高端SoC和MCU開發能力,
而在SiFive和Kneron兩家公司的背后,都有高通的身影,與此同時,三星、英特爾也是SiFive的投資者,這家公司也被視為Arm的最大潛在競爭對手之一,目前全球十大芯片制造商中有六家是SiFive的客戶,
這意味著,一旦RISC-V架構在汽車前裝市場成為主流選項之一,初創公司與傳統巨頭幾乎都在同一起跑線上,市場競爭同樣會例外激烈,
此外,由于RISC-V架構是開源的,任何人都可以在其上添加自定義指令——這是Arm所禁止的,這為客戶和行業應用提供了一條生產特定設計的個性化道路,除了更低的功耗和更高的性能,意味著,目前相對同質化的SoC市場,有機會出現差異化競爭,
同時,目前軟銀集團仍在尋求出售Arm(此前英偉達宣布收購Arm,遭到了監管機構的阻力),許多業內人士認為,這是對RISC-V行業的巨大利好推動,
三、
此外,對于不管是純視覺感知,還是多傳感器融合感知,視覺(影像處理)能力除了受限于攝像頭像素、芯片算力,還有很大部分因素涉及到ISP影像處理,
自動駕駛芯片的核心邏輯是先看清楚、才能看得懂,當前智能汽車所用的攝像頭數量不斷增加,像素也越來越高,資料量巨大,需要高能效比神經網路加速器把周圍真正的目標識別出來,但如何清楚地感知周圍的環境,還需要比較好的影像處理,
從特斯拉的工程師招聘清單,我們可以看到,影像質量調優工程師是經常可以見到的崗位,負責鏡頭、攝像頭模塊選型及開發、質量監控、攝像頭校準、影像質量評估和優化調整,
其中,這些工程師要負責調整影像信號處理器(ISP)和攝像頭引數,在各種光照條件下獲得最佳質量的影像,此外,特斯拉的FSD芯片也集成了一個影像信號處理器(24位管道),用于處理8個攝像頭采集的資料,每秒處理高達10億像素以及相應的降噪功能,
而在手機行業,ISP處理器的重要性也不言而喻,比如,蘋果手機的內置獨立ISP和影像演算法都是采取的自研策略,此后,包括華為、小米在內的公司也都跟進布局,
不過,應用于汽車行業的ISP,門檻更高,目前,大部分量產搭載的通用ISP并不是專門為自動駕駛應用開發,所以演算法的兼容性會存在瓶頸,但由于800萬像素攝像頭正在成為高端智能汽車的首選,這對傳統ISP的帶寬處理能力提成了更高的要求,
以黑芝麻智能自主開發的ISP為例,帶寬為1.5Gpps,可以在幾毫秒內同時處理6個800萬像素攝像頭輸入通道,此外,通過采用LED閃爍抑制(LFM)技術,可以有效消除交通燈和汽車LED照明的高頻LED閃爍問題,提升不同照明條件下的交通信號和車燈識別演算法準確度,
此外, ISP演算法的重要性也是關鍵,尤其是解決夜間弱光環境下的駕駛輔助系統性能與白天的差異,同時,攝像頭模塊的適配和調優也至關重要,這一點,特斯拉就是典型成功案例,
更為關鍵的是,傳統攝像頭模組內置ISP的模式,正在逐步被高算力(中央域控)SoC內置高性能ISP所取代,這其中,還要考慮到高像素攝像頭產生的高熱量,
比如,安波福在去年提出了一套新的解決方案:基于此前的衛星電子架構原理,攝像頭也可以僅保留光學部分和CMOS芯片,將影像處理芯片轉移至域控制器,通過LVDS總線以及以太網來進行資料的傳輸,
同時,高性能ISP被集成到視覺處理器(SoC)中,意味著可以同時處理多個攝像頭資料,實作系統級成本下降,以英偉達Orin為例,硬體部分擁有超高帶寬影像介面,ISP每秒可處理64億像素,
而TI的第7代ISP,支持更高的位深度,FPD-Link III解決方案可以滿足“衛星”傳感器到中央融合處理單元的低成本、可擴展要求,一個ISP為多個攝像頭實作更好的光度校準,并確保顏色增益和噪聲過濾器運行在同一時間,使多個攝像頭的視圖拼接更自然,
從中也可以看出,在現有的硬體架構下,視覺處理能力還有很大的提升空間,但前提是,對于從攝像頭資料采集開始,到后端的影像優化、資料處理提出了更高的要求,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/351093.html
標籤:其他
上一篇:電氣公司都在用的獨立式IO模塊
