“卷”起來的自動(dòng)駕駛高算力賽道
實(shí)現(xiàn)L4級(jí)自動(dòng)駕駛究竟需要多少算力?目前并沒有一個(gè)明確的答案,車企不輕易下結(jié)論,似乎算力越高越有安全感;芯片廠商們的口徑一直在變,從幾百TOPS上漲到幾千TOPS……
對于未來智能汽車的想象,業(yè)內(nèi)有一種說法是“A Data Center on Wheels”,即“輪子上的數(shù)據(jù)中心”,在可預(yù)見的將來,一輛汽車甚至可以相當(dāng)于現(xiàn)在數(shù)據(jù)中心的算力級(jí)別。整個(gè)自動(dòng)駕駛芯片領(lǐng)域的廠商們,都在向算力指數(shù)級(jí)翻倍和更先進(jìn)芯片制程的道路上策馬揚(yáng)鞭。這個(gè)高度“內(nèi)卷”的賽道,是什么在背后推動(dòng)?算力的無限膨脹和制程的持續(xù)提升,什么時(shí)候才能“卷”到盡頭?
自動(dòng)駕駛系統(tǒng)之重
AI域控制器
自動(dòng)駕駛域控制器是自動(dòng)駕駛系統(tǒng)的中央計(jì)算單元,它需要高算力來實(shí)現(xiàn)感知、規(guī)劃和決策等關(guān)鍵任務(wù),是未來智能汽車的“大腦”。受益于汽車的智能化發(fā)展,以及汽車電子電氣架構(gòu)由分布走向集中的趨勢,域控制器市場正在快速增長。
同時(shí),自動(dòng)駕駛域控制器之所以越來越重要,主要原因是全車算力向駕駛域集中。駕駛域算力追加的主要驅(qū)動(dòng)因素,則是傳感器輸入信號(hào)的復(fù)雜程度逐步提升,使底層 SoC 需要同步提升自身的計(jì)算能力、傳輸帶寬、存儲(chǔ)能力。
例如,L2 級(jí)別側(cè)視攝像頭的加入,導(dǎo)致需要預(yù)處理的視頻數(shù)據(jù)成倍增加,L3+級(jí)別激光雷達(dá)的加入又不斷地生成千萬級(jí)的待處理點(diǎn)云信息……這都使得自動(dòng)駕駛域控制器成為車上算力需求最高的計(jì)算中心。同時(shí),出于安全性要求,自動(dòng)駕駛域還需要布設(shè)冗余,甚至駕駛域未來還將逐步整合座艙域、車身域等功能域。
那么,在人工智能發(fā)展下所催生的AI域控制器,和傳統(tǒng)意義上的控制器有什么差別?
傳統(tǒng)控制器稱作ECU,每一輛車包括多個(gè)ECU,每個(gè)ECU負(fù)責(zé)固定的功能。AI域控制器通過AI算法做傳感器感知,對物體、路徑進(jìn)行識(shí)別判斷。相對于傳統(tǒng)控制器,。AI域控制器一是減少了ECU的數(shù)量,二是大幅優(yōu)化了傳統(tǒng)車輛的線束問題。
目前,AI域控制器功能主要由主控芯片、系統(tǒng)軟件(操作系統(tǒng)、中間件)和應(yīng)用算法協(xié)同實(shí)現(xiàn)。從目前車企的做法來看,業(yè)內(nèi)普遍認(rèn)為以主控芯片為代表的高性能硬件會(huì)率先上車,而操作系統(tǒng)及應(yīng)用軟件等則會(huì)隨著算法模型不斷迭代持續(xù)更新,逐步釋放預(yù)埋硬件的利用率,保證汽車功能的迭代升級(jí)。
蔚然成風(fēng)的“硬件預(yù)埋”趨勢
在探討自動(dòng)駕駛域控制器的芯片升級(jí)之前,要先談?wù)劕F(xiàn)在流行的“硬件預(yù)埋”。正如本文開頭所說,L4級(jí)自動(dòng)駕駛究竟需要多少算力,沒有一個(gè)唯一的答案。事實(shí)上,這個(gè)“多少才算夠用”的標(biāo)準(zhǔn),正在持續(xù)升級(jí)。
主機(jī)廠紛紛推動(dòng)“硬件預(yù)埋”概念,也就是說,雖然目前可能用不到這么高算力的芯片,但是超前地先把硬件做足,將來通過OTA升級(jí),一步步在該硬件平臺(tái)上疊加更多的算法,實(shí)現(xiàn)新的功能。
當(dāng)然,這和智能手機(jī)的堆料、比拼硬件配置還有本質(zhì)的不同, 因?yàn)槠噳勖L,而芯片的迭代周期遠(yuǎn)遠(yuǎn)短于汽車的壽命周期,因此通過“硬件預(yù)埋”的方式為下一步的升級(jí)做好前瞻規(guī)劃,也是一種合理的路徑。同時(shí),如果預(yù)埋的硬件不能滿足更高等級(jí)自動(dòng)駕駛功能對數(shù)據(jù)處理的需求時(shí),就需要對硬件升級(jí),這需要車輛設(shè)計(jì)之初便預(yù)留好相應(yīng)的硬件接口。
當(dāng)前在國內(nèi)市場,很多公司基本都是這樣的思路,硬件在能力范圍內(nèi)做到最高端,能對標(biāo)L4更好,然后軟件和算法再慢慢迭代,在L2+、L3慢慢突破,未來通過OTA達(dá)到L4。
快速變化的AI域控制器市場格局
在這些趨勢下,自動(dòng)駕駛域控制器芯片開始高度“內(nèi)卷”,不論是算力、功耗還是制程。隨著AI域控制器時(shí)代的到來,SoC 需要的芯片復(fù)雜度更高,在高算力SoC芯片競爭中,市場格局迅速變化。
在剛剛結(jié)束的CES上,英偉達(dá)推出第八代 DRIVE Hyperion 平臺(tái),該平臺(tái)由兩顆NVIDIA DRIVE Orin芯片構(gòu)成,每顆算力達(dá)254TOPS; Mobileye發(fā)布了專為L4自動(dòng)駕駛打造的新一代EyeQ Ultra芯片,算力達(dá)176TOPS,性能為上一代 Eye Q5 的 10 倍以上;安霸則推出AI域控制器芯片CV3系列SoC,算力達(dá)500 eTOPS,比上一代芯片CV2足足提高了42倍……
從當(dāng)前域控制器芯片玩家中不難發(fā)現(xiàn),在自動(dòng)駕駛的算力軍備賽中,選手類型越來越豐富,既有NXP、英飛凌、TI這樣的資深玩家,也有英偉達(dá)、高通、華為這樣的實(shí)力型選手,還有年輕的AI芯片企業(yè),以及像安霸這樣,在視覺圖像處理領(lǐng)域扎根多年的后來者。
從AI視覺感知到AI域控制器
安霸憑什么?
提起安霸,最廣為人知的一個(gè)標(biāo)簽是它在安防監(jiān)控市場的地位,憑借低功耗、超高清視頻解壓縮、機(jī)器視覺圖像處理SoC芯片等,其安防監(jiān)控芯片被全球前二十名的安防攝像機(jī)品牌采用,并成為市場主流。
但事實(shí)上,安霸在2015年就進(jìn)軍智能汽車領(lǐng)域,目前已經(jīng)量產(chǎn)了10nm制程CV2x的六大芯片系列,帶有安霸獨(dú)有的AI加速引擎設(shè)計(jì),應(yīng)用場景覆蓋ADAS、智能電子后視鏡、智能座艙駕駛員的監(jiān)測以及艙內(nèi)的感知,以及行泊一體的方案。
可以看到,從早期不帶AI硬件加速的芯片,到10nm的 CV2x系列,再到5nm的CV5,安霸已經(jīng)在智能汽車領(lǐng)域跋涉了相當(dāng)長的一段路。
在今年的CES上,安霸最新推出了基于CVflow架構(gòu)的AI域控制器CV3系列SoC,采用5nm超低功耗制程,單芯片AI算力達(dá)到500 eTOPS,預(yù)計(jì)將在今年上半年提供首批樣品。該系列算力比上一代CV2提高了42倍,同時(shí)支持高分辨率攝像頭、毫米波雷達(dá)、激光雷達(dá)和超聲波雷達(dá),據(jù)稱單芯片即可實(shí)現(xiàn)ADAS及L4級(jí)自動(dòng)駕駛。
CV3搭載了16個(gè)Arm Cortex-A78AE CPU內(nèi)核,在支持自動(dòng)駕駛系統(tǒng)的軟件應(yīng)用所需的CPU性能上,比上一代芯片CV2提高了30倍。通過單一芯片集成多傳感器,CV3可進(jìn)行集中化AI感知處理(包括高像素視覺處理、毫米波雷達(dá)、激光雷達(dá)和超聲波雷達(dá))、多傳感器深度融合以及自動(dòng)駕駛車的路徑規(guī)劃,從而打造ADAS系統(tǒng)和L2+至L4級(jí)自動(dòng)駕駛系統(tǒng)。
CV3的升級(jí),可以說將自動(dòng)駕駛賽道的高算力“內(nèi)卷”推向了高潮。安霸為什么選擇在這個(gè)時(shí)候推出一款旗艦版的AI域控制器芯片,從而在自動(dòng)駕駛高算力SoC賽道上進(jìn)行角逐?
安霸中國區(qū)總經(jīng)理馮羽濤表示,相比上一代CV2系列,CV3在純粹神經(jīng)網(wǎng)絡(luò)人工智能算力上提升了40多倍,這是一個(gè)較大的跳躍。此外,之前包括CV5在內(nèi)的所有芯片,主要還是用于視覺感知,主要的應(yīng)用場景是帶一個(gè)或多個(gè)攝像頭,做一定的智能處理。從算力的角度、以及對多傳感器的連接和處理角度來看,離真正的中央域控制器還是有一定的差距。
視覺處理技術(shù)是安霸從成立之初就專注的領(lǐng)域,近年來也大力投入AI視覺芯片,這被認(rèn)為是其核心競爭力。馮羽濤表示,自動(dòng)駕駛分析雖然需要多傳感器融合感知,但視覺是最重要的感知系統(tǒng),是人類現(xiàn)階段駕駛汽車最重要的感知能力;另一方面,來自于視覺系統(tǒng)的信息量最密集。
“之所以決定進(jìn)入這個(gè)賽道,是基于對市場發(fā)展趨勢的判斷以及對神經(jīng)網(wǎng)絡(luò)、人工智能算法的研究”,馮羽濤表示,“我們希望結(jié)合在視覺感知處理方面積累的包括ISP、低功耗SoC芯片的積累,加入高算力的基于CVflow架構(gòu)的全新設(shè)計(jì),能在智能駕駛汽車未來高速發(fā)展的5-10年間,給汽車行業(yè)提供好的選擇。
算法優(yōu)先
芯片為算法服務(wù)
在安霸的設(shè)計(jì)策略中,“算法優(yōu)先”是一個(gè)核心要素,主要體現(xiàn)在四方面:
通過其17年的圖像處理和視頻壓縮經(jīng)驗(yàn),能夠以低功耗實(shí)現(xiàn)高分辨率的視頻處理;
收購VisLab,這是一家在自動(dòng)駕駛領(lǐng)域有25年經(jīng)驗(yàn)積累的公司,通過收購,使得安霸進(jìn)一步從自動(dòng)駕駛算法對芯片的需求出發(fā),有了更深刻地理解;
收購4D成像雷達(dá)算法公司傲酷,通過將其算法與原有的視覺技術(shù)進(jìn)行融合,能夠占用較少的硬件資源實(shí)現(xiàn)非常清晰的雷達(dá)成像,實(shí)現(xiàn)更有效率的視覺和雷達(dá)感知的融合;
CVflow——這是安霸CV系列芯片的核心,是一套自研的AI算法加速引擎的芯片架構(gòu),它并非通用的計(jì)算平臺(tái),而是專門為視覺感知以及其它感知算法設(shè)計(jì)的,但同時(shí)具備一定的通用性,在功耗和運(yùn)算效率方面實(shí)現(xiàn)了較好的平衡。
也正是因?yàn)椴捎昧颂厥獾男酒軜?gòu),而非通用的GPU等架構(gòu),安霸用eTOPS來度量自身芯片的算力情況。這個(gè)eTOPS中的“e”有何涵義?與TOPS有何不同?馮羽濤介紹,“e”指的是Equivalent,意思是等價(jià)的、等效的TOPS。安霸一貫的設(shè)計(jì)思路就是在通用編程適應(yīng)性和提升功耗、成本的比例之間取得一個(gè)平衡點(diǎn),CVflow就是采用特殊的架構(gòu)專門針對卷積神經(jīng)網(wǎng)絡(luò)和常見的神經(jīng)網(wǎng)絡(luò)運(yùn)算進(jìn)行了優(yōu)化。他指出,GPU采用標(biāo)準(zhǔn)的TOPS計(jì)量,如果運(yùn)行同樣的算法實(shí)現(xiàn)等效的性能,就可以說是Equivalent TOPS(ETOPS)。
寫在最后
在自動(dòng)駕駛比拼高算力的發(fā)展背景之下,芯片廠商所面臨的機(jī)遇和挑戰(zhàn)都在相應(yīng)增長。隨著AI域控制器時(shí)代的到來,SoC 芯片復(fù)雜度更高,需要支持多任務(wù)的復(fù)雜操作系統(tǒng)和應(yīng)用,芯片廠商與域控制器企業(yè)合作,是加快研發(fā)、實(shí)現(xiàn)快速落地的重要保證。此外,在汽車芯片供應(yīng)鏈危機(jī)的映照下,芯片廠商穩(wěn)定的供貨能力也愈發(fā)關(guān)鍵。
除此之外,要打造一個(gè)高算力平臺(tái)適應(yīng)現(xiàn)在和未來諸多的算法需求,同時(shí)又要兼顧功耗和成本,本身就不是一件易事。因?yàn)檎嬲M(jìn)入應(yīng)用中,可能還會(huì)遇到新的瓶頸,所以設(shè)計(jì)之初就需要同時(shí)兼顧性能、成本、功耗等,做出適合落地的綜合權(quán)衡的SoC設(shè)計(jì),這對芯片廠商的設(shè)計(jì)能力、量產(chǎn)能力都是較大的挑戰(zhàn)。
歸根結(jié)底,一輛汽車最終還是要考慮成本、功耗等問題。算力的飆升,什么時(shí)候是最好的平衡點(diǎn)?也許現(xiàn)在暫時(shí)沒有答案,但總不會(huì)無限地?cái)U(kuò)張下去。采訪中,馮羽濤談到,“在可預(yù)見的未來五到十年,汽車自動(dòng)駕駛算力的競爭不至于再以翻N倍的方式發(fā)展,芯片的算力能效比將成為很重要的度量指標(biāo),一款芯片的算力、制程、功耗會(huì)是最核心的三個(gè)指標(biāo),代表著更好的算力平衡點(diǎn)?!?/p>
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。