人工智能探境科技之得“芯”應(yīng)手
1 AI處理平臺(tái)的前世今生
人工智能(AI)是當(dāng)前熱度很高的一個(gè)技術(shù)名詞,其技術(shù)應(yīng)用推廣由來已久,曾經(jīng)依托于高度密集計(jì)算的通用平臺(tái),主要是基于中央處理器(CPU)的計(jì)算器,或是基于數(shù)字信號(hào)處理器(DSP)的實(shí)時(shí)嵌入式系統(tǒng),然后逐步發(fā)展和演化成為深度學(xué)習(xí)的有效實(shí)現(xiàn)手段,由此對(duì)核心處理器平臺(tái)提出更高更嚴(yán)苛的要求,從而催生了專用AI處理平臺(tái)。筆者曾有十多年從事DSP業(yè)務(wù)拓展的經(jīng)歷,對(duì)于AI處理平臺(tái)創(chuàng)新并開創(chuàng)一個(gè)全新的智能化局面充滿了好奇,于是拜訪了北京探境科技有限公司,與魯勇董事長進(jìn)行探討,對(duì)于以神經(jīng)網(wǎng)絡(luò)處理方式來構(gòu)建具有顛覆式AI架構(gòu)有了深度的了解。
首先我們從處理器的基本架構(gòu)談起。眾所周知,CPU的體系是沿用經(jīng)典計(jì)算機(jī)的馮·諾依曼體系,而DSP則采用哈佛結(jié)構(gòu),且不斷改進(jìn)。DSP將地址總線和數(shù)據(jù)總線分開以便提高存儲(chǔ)器訪問速度,又增加流水線結(jié)構(gòu),旨在有效提高處理速度,特別有益于以系列乘加為主體的卷積運(yùn)算,而這正是數(shù)字濾波器的基本結(jié)構(gòu)。語音處理技術(shù)發(fā)展得益于DSP,然而其應(yīng)用卻受制于其通用性,使得包括語音識(shí)別在內(nèi)的智能語音應(yīng)用局限性較大。對(duì)于智能圖像和智能視頻處理同樣存在這樣的問題,所以構(gòu)建具有針對(duì)性的新型AI平臺(tái),最大限度地匹配目標(biāo)應(yīng)用勢(shì)在必行。
圖1 SFA體系架構(gòu)示意圖
2 生根于SFA的芯片架構(gòu)
新型AI平臺(tái)必然是一個(gè)神經(jīng)網(wǎng)絡(luò)處理器NPU(Neural Processing Unit),魯勇指出業(yè)界芯片最核心的設(shè)計(jì)指標(biāo)是PPA(Perform Power Area),即性能、功耗、還有與成本相關(guān)的芯片面積,AI處理平臺(tái)要在架構(gòu)上有重大突破必定要立足于此。探境科技公司初創(chuàng)就確定創(chuàng)立自主的AI架構(gòu),其最終目標(biāo)是既要有面向神經(jīng)網(wǎng)絡(luò)的通用性,又把重點(diǎn)放在提升數(shù)據(jù)管理和調(diào)度效率的針對(duì)性。與DSP解決的計(jì)算復(fù)雜度即“算力”問題不同, AI面對(duì)處理的對(duì)象是龐大的數(shù)據(jù)包,要讓海量數(shù)據(jù)柔和、順利地傳遞到計(jì)算單元里來,就要更好地實(shí)現(xiàn)存取的匹配。在這過程中解決指數(shù)級(jí)增長的存儲(chǔ)問題是關(guān)鍵,有個(gè)專業(yè)名稱叫“存儲(chǔ)墻”,只有打破其束縛,才能使AI處理算法游刃有余。探境科技獨(dú)創(chuàng)的SFA(Storage First Architecture)存儲(chǔ)優(yōu)先架構(gòu),用存儲(chǔ)來驅(qū)動(dòng)計(jì)算能力,推翻馮·諾依曼體系,完全區(qū)別于之前各類處理器芯片的架構(gòu)。如圖1所示即為SFA體系架構(gòu)示意圖。
實(shí)測(cè)數(shù)據(jù)表明,SFA體系具有超高能效比,在同等條件下,數(shù)據(jù)訪問可降低10~100倍,存儲(chǔ)子系統(tǒng)功耗下降10倍。采用28 nm工藝,系統(tǒng)能效超過4T+OPS/W。
圖2 基于VOI611的語音識(shí)別模組及框圖
3 基于SFA架構(gòu)AI芯片的優(yōu)勢(shì)
AI設(shè)計(jì)公司的判定標(biāo)準(zhǔn)在于是否有能力設(shè)計(jì)AI芯片,這是魯勇所持的觀點(diǎn),那么代表著技術(shù)高低的絕對(duì)判斷就是AI芯片的PPA。基于SFA的AI芯片目前具有語音和圖像兩個(gè)分支,語音芯片最重要的關(guān)注點(diǎn)在于A,就是一定性能下的低成本,采用55 nm工藝可以減少投片費(fèi)用,獲得很高的性價(jià)比。而圖像芯片關(guān)注2個(gè)P,就是追求高性能下的低功耗,采用能效比較高的28 nm工藝,其實(shí)探境科技實(shí)現(xiàn)的能力已經(jīng)超過業(yè)界12 nm工藝所達(dá)到的水平。
與符合現(xiàn)有AI需求特征的芯片一樣,SFA芯片需要支持各種各樣的神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)則根據(jù)不同的應(yīng)用場(chǎng)景放不同算法。事實(shí)上,SFA能夠支持所有已知深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),等同于GPU的兼容性,對(duì)神經(jīng)網(wǎng)絡(luò)的參數(shù)沒有限制,對(duì)數(shù)據(jù)類型也沒有限制,其中包括INT4/INT8/INT16/FP16/自定義浮點(diǎn),還有自適應(yīng)稀疏數(shù)據(jù)處理等。
此外,SFA架構(gòu)真正符合商業(yè)應(yīng)用的AI芯片架構(gòu)的特點(diǎn)在于:①采用成熟設(shè)計(jì)方案,無需對(duì)底層器件進(jìn)行修改設(shè)計(jì),商業(yè)化路徑快;②通用性高,芯片面向的場(chǎng)景眾多,必須支持多種算法才可以被商業(yè)化;③易用性高,用戶學(xué)習(xí)成本低,模型移植簡單。
在談及SFA芯片開發(fā)的感受,魯勇不無感慨地說,探境科技自2017起零基礎(chǔ)自主創(chuàng)新,沒有可參考的東西。他本人雖有多年Marvell的工作經(jīng)歷,但背景領(lǐng)域卻沒有相通之處。然而,多年的芯片設(shè)計(jì)經(jīng)驗(yàn)使他在技能訓(xùn)練上有共同點(diǎn),那就是對(duì)于結(jié)構(gòu)化算法的理解。關(guān)于芯片開發(fā)的心得,魯勇認(rèn)為首先是技術(shù)路徑順暢,其次是實(shí)現(xiàn)流程嚴(yán)謹(jǐn),所以僅用一年半就開發(fā)完成并一次流片成功。還有,就是市場(chǎng)把握準(zhǔn)確,將市場(chǎng)與銷售工作緊密結(jié)合,真正做到AI芯片應(yīng)用的落地。
圖3 前景廣闊的語音識(shí)別智能化家電應(yīng)用
4 落地在語音識(shí)別智能應(yīng)用
探境科技堅(jiān)持著“接地氣”的原則,努力使其AI芯片貼近用戶和貼近市場(chǎng)需求,首款通用型AI芯片是音旋風(fēng)VOI611,是目前業(yè)界綜合性能最好的離在線語音方案,將SFA的NPU與ARM-M3的MCU結(jié)合,并集成音頻Codec和多種接口。VOI611作為針對(duì)嵌入式產(chǎn)品的深度學(xué)習(xí)語音識(shí)別芯片,具有強(qiáng)大的降噪功能,在60 dB環(huán)境噪音下識(shí)別率可達(dá)到98%以上;雙麥即可實(shí)現(xiàn)麥克風(fēng)陣列的效果,支持10 m遠(yuǎn)場(chǎng)識(shí)別、噪聲抑制、音源定位等功能;命令識(shí)別數(shù)量最高為200個(gè),憑借深度學(xué)習(xí)技術(shù),不針對(duì)特定人,也不需要持續(xù)更新。
既然定位為以技術(shù)和產(chǎn)品驅(qū)動(dòng)的AI芯片公司,就需要具備相輔相成的2個(gè)能力,即AI芯片創(chuàng)建能力和AI算法構(gòu)建。探境科技不僅提供包含算法的異構(gòu)單片系統(tǒng)(SoC)芯片,也要提供完整“交鑰匙(Turn-Key)”的模組解決方案,從而以全能型選手姿態(tài)來全面符合市場(chǎng)需求。為此,所交付的產(chǎn)品要全面滿足客戶的需要,其技術(shù)核心的七到八成在于客戶對(duì)算法語音識(shí)別效果的認(rèn)可。圖2所示為基于VOI611的語音識(shí)別模組的實(shí)物圖和系統(tǒng)框圖。
在探境科技的實(shí)驗(yàn)室里,魯勇做了語音控制產(chǎn)品演示,特別是在抗擊疫情中發(fā)揮了顯著作用的聲控電梯控制器,全程無需按鍵接觸,體現(xiàn)了語音交互的好處。筆者亦應(yīng)邀體驗(yàn)了各類智能語音產(chǎn)品,驚喜地感受到不僅是電梯,還有燈具、空調(diào)、風(fēng)扇等各種各樣電器,都成了“聽話”的智能化設(shè)備。
AI語音識(shí)別芯片的另一個(gè)重要的應(yīng)用領(lǐng)域就是汽車,這就對(duì)技術(shù)指標(biāo)提出更高的要求,探境語音算法的多項(xiàng)“黑科技”將大顯身手,包括性能優(yōu)異適應(yīng)性強(qiáng)的自研AI降噪算法、高計(jì)算強(qiáng)度神經(jīng)網(wǎng)絡(luò)HONN技術(shù)、更強(qiáng)大更具魯棒性的雙麥識(shí)別技術(shù),當(dāng)然必須具備的還有車規(guī)級(jí)的芯片標(biāo)準(zhǔn)。
此外,自創(chuàng)立伊始,圖像就是探境志在必得的重要領(lǐng)域。目前,探境科技正在加緊開發(fā)為視覺領(lǐng)域設(shè)計(jì)、與量身定制神經(jīng)網(wǎng)絡(luò)相結(jié)合的高度集成AI芯片,并將提供具有智能圖像深度學(xué)習(xí)算法的全棧式方案,預(yù)計(jì)明年發(fā)布,未來將助力安防監(jiān)控系統(tǒng)、機(jī)器視覺系統(tǒng)、汽車自動(dòng)駕駛,及新型零售系統(tǒng)等領(lǐng)域智能化水平的全面提升。
評(píng)論