【E文E答】華為麒麟970是不是真正的AI芯片?
華為這周末搞了件不大不小的事——發(fā)布了“世界首款手機(jī)AI芯片”麒麟970——各位科技媒體小編都辛苦了,大周六晚上的不是飛去德國(guó)跑會(huì)就是在電腦前蹲直播,連約會(huì)都要改期,好氣哦。
本文引用地址:http://cafeforensic.com/article/201709/363899.htm咳,言歸正傳。
(華為官方推特介紹,“世界上第一款搭載NPU的AI芯片”)
華為為了搶這個(gè)“世界第一”著實(shí)花了不少心思,作為一個(gè)以“自研”為驕傲的企業(yè),本次麒麟970上不僅使用的是別家的(寒武紀(jì)的)神經(jīng)網(wǎng)絡(luò)處理單元(NPU),智東西還獨(dú)家獲悉到,麒麟970在物體識(shí)別方面的一整套嵌入式AI解決方案(從算法+Camera Tuning)都來自中科創(chuàng)達(dá)。
此外,據(jù)業(yè)內(nèi)人士透露,寒武紀(jì)的AI架構(gòu)在麒麟970上實(shí)現(xiàn)的梳理也并非全部是華為海思自研的技術(shù)。
這款芯片打造了多少個(gè)月?僅是加了一個(gè)NPU模塊就能叫“AI芯片”嗎?為什么華為要這么緊趕慢趕搶“第一”?聯(lián)發(fā)科、深鑒科技等業(yè)內(nèi)人士又是怎么看待麒麟970?……以上種種疑問,智東西將為你一一揭曉。
一、參數(shù)轟炸
麒麟970的參數(shù)想必大家已經(jīng)被刷屏了一遍又一遍,但為了文章完整性這里還是不能免俗地需要列一列數(shù)據(jù),看過的讀者可以直接跳過這段:
眾所周知,目前九成的手機(jī)芯片采用的是ARM的架構(gòu),麒麟970也不例外。麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架構(gòu),采用了臺(tái)積電10nm制造工藝,搭載12核高效GPU、8核高性能CPU,4.5G高速LTE Modem,支持LTE CAT.18,最高下載速度可以達(dá)到1.2Gbps,與高通目前發(fā)布的最強(qiáng)的X20 LTE基帶實(shí)力相當(dāng)。
特別值得一提的是,麒麟970的GPU用上了ARM最新推出的Mali-G72 MP12架構(gòu)——這是Mali-G72 MP12 GPU的首次商用。這個(gè)架構(gòu)很厲害,比上一代的Mali-G71性能提高了40%,能效提高了25%。
但如果拋去數(shù)據(jù),一個(gè)小細(xì)節(jié)能讓你更直觀地理解它:在智東西跟某移動(dòng)端大咖聊天的過程中,他對(duì)NPU、10nm統(tǒng)統(tǒng)只是點(diǎn)頭微笑,唯有在看到MP12 GPU小小地驚訝了一下。
與此同時(shí),麒麟970擁有兩個(gè)用于處理圖像信息的ISP,能夠更快速地響應(yīng)處理圖片,并且能在低光照度環(huán)境下對(duì)降噪進(jìn)行優(yōu)化。
由中科創(chuàng)達(dá)提供的智能拍照技術(shù)則將自動(dòng)識(shí)別鏡頭內(nèi)的物體(比如一朵靜止小花又或是一個(gè)奔跑的人類),系統(tǒng)根據(jù)該物體的屬性調(diào)整相機(jī)參數(shù)或是進(jìn)行主動(dòng)去糊。
麒麟970會(huì)搭載在將于10月16日于慕尼黑發(fā)布的華為Mate 10手機(jī)上。
二、寒武紀(jì)?何方神圣?
既然一直在說“寒武紀(jì)”的NPU,那么這個(gè)寒武紀(jì)究竟是何方神圣呢?
寒武紀(jì)科技(Cambricon)是中科院計(jì)算所孵化出來的AI芯片創(chuàng)業(yè)公司,中科院計(jì)算所不僅對(duì)寒武紀(jì)進(jìn)行了天使輪融資,同時(shí)還給與了長(zhǎng)期的支持與投入。8月底,寒武紀(jì)宣布完成了1億美元的A輪融資,投資方為國(guó)投創(chuàng)業(yè)、阿里巴巴、聯(lián)想等,一躍成為國(guó)內(nèi)AI芯片屆當(dāng)之無愧的獨(dú)角獸。
不僅如此,寒武紀(jì)的兩位創(chuàng)始人也非常神奇——一對(duì)出身中科院的兄弟。哥哥陳云霽目前仍在中科院計(jì)算所擔(dān)任研究員,從事基礎(chǔ)科技研發(fā),弟弟陳天石則當(dāng)起了公司的CEO。
(弟弟陳天石與哥哥陳云霽)
不過,很長(zhǎng)一段時(shí)間,寒武紀(jì)這家公司一直以“研究性”企業(yè)被業(yè)內(nèi)所知,說白了就是沒有產(chǎn)品出來。直到去年4月份的世界互聯(lián)網(wǎng)大會(huì)期間,宣告自己的第一款A(yù)I芯片產(chǎn)品寒武紀(jì)1A流片了,這一點(diǎn)不斷拿來背書,新聞聯(lián)播、人民日?qǐng)?bào)都說了這事;不過之后其產(chǎn)品到底有沒有商用,有沒有量產(chǎn),并沒有官方說法,按照2016年底寒武紀(jì)CEO 陳天石的說法,“芯片從研發(fā)、量產(chǎn)到商用,是一個(gè)以年為單位的周期,所以在明年,大家將可以在市面上看到使用寒武紀(jì)技術(shù)的芯片產(chǎn)品,比如在手機(jī)、安防監(jiān)控等智能終端和云端服務(wù)器上。”
(寒武紀(jì)板卡)
不過根據(jù)中國(guó)科學(xué)院計(jì)算技術(shù)研究所發(fā)布的賀信顯示,麒麟970芯片上的NPU正是集成寒武紀(jì)1A處理器作為其核心人工智能處理單元,實(shí)現(xiàn)了手機(jī)上本地、實(shí)時(shí)、高效的智能處理。這也是寒武紀(jì)1A真正意義上的一次產(chǎn)品化應(yīng)用。
不過話說回來,恐怕也只有華為這個(gè)量級(jí)的土壕,才有能力讓寒武紀(jì)1A真正產(chǎn)品化,從這一點(diǎn)看寒武紀(jì)是抱上了一個(gè)不錯(cuò)的大腿。
三、到底什么是“AI芯片”?
上文提到,麒麟970之所以敢叫自己“AI芯片”,最主要的就是集成了寒武紀(jì)的NPU(Neural-Network Processing Unit,神經(jīng)網(wǎng)絡(luò)處理器。
現(xiàn)在所謂的手機(jī)處理器,比如高通的835、蘋果的A11、麒麟970等,實(shí)際上所指的是一個(gè)“處理器包”封裝在一起,這個(gè)計(jì)算包專業(yè)一點(diǎn)說叫Soc(System-on-a-Chip),高大上的說法是“計(jì)算平臺(tái)”;根據(jù)分工不同,很多專用功能的處理單元加進(jìn)來,比如我們最熟悉的是GPU,現(xiàn)在這個(gè)包里的獨(dú)立單元數(shù)量已經(jīng)越來越大,比如ISP(圖像處理)、Modem(通信模塊)、DSP(數(shù)字信號(hào)處理)等,不同的數(shù)據(jù)進(jìn)來,交給不同特長(zhǎng)的計(jì)算模塊來處理,這個(gè)NPU就是手機(jī)處理器平臺(tái)新加入的一個(gè)擅長(zhǎng)神經(jīng)網(wǎng)絡(luò)計(jì)算的單元,那么到底哪些應(yīng)用會(huì)用到神經(jīng)網(wǎng)絡(luò)計(jì)算?也就是現(xiàn)在最能代表人工智能計(jì)算的一些應(yīng)用,比如模式識(shí)別里的語音、圖像(人臉)識(shí)別,比如其他會(huì)用到深度學(xué)習(xí)的一些AI應(yīng)用。
為了讓這個(gè)深度神經(jīng)元網(wǎng)絡(luò)連接更快,“寒武紀(jì)1A”還設(shè)計(jì)了專門的存儲(chǔ)結(jié)構(gòu),以及完全不同于通用處理器的指令集?!八棵肟梢蕴幚?60億個(gè)神經(jīng)元和超過2萬億個(gè)突觸,功能非常強(qiáng)大,功耗卻只有原來的1/10。
有時(shí)候,有些計(jì)算單元會(huì)獨(dú)立出來,不封裝在SoC里,比如觀察蘋果iPhone的主板結(jié)構(gòu),其Modem模塊就一直獨(dú)立在其A系列處理器模塊之外;寒武紀(jì)的這個(gè)NPU單元之前也是一個(gè)獨(dú)立的處理器單元,只是這次整合封裝到了麒麟970的Soc里面。
(華為海思麒麟970架構(gòu))
(高通835架構(gòu)和華為海思960架構(gòu))
雖然芯片里的CPU、GPU、DSP都可以用來做運(yùn)算,但是NPU是專門用于神經(jīng)網(wǎng)絡(luò)架構(gòu)計(jì)算的,號(hào)稱比CPU快25倍的同時(shí)效率將提高了50倍。有點(diǎn)類似于你想要剪東西,我給你一把剪刀。
至于為什么用的是寒武紀(jì)的NPU呢?主要原因是目前國(guó)內(nèi)能做AI芯片級(jí)別的公司只有那幾家,而寒武紀(jì)是中科院出身,和華為的合作自然也是順理成章。中科院計(jì)算自己也表示,計(jì)算所自2011年以來就和華為展開合作,組建了“中科院計(jì)算所-華為聯(lián)合實(shí)驗(yàn)室”。
不過,也沒有說現(xiàn)在其他芯片的CPU+GPU+DSP架構(gòu)在人工智能應(yīng)用方面效果差到哪里去了,恰恰相反,現(xiàn)在的眾多手機(jī)廠商都在這個(gè)架構(gòu)上對(duì)AI功能進(jìn)行優(yōu)化。從高通驍龍到聯(lián)發(fā)科Helio,無不在人工智能的芯片應(yīng)用上進(jìn)行了大力優(yōu)化。比如高通在驍龍800和600系列芯片上做了一個(gè)軟件的神經(jīng)處理引擎,高通也承諾未來也會(huì)出專門用來做神經(jīng)網(wǎng)絡(luò)運(yùn)算的核——比如NPU。
所以說,這個(gè)NPU,重要,但也沒那么重要。以深度學(xué)習(xí)為例,深度學(xué)習(xí)分為訓(xùn)練(Training)和推理/應(yīng)用(Inference)兩部分,訓(xùn)練階段的確需要非常高的計(jì)算能力,但在應(yīng)用層面其實(shí)并不需要巨大的計(jì)算量——相信沒有哪個(gè)純真的用戶拿手機(jī)去做Training的。
另一方面,AI不AI,最終還是得看應(yīng)用嘛……需要整個(gè)移動(dòng)AI應(yīng)用的生態(tài)起來了,才能體現(xiàn)出硬件的優(yōu)勢(shì)。
同為手機(jī)芯片制造商,聯(lián)發(fā)科的一位產(chǎn)品技術(shù)負(fù)責(zé)人也認(rèn)為,在芯片上集成硬件相對(duì)容易,關(guān)鍵還是上層的應(yīng)用,用戶不會(huì)在意這個(gè)是不是AI,只會(huì)在意體驗(yàn)。
雖然華為展示出了三個(gè)常見應(yīng)用方向(AR、計(jì)算機(jī)視覺、自然語言處理),還動(dòng)用了開發(fā)者網(wǎng)頁、開發(fā)者工具包、應(yīng)用商店來招攬開發(fā)者,華為消費(fèi)者業(yè)務(wù)CEO余承東也在發(fā)布會(huì)現(xiàn)場(chǎng)承諾,華為將打造一個(gè)開放的AI環(huán)境,開發(fā)者可以直接接入華為NPU功能,也可以通過第三方AI框架接入(目前支持TensorFlow和Caffe)。
不過,就目前來看,移動(dòng)AI應(yīng)用開發(fā)還很少,華為現(xiàn)場(chǎng)展示的AI功能也集中在降噪、拍照美化等方面,快則快矣,沒有什么雞蛋。在應(yīng)用缺失的情況下,麒麟970、驍龍835、甚至性能再弱些的芯片使用起來也會(huì)讓用戶感覺相差不大。
四、為了這個(gè)“世界第一”煞費(fèi)苦心
不知道大家還記不記得,去年12月16日,華為旗下手機(jī)品牌榮耀推出了2016年最后一款旗艦手機(jī)——榮耀Magic。
榮耀總裁趙明在講述這款榮耀3周年的特殊新產(chǎn)品的過程中,全程未提硬件配置,只談了這款手機(jī)的八曲面外形設(shè)計(jì)和搭載由華為2012實(shí)驗(yàn)室研發(fā)4年的人工智能引擎Magic Live。
除了2012實(shí)驗(yàn)室外,華為旗下還有諾亞方舟實(shí)驗(yàn)室、高斯實(shí)驗(yàn)室、香農(nóng)實(shí)驗(yàn)室,華為沒有透露本次麒麟970使用的人工智能技術(shù)是否來自這些實(shí)驗(yàn)室,但從目前看來主要是這幾個(gè)部門在研發(fā)。
不過,僅從深度學(xué)習(xí)來說,華為的技術(shù)并不算領(lǐng)先。這也是為什么雖然華為海思方面非常想要自研“AI芯片”,但為了來得及搶上這個(gè)“世界第一”的名頭,最終選擇了和寒武紀(jì)、中科創(chuàng)達(dá)合作。
一位業(yè)內(nèi)人士對(duì)此的評(píng)價(jià)是——“從急促的拍板簽下IP核合同,到和Mate 10分開,趕在蘋果之前發(fā)布這款芯片,時(shí)間上感覺有點(diǎn)趕鴨子上架?!?/p>
那么華為這個(gè)“世界第一”真的要搶得這么急嗎?
真的要。
據(jù)傳言,這次麒麟970的項(xiàng)目做了大概4-5個(gè)月,其中包括了寒武紀(jì)、中科創(chuàng)達(dá)方面的技術(shù)整合、以及流片。從速度來說真的很快,一方面是華為干脆果斷的行事作風(fēng)體現(xiàn),另一方面也側(cè)面證明了這個(gè)“世界第一”真的很急。
據(jù)了解,臺(tái)積電下半年的生產(chǎn)線上已經(jīng)有超過30款“AI芯片”的代工排期了。雖說并不全都是手機(jī)芯片,但可以看得出這的確是一股潮流趨勢(shì)。這一趨勢(shì)在智東西和業(yè)內(nèi)人士交流過程中也感受頗深。
五、業(yè)內(nèi)聲音:AI芯片是趨勢(shì)
同為手機(jī)芯片商,聯(lián)發(fā)科的一位產(chǎn)品技術(shù)負(fù)責(zé)人告訴智東西,“AI芯片”確實(shí)是目前的行業(yè)趨勢(shì)之一,隨著手機(jī)差異化越來越少,久而久之NPU將會(huì)變成“大家都得有”的東西。
在智東西此前跟榮耀掌門人趙明的對(duì)話中也可以感受到,互聯(lián)網(wǎng)手機(jī)的競(jìng)爭(zhēng)正從之前的網(wǎng)絡(luò)營(yíng)銷、網(wǎng)絡(luò)銷售變成更技術(shù)化的比拼,在后互聯(lián)網(wǎng)手機(jī)的時(shí)代,人工智能正成為核心競(jìng)爭(zhēng)點(diǎn)之一。
從深度學(xué)習(xí)芯片層面,與寒武紀(jì)類似,國(guó)內(nèi)還有另一家專注于“AI芯片”的明星創(chuàng)企——深鑒科技——雖然說他們做“AI芯片”嚴(yán)格意義上是不對(duì)的,他們做的是用于深度學(xué)習(xí)推理應(yīng)用(Inference)的FPGA板卡(具體參見智東西此前的深度專訪《成立一年估值超10億 與谷歌飆技術(shù) 這位90后CEO如何做到?》)
深鑒科技創(chuàng)始人兼CEO姚頌則認(rèn)為,不光是手機(jī)芯片,整個(gè)半導(dǎo)體行業(yè)都將受到AI的沖擊。隨著深度學(xué)習(xí)的興起,不同公司所在意的性能重點(diǎn)不同,一個(gè)語音公司與另一個(gè)安防攝像頭公司所用的芯片不同,比如對(duì)于語音識(shí)別的用戶,他們更加關(guān)注延遲,而不是單一的增加吞吐量。未來,處理器的架構(gòu)分類上將會(huì)以應(yīng)用為導(dǎo)向。
結(jié)語:我們離真正的AI芯片還有多遠(yuǎn)?
目前看,華為通過用麒麟970這款手機(jī)芯片架構(gòu)整合NLP,搶到了“AI芯片”這個(gè)高位,噱頭也好,美名也罷;但還有很多問題值得我們關(guān)注:
1、用上了NLP神經(jīng)網(wǎng)絡(luò)計(jì)算單元的麒麟970到底能發(fā)揮多大作用?會(huì)給手機(jī)體驗(yàn)帶來什么改變,是不是“然并卵?”,要等華為Mate 10發(fā)布后具體看。
2、麒麟970這套玩法是不是就是真正的“AI芯片”套路,之后無論高通、三星還是蘋果的處理器SoC是不是也會(huì)用這種在手機(jī)芯片SoC上加入類似NLP的計(jì)算模塊?
3、麒麟970能不能代表華為在人工智能方面的積累,如果是,是不是NLP這樣的處理單元也應(yīng)該一手包辦?蘋果、三星、高通會(huì)一手包辦還是采用第三發(fā)專攻這一領(lǐng)域的處理器IP方案,這是未來AI芯片產(chǎn)業(yè)發(fā)展模式走向需要明確的路徑。
但總的來說,麒麟970的出現(xiàn),讓AI在手機(jī)端開始由軟到硬地落地,是人工智能進(jìn)一步產(chǎn)業(yè)化落地的一個(gè)典型代表。
評(píng)論