淺談AI芯片設(shè)計的趨勢和挑戰(zhàn)
2018年以來,不少以算法為主的語音、視覺、自動駕駛等公司也開始研發(fā)AI芯片,將算法和芯片進行更好的結(jié)合,來針對多樣化的場景,未來軟硬結(jié)合將會是趨勢。
本文引用地址:http://cafeforensic.com/article/201901/396388.htm隨著深度學(xué)習(xí)和AI應(yīng)用的不斷演進,近兩年AI芯片廠商不斷涌現(xiàn),加之貿(mào)易摩擦中芯片概念的普及,2018年的AI芯片領(lǐng)域持續(xù)火熱。在國內(nèi),貼上AI芯片標(biāo)簽的公司已經(jīng)超過40家,其中的佼佼者們獲得不菲融資。
盡管目前AI在行業(yè)應(yīng)用方面的滲透有限,但是算力的供需還是不平衡。近日,華為智能計算業(yè)務(wù)部總裁邱隆就向21世紀(jì)經(jīng)濟報道記者表示:“原來由摩爾定律驅(qū)動的計算產(chǎn)業(yè),面對爆發(fā)式的計算需求無以為繼。摩爾定律在正常的時候,以每年1.5倍增長,50%的算力增長,在過去幾年間,每年的算力實際增長只有10%。人工智能在過去幾年間,算力增長了30萬倍,至少每一年我們的算力要增長10倍?!?/p>
這意味著人工智能除了算法外,對算力也存在強大的需求。面對增多的B端應(yīng)用場景,也有更多的AI芯片公司加入角逐。從功能角度細(xì)分,AI芯片可分為訓(xùn)練芯片和推理芯片,在訓(xùn)練方面,目前英偉達獨樹一幟,但是在推理方面,可選擇的芯片種類不只是GPU,還有FPGA(現(xiàn)場可編程門陣列)、ASIC(專用集成電路)等。在各個分類中,芯片巨頭們各有千秋,接下來還要考驗落地情況。
群雄混戰(zhàn)
芯片目前主要是提供算力支持,2018年,AI芯片大廠和創(chuàng)業(yè)公司們均有不少新動作。
最大的玩家當(dāng)屬英偉達和英特爾。英偉達的GPU抓住了計算設(shè)備需求的關(guān)鍵時機,在圖形渲染、人工智能和區(qū)塊鏈領(lǐng)域的計算表現(xiàn)突出,希望成為真正的算力平臺,其中,英偉達在訓(xùn)練方面的代表芯片就是Tesla V100。由于英偉達GPU布局AI的時間早于英特爾、賽靈思等公司,整體生態(tài)較為完整,產(chǎn)品在IT公司中得到廣泛應(yīng)用。
英特爾則通過收購案來彌補AI芯片的賽道:2015年167億美金收購FPGA巨頭Altera。FPGA在云計算、物聯(lián)網(wǎng)、邊緣計算等方面有很大的潛力。隨著5G浪潮的到來,物聯(lián)網(wǎng)的數(shù)據(jù)分析及計算需求會暴增,物聯(lián)網(wǎng)的接入節(jié)點至少是數(shù)百億級的規(guī)模,比手機規(guī)模要高出1-2個數(shù)量級。物聯(lián)網(wǎng)的典型需求是需要靈活使用算法的變化,這是FPGA的強項,F(xiàn)PGA可以通過自身結(jié)構(gòu)的改變來適應(yīng)定制化計算場景的需求,能為不同類型的設(shè)備提供高效芯片。
同時,英特爾還收購了Nervana,計劃用這家公司在深度學(xué)習(xí)方面的能力來對抗GPU,Nervana的最新版深度學(xué)習(xí)芯片將在2019年量產(chǎn)。此外,英特爾還收購了視覺處理芯片初創(chuàng)公司 Movidius、自動駕駛公司Mobileye。
算法巨頭谷歌則另辟蹊徑,以ASIC類型的芯片來滿足自身需求。具體來看,谷歌的TPU通過脈動陣列(systolic array)這一核心架構(gòu)來提升算力,2018年發(fā)布的TPU3.0版本采用8位低精度計算節(jié)省晶體管,速度能加快最高100PFlops(每秒1000萬億次浮點計算)。
再看國內(nèi),華為在2018年10月發(fā)布了兩顆AI芯片——昇騰910(max)和昇騰310(mini)。昇騰910主要用于云端計算,其半精度算力達到了256 TFLOPS,預(yù)計將于2019年第二季度量產(chǎn);昇騰310用于終端低功耗場景,擁有8TFLOPS半精度計算力,目前已經(jīng)量產(chǎn),但是并不對外銷售。
國內(nèi)的明星初創(chuàng)企業(yè)也紛紛獲得投資或者收購。2018年中,寒武紀(jì)推出面向數(shù)據(jù)中心市場云端智能芯片 MLU100,浪潮、聯(lián)想、曙光的AI服務(wù)器產(chǎn)品將搭載MLU100 芯片。但是在手機端,華為麒麟芯片將用達芬奇架構(gòu)代替寒武紀(jì)架構(gòu)。另一家公司地平線選擇自動駕駛的場景,奧迪是其合作伙伴。產(chǎn)品包括基于旭日2.0處理器架構(gòu)的XForce邊緣AI計算平臺、基于征程(Journey)2.0 架構(gòu)的地平線 Matrix 自動駕駛計算平臺、核心板旭日X1600、智能攝像機解決方案等。
深鑒科技則在2018年被賽靈思收購,價格約3億美元。深鑒科技一方面提供基于神經(jīng)網(wǎng)絡(luò)深度壓縮技術(shù)和DPU平臺,為深度學(xué)習(xí)提供端到端的解決方案。另一方面通過神經(jīng)網(wǎng)絡(luò)與FPGA的協(xié)同優(yōu)化,提供高性價比的嵌入式端與云端的推理平臺,已應(yīng)用于安防、數(shù)據(jù)中心、汽車等領(lǐng)域。
挑戰(zhàn)與趨勢
整體而言,英偉達的實力在第一梯隊,但是競爭者眾多,除了上述企業(yè)外,AMD、高通、聯(lián)發(fā)科、三星等公司均在AI芯片上有所布局,并且戰(zhàn)況愈發(fā)激烈。
不過,目前在AI芯片領(lǐng)域沒有哪一家占據(jù)絕對優(yōu)勢,集邦咨詢向21世紀(jì)經(jīng)濟報道記者表示:“初創(chuàng)企業(yè)方面,就我們的觀察,畢竟仍在草創(chuàng)階段,客戶的采用意愿,以及導(dǎo)入后,終端市場的接受狀況,將是未來需要觀察的地方。總結(jié)來看,還是國際芯片大廠的布局速度較快?!?/p>
從國內(nèi)和國外的角度看,一位AI業(yè)內(nèi)人士告訴21世紀(jì)經(jīng)濟報道記者:“國內(nèi)外主要是技術(shù)結(jié)構(gòu)上的差距,底層技術(shù)科學(xué)上和國外的差距顯著,但是應(yīng)用層面上差距不大,甚至有創(chuàng)新的應(yīng)用點。不少AI芯片公司通過定制化服務(wù)小規(guī)??蛻?,針對B端場景進行開發(fā),比如專門處理語音、圖像。”
同時,AI芯片也面臨不少挑戰(zhàn),杜克大學(xué)教授陳怡然就曾提到,AI芯片在設(shè)計方面有四大挑戰(zhàn)。
其一是大容量存儲和高密度計算,當(dāng)神經(jīng)深度學(xué)習(xí)網(wǎng)絡(luò)的復(fù)雜度越來越高的時候,參數(shù)也會越來越多,怎么處理是一大難題;第二個挑戰(zhàn)是要面臨特定領(lǐng)域的架構(gòu)設(shè)計,因為場景越來越豐富,這些場景的計算需求是完全不一樣的。怎么樣通過對于不同的場景的理解,設(shè)置不同的硬件架構(gòu)變得非常重要。
第三個挑戰(zhàn)是芯片設(shè)計要求高,周期長,成本昂貴。從芯片規(guī)格設(shè)計、芯片結(jié)構(gòu)設(shè)計、RTL設(shè)計、物理版圖設(shè)計、晶圓制造、晶圓測試封裝,需要2到3年時間,正常的時間里軟件會有一個非??焖俚陌l(fā)展。但是算法在這個期間內(nèi)將會快速更新,芯片如何支持這些更新也是難點。
第四個挑戰(zhàn)是架構(gòu)及工藝。隨著工藝不斷的提升,從90納米到10納米,邏輯門生產(chǎn)的成本到最后變得飽和。也許在速度上、功耗上會有提升,但單個邏輯生產(chǎn)的成本不會再有新的下降。這種情況下如果仍然用幾千甚至上萬個晶體管去做一個比較簡單的深度學(xué)習(xí)的邏輯,最后在成本上是得不償失的。
在芯片的產(chǎn)業(yè)鏈中,生產(chǎn)環(huán)節(jié)主要依靠臺積電、格芯等芯片代工廠商。但是國內(nèi)在設(shè)計領(lǐng)域逐步前進,并且AI專用芯片相對于CPU、GPU來說難度沒有那么大,因此不少創(chuàng)業(yè)公司也為自己精通的行業(yè)定制AI芯片。
2018年以來,不少以算法為主的語音、視覺、自動駕駛等公司也開始研發(fā)AI芯片,將算法和芯片進行更好的結(jié)合,來針對多樣化的場景,未來軟硬結(jié)合將會是趨勢。
評論