AI離全社會(huì)普及,只差一個(gè)計(jì)算中心?
過(guò)去十年,人工智能(AI)大爆炸,并第一次走進(jìn)普通人的生活。
但蓬勃發(fā)展的AI卻碰到一個(gè)空前棘手的問(wèn)題:自2012年以來(lái),AI算力需求6年增長(zhǎng)30萬(wàn)倍,遠(yuǎn)超摩爾定律!
人類(lèi)現(xiàn)有的基礎(chǔ)設(shè)施,已跟不上AI算力需求的增長(zhǎng)。未來(lái),該怎么辦?
一百多年前,人類(lèi)也曾面臨同樣的難題。
1866年,德國(guó)西門(mén)子發(fā)明自激發(fā)電機(jī),開(kāi)啟了人類(lèi)的電力時(shí)代。
此后十幾年,雖然很多企業(yè)紛紛采用電能這種新的動(dòng)力,但一臺(tái)電機(jī)只能供應(yīng)一棟房子或一條街道的現(xiàn)狀,制約了電力的進(jìn)一步普及。
直到1882年,愛(ài)迪生在珍珠街建起了第一個(gè)中央發(fā)電廠(chǎng),照亮了整個(gè)曼哈頓。
與一百多年前相比,今天的世界正發(fā)生翻天覆地的變化。
自1946年第一臺(tái)計(jì)算機(jī)誕生以來(lái),算力逐漸成為新的電力,推動(dòng)人類(lèi)社會(huì)不斷從物理世界向數(shù)字世界遷移。
在此期間,人類(lèi)對(duì)算力的需求不斷增長(zhǎng)。尤其2012年以后,隨著深度學(xué)習(xí)等算法的突破,AI第一次走進(jìn)普通人的生活。
一方面,AI的應(yīng)用場(chǎng)景越來(lái)越多,從語(yǔ)音、目標(biāo)識(shí)別,到智慧工廠(chǎng)、智慧城市……乃至戰(zhàn)爭(zhēng)中的武器。
另一方面,AI模型的大小、算法參數(shù)也呈幾何級(jí)增長(zhǎng),鵬城實(shí)驗(yàn)室最新發(fā)布的“鵬程.盤(pán)古”預(yù)訓(xùn)練大模型,擁有驚人的2000億個(gè)參數(shù)!
這樣的大模型,以及越來(lái)越廣泛的應(yīng)用場(chǎng)景,對(duì)AI算力的需求呈現(xiàn)爆炸式的增長(zhǎng)。
幾年前,谷歌AI負(fù)責(zé)人杰夫·迪恩(Jeff Dean)曾預(yù)言:“我們真正需要的是超過(guò)現(xiàn)在100萬(wàn)倍的計(jì)算能力,而不僅僅是幾十倍的增長(zhǎng)?!?/span>
即便如此大膽的預(yù)測(cè),也還是顯得太保守。
事實(shí)上,從2012年到2019年,短短七年,人類(lèi)對(duì)AI算力的需求增長(zhǎng)了30萬(wàn)倍,平均每100天就會(huì)翻倍,遠(yuǎn)超摩爾定律。
與此同時(shí),AI算力的實(shí)際增長(zhǎng)卻有限,需求和供給之間形成一個(gè)巨大的鴻溝
為了填補(bǔ)這個(gè)鴻溝,一種新的AI基礎(chǔ)設(shè)施誕生了,它就是:人工智能計(jì)算中心。
在此之前,人類(lèi)建過(guò)許多大型的計(jì)算中心。比如,我們熟知的超算中心,集中了一個(gè)國(guó)家或地區(qū)的最強(qiáng)算力,主要用于科研。
還有阿里、華為等云廠(chǎng)商興建的云計(jì)算中心,基于云平臺(tái),向全社會(huì)提供大數(shù)據(jù)的計(jì)算、存儲(chǔ)等服務(wù)。
它們雖然也對(duì)外提供AI算力,但畢竟不是主業(yè)。
而人工智能計(jì)算中心專(zhuān)為AI打造,主要用于A(yíng)I模型的開(kāi)發(fā)、訓(xùn)練和推理,能夠?yàn)槿鐣?huì)提供AI所需的專(zhuān)用算力。
這種新的AI基礎(chǔ)設(shè)施,自誕生之日起,就成為全球主要AI大國(guó)的角力場(chǎng)。
比如,美國(guó)投資18億美金,計(jì)劃在全國(guó)打造三個(gè)E級(jí)超算,其中一個(gè)的算力,超過(guò)目前全球十大超算的總和。
德國(guó)早在2018年就推出國(guó)家級(jí)人工智能戰(zhàn)略,并資助一批高校建設(shè)人工智能計(jì)算中心。
中國(guó)也先后建成了深圳鵬城云腦和武漢人工智能計(jì)算中心。還有多個(gè)城市已開(kāi)工或者正在籌建人工智能計(jì)算中心。
在政府主導(dǎo)下,許多頭部企業(yè)也紛紛下場(chǎng)。谷歌自研AI專(zhuān)用的TPU芯片,并通過(guò)云平臺(tái)對(duì)外輸出AI云服務(wù)。
微軟也宣布,斥資10億美元,構(gòu)建一個(gè)AI計(jì)算平臺(tái)。
在中國(guó),阿里投入重金,建立超大規(guī)模機(jī)器學(xué)習(xí)平臺(tái)。而華為,更是鵬城云腦和武漢人工智能計(jì)算中心背后的建設(shè)主力軍。
蓬勃發(fā)展的AI產(chǎn)業(yè),無(wú)限放大了全社會(huì)對(duì)算力的需求。
為了邁過(guò)這道鴻溝,全世界以政府主導(dǎo)、頭部企業(yè)參建的模式,正掀起一場(chǎng)AI算力的軍備競(jìng)賽。
在人工智能計(jì)算中心出現(xiàn)前,人們是如何解決AI算力問(wèn)題的呢?
除了超算中心和云計(jì)算中心“兼職”外,更多靠企業(yè)自建。例如,谷歌早期就用GPU來(lái)加速。后來(lái),為了訓(xùn)練AlphaGo,開(kāi)發(fā)了TPU芯片。
但像谷歌這樣財(cái)大氣粗的企業(yè),畢竟是少數(shù)。更多的企業(yè),缺乏足夠的資金來(lái)搭建自己的AI算力。
勉強(qiáng)搭起來(lái),算力也有限。而且不同企業(yè)的算力,還分散在全國(guó),各自為政。
以這樣的算力,很難訓(xùn)練出大模型,更別提GPT-3這種超級(jí)大模型。而后者,是推動(dòng)AI技術(shù)不斷進(jìn)步、產(chǎn)業(yè)不斷發(fā)展的關(guān)鍵。
這有點(diǎn)類(lèi)似于愛(ài)迪生修建珍珠街中央發(fā)電廠(chǎng)之前的情況。
彼時(shí),電力還屬于少數(shù)有錢(qián)人或大企業(yè)的奢侈品,門(mén)檻高,難普及。直到愛(ài)迪生修建中央發(fā)電廠(chǎng),改變了這一情況。
未來(lái),AI產(chǎn)業(yè)要想****展,同樣需要降低算力門(mén)檻。
類(lèi)似OpenAI那樣,花1200萬(wàn)美元,訓(xùn)練一個(gè)GPT-3模型的事情,很少有企業(yè)或個(gè)人負(fù)擔(dān)得起。
解決的辦法是,像愛(ài)迪生建中央發(fā)電廠(chǎng)一樣,在各地集中建設(shè)AI基礎(chǔ)設(shè)施,也就是人工智能計(jì)算中心,降低AI的算力成本。
一個(gè)人工智能計(jì)算中心,就像一個(gè)電廠(chǎng),通常包含機(jī)房,以及各種軟硬件設(shè)施。
比如,鵬城云腦就長(zhǎng)這個(gè)樣子:
還有大名鼎鼎的谷歌TPU服務(wù)器機(jī)房:
人工智能計(jì)算中心,一改過(guò)去AI算力分散的局面。
在地方政府的產(chǎn)業(yè)政策引導(dǎo)下,通過(guò)集中建設(shè),這種AI基礎(chǔ)設(shè)施可將算力普惠地輸出給全社會(huì),包括企業(yè)、科研機(jī)構(gòu)和高校。
過(guò)去,訓(xùn)練一個(gè)大模型,動(dòng)輒上千萬(wàn)美元。如今,企業(yè)和開(kāi)發(fā)者,可按需租用算力,花小錢(qián)辦大事,極大地降低了門(mén)檻,加速了AI創(chuàng)新。
這一點(diǎn),對(duì)于A(yíng)I產(chǎn)業(yè)的繁榮,極為關(guān)鍵。
就像電廠(chǎng)一樣,人工智能計(jì)算中心首先是一個(gè)公共算力服務(wù)平臺(tái)。
但,光有算力還不夠。電廠(chǎng)之所以是社會(huì)經(jīng)濟(jì)的發(fā)動(dòng)機(jī),背后是一個(gè)生態(tài),包括上下游產(chǎn)業(yè)鏈、設(shè)備廠(chǎng)商和終端用戶(hù),等等。
因此,人工智能計(jì)算中心除了是一個(gè)算力服務(wù)平臺(tái),還是一個(gè)AI產(chǎn)業(yè)聚集發(fā)展平臺(tái),能夠聚合AI產(chǎn)業(yè)鏈上的各類(lèi)公司,包括算法公司、數(shù)據(jù)處理公司、行業(yè)集成公司等,形成完整的產(chǎn)業(yè)閉環(huán),促進(jìn)和推動(dòng)AI產(chǎn)業(yè)集群發(fā)展。
此外,它還是一個(gè)應(yīng)用創(chuàng)新孵化平臺(tái),通過(guò)開(kāi)發(fā)者AI創(chuàng)新,與本地優(yōu)勢(shì)產(chǎn)業(yè)(如制造、醫(yī)療、交通、智能電動(dòng)車(chē)等)相結(jié)合,讓技術(shù)轉(zhuǎn)化為產(chǎn)業(yè)價(jià)值,帶動(dòng)當(dāng)?shù)禺a(chǎn)業(yè)智能化升級(jí)。
以武漢為例,庫(kù)柏特的智能機(jī)器人在武漢人工智能計(jì)算中心的支持下,通過(guò)視覺(jué)處理算法創(chuàng)新,其機(jī)械臂每次抓取****盒的拍照時(shí)間,從過(guò)去200毫秒縮短至50毫秒!
武漢市政府計(jì)劃,到2023年孵化60個(gè)以上類(lèi)似的AI深度應(yīng)用場(chǎng)景,形成AI應(yīng)用示范項(xiàng)目超過(guò)100個(gè)。
人工智能計(jì)算中心也是一個(gè)科研創(chuàng)新和人才培養(yǎng)平臺(tái),為將來(lái)儲(chǔ)備技術(shù)和人才。
目前,經(jīng)教育部批準(zhǔn)設(shè)立AI本科專(zhuān)業(yè)的高校已達(dá)200余所。有了人工智能計(jì)算中心,這些院校可聯(lián)合行業(yè)龍頭企業(yè),基于前者充沛的算力,開(kāi)展技術(shù)研發(fā)和關(guān)鍵人才的培養(yǎng)。
在深圳,鵬城實(shí)驗(yàn)室就依托“鵬城云腦Ⅱ”,聚集了31位院士和2000多名科研人員,使得深圳一躍成為國(guó)內(nèi)AI人才高地。
今天的中國(guó),正在打造國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)。
人工智能計(jì)算中心通過(guò)“1個(gè)中心+4個(gè)平臺(tái)”,形成一個(gè)完整的算力生態(tài),徹底打通了“產(chǎn)”“學(xué)”“研”“用”全產(chǎn)業(yè)鏈,滿(mǎn)足了國(guó)家和地方對(duì)人工智能產(chǎn)業(yè)發(fā)展的需求。
從這個(gè)意義上講,人工智能計(jì)算中心是我國(guó)發(fā)展人工智能產(chǎn)業(yè)的最佳路徑。
未來(lái),小到手機(jī)、人臉識(shí)別,大到無(wú)人駕駛、工業(yè)機(jī)器人……人工智能計(jì)算中心將為全社會(huì)的智能化,提供源源不斷普惠充沛的AI算力,從而托起中國(guó)經(jīng)濟(jì)的明天。
先行一步的武漢和深圳,已經(jīng)看到了這種希望。
在武漢,華為助力打造的人工智能計(jì)算中心,AI峰值性能可達(dá)100PFlops(1P相當(dāng)于每秒1000萬(wàn)次浮點(diǎn)運(yùn)算)。
在深圳,基于華為Atlas 900集群的“鵬城云腦Ⅱ”可提供世界頂級(jí)算力,在最新一期IO500榜單中位居榜首,其全系統(tǒng)輸入輸出性能得分是排名第二的近20倍。
武漢和深圳之外,包括成都在內(nèi),全國(guó)多個(gè)城市也在積極籌建人工智能計(jì)算中心。
充沛的算力,給當(dāng)?shù)啬酥寥珖?guó)經(jīng)濟(jì)注入了強(qiáng)勁的動(dòng)力。
從深圳到武漢,再到已開(kāi)工的成都,中國(guó)在興建人工智能計(jì)算中心的路上,再次展現(xiàn)了“基建狂魔”的本色。
但同時(shí),我們也要清醒地看到,在這個(gè)事關(guān)未來(lái)的AI基礎(chǔ)設(shè)施建設(shè)上,我們還存在短板。
過(guò)去十年,中國(guó)在目標(biāo)識(shí)別等AI應(yīng)用上,領(lǐng)先于世界。
可當(dāng)我們向上捅破天,低下頭來(lái)建人工智能計(jì)算中心時(shí)才發(fā)現(xiàn):與西方先進(jìn)水平相比,自己在A(yíng)I根技術(shù)上還有不小的差距。
電廠(chǎng)的核心是發(fā)電機(jī)組,人工智能計(jì)算中心的核心是芯片。
過(guò)去,無(wú)論超算還是云計(jì)算中心,多采用CPU+GPU組合。如今,人工智能計(jì)算中心加入了NPU等異架構(gòu)處理器,以多樣化算力,加速AI計(jì)算。
NPU是一種AI專(zhuān)用芯片,可在電路層模擬人類(lèi)的神經(jīng)元和突觸。與傳統(tǒng)芯片相比,AI算力有數(shù)十上百倍的提升。
下圖對(duì)比了CPU、GPU和TPU(谷歌開(kāi)發(fā)的NPU)的數(shù)據(jù)處理方式。
NPU的這種大吞吐量,對(duì)于需要數(shù)據(jù)清洗、模型生成、訓(xùn)練和推理的AI計(jì)算來(lái)講,優(yōu)勢(shì)尤其明顯。
美國(guó)排名第二的打車(chē)軟件Lyft,自從用了谷歌Cloud TPU,也就是云上AI算力后,以前幾天才能干完的活,現(xiàn)在幾小時(shí)就搞定了。
但無(wú)論CPU、GPU,還是NPU,國(guó)內(nèi)企業(yè)在這些底層芯片上的積累,還比較薄弱。
CPU、GPU幾乎被英特爾、AMD和英偉達(dá)三家公司壟斷。NPU相對(duì)好一些,華為有昇騰系列,寒武紀(jì)也開(kāi)發(fā)了思元系列。
而這,還只是硬件問(wèn)題。
軟件方面,人工智能計(jì)算中心是一個(gè)算力多樣化的平臺(tái),如何將眾多異架構(gòu)芯片放在一起還能相互兼容,需要統(tǒng)一的編程框架。
當(dāng)年,英偉達(dá)為了將圖形處理芯片GPU用在通用計(jì)算上,開(kāi)發(fā)了CUDA。如今,華為為了提高開(kāi)發(fā)效率,設(shè)計(jì)了異構(gòu)計(jì)算架構(gòu)CANN。
算法是AI的核心。
全世界每天都在產(chǎn)生新的算法和模型,開(kāi)發(fā)者不需要從頭學(xué)習(xí),但他們需要一個(gè)統(tǒng)一的AI算法平臺(tái)和框架。
目前,全球大多數(shù)開(kāi)發(fā)者都選擇了谷歌的TensorFlow和Facebook的Pytorch。
國(guó)內(nèi)企業(yè)最初在這個(gè)領(lǐng)域一片空白,后來(lái)才有了華為的MindSpore和百度的飛槳,但在開(kāi)發(fā)者人數(shù)上,與對(duì)手還有不小的差距。
有了芯片,有了編程平臺(tái)和AI框架,再往上,就到了AI應(yīng)用軟件開(kāi)發(fā)平臺(tái)。
在這一層上,國(guó)內(nèi)企業(yè)實(shí)力不俗,阿里有PAI,華為有ModelArts,百度有AI Studio。開(kāi)發(fā)者們?cè)谶@些平臺(tái)上,最終做出賦能千行百業(yè)的APP。
根技術(shù)是AI的基石,只有根深,才能葉茂,才能從底層釋放出充沛的算力,支撐起整個(gè)AI頂層應(yīng)用的全面繁榮。
這種從底層算力釋放,到頂層應(yīng)用使能的AI全棧能力,可以用下圖一覽全貌:
從圖上可知,谷歌無(wú)疑是AI能力最強(qiáng)也最全面的科技公司之一。在國(guó)內(nèi),擁有類(lèi)似能力的企業(yè)屈指可數(shù),華為算是一家。
2017年,AlphaGo擊敗李世石后不久,俄羅斯總統(tǒng)普京曾告誡國(guó)內(nèi)師生:未來(lái),誰(shuí)成為AI的領(lǐng)導(dǎo)者,誰(shuí)就將統(tǒng)治世界!
人工智能(AI),毫無(wú)疑問(wèn),已成為全球大國(guó)角力的主戰(zhàn)場(chǎng),并在某種程度上,決定了一個(gè)國(guó)家或地區(qū)未來(lái)的命運(yùn)。
早在2017年就發(fā)布人工智能?chē)?guó)家戰(zhàn)略的中國(guó),將AI視為重大的戰(zhàn)略機(jī)遇,并希望到2025年成為人工智能的世界領(lǐng)導(dǎo)者。
為了實(shí)現(xiàn)這一目標(biāo),我們還有很多的事情需要做。這其中,最重要、最緊迫的事情之一,就是興建更多的人工智能計(jì)算中心。
從這個(gè)意義上講,鵬城云腦和武漢人工智能計(jì)算中心的落成,也只是這場(chǎng)世紀(jì)大戲的開(kāi)場(chǎng)白而已。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。