2017GPU技術大會英偉達:千人數(shù)年30億美元打造全新計算卡
北京時間5月10日24:00,黃仁勛在2017年GPU技術大會(GPU Technology Conference, GTC)上發(fā)表主題演講。隨著過去一年AI技術的快速發(fā)展,Nvidia這家“意外”成為AI寵兒的公司市值也是節(jié)節(jié)攀升。
本文引用地址:http://cafeforensic.com/article/201705/359052.htm當然,任何聰明的商人都不會放過快速擴張的窗口期。如果讀者們還有印象,DT君曾在今年1月拉斯維加斯的CES上現(xiàn)場報道過黃仁勛的開幕致辭。如果說CES上黃仁勛更多談到的是公司戰(zhàn)略和商業(yè)模式,那么一年一度的GTC則是Nvidia引爆各種“核武器”的試驗場,勢必順應技術發(fā)展潮流推出一批令人印象深刻的硬件產(chǎn)品?!?/p>
黃仁勛在這場歷時兩個多小時的演講中,充滿激情的發(fā)布一系列最新產(chǎn)品,簡單來說就是如下這些:計算加速、Volta架構與Tensor核心、TensorRT、搭載Tesla V100的DGX與HGX、Nvidia GPU Cloud云平臺、Xavier系統(tǒng)芯片及加深度學習速器開源、豐田汽車正式搭載Nvidia Drive PX,以及ISAAC機器人模擬系統(tǒng)。
以下是DT君整理的黃仁勛在本次GTC大會上演講的大致內(nèi)容:
Nvidia剛剛于昨天下午公布了一份漂亮的2018財年Q1財報,公司收入增長非常迅速,而且在每個業(yè)務領域都有不俗表現(xiàn)。今年我們會帶給大家怎樣的驚喜?
Nvidia數(shù)據(jù)中心業(yè)務增長非常迅猛,這得益于公司在神經(jīng)網(wǎng)絡方面的技術優(yōu)勢,以及基于Pascal架構產(chǎn)品的出色性能。Nvidia也會繼續(xù)促進數(shù)據(jù)業(yè)務的發(fā)展,同時也會向開發(fā)者們提供更高效的硬件和工具,以及更多的培訓機會。
微處理器的性能在過去30年提升了近百萬倍,但在過去幾年中,這一進程慢了下來,不論是在制造工藝改進,還是工業(yè)過程控制方面。這導致目前我們似乎走到了一個十字路口。
圖丨后摩爾時代
對于CPU來說,GPU是一種有著特殊用途的加速器,而GPU的并行處理能力現(xiàn)在已經(jīng)成為了一種不可或缺的計算能力,這是Nvidia最初也沒想到的。從十年前發(fā)布G80到現(xiàn)在,Nvidia已經(jīng)在GPU領域耕耘了很長時間,也經(jīng)歷了長期的技術積累,現(xiàn)在似乎到了收獲的時候。
就拿GPU技術大會來說,參加這個大會的人數(shù)在五年間增長了三倍。今天的大會上,全球10家最大的汽車公司在這里,全球最頂尖的10家科技公司在這里,80家AI創(chuàng)業(yè)公司在這里。GPU從來沒有像現(xiàn)在這樣受到如此的關注,這一點令我們非常欣慰。
下面要宣布的是Holodeck計劃。這其實是一個全息圖像平臺,包括VR技術、全動作追蹤,以及3D虛擬形象。所有的效果都是實時渲染的。今天的Demo我們找到了著名的超跑廠商柯尼塞格公司,那里的工作人員會以虛擬形象接入現(xiàn)場,畫面上的超級跑車也是實時渲染的。
圖丨Holodeck計劃
畫面上的機器人都是實時捕捉的真人動作,他們可以使用Holodeck提供的工具來與車輛互動,比如進入駕駛室進行操作,將跑車透明化,展示內(nèi)部結構,甚至直接分解整部跑車。
圖丨Holodeck演示柯尼塞格的工作人員與跑車互動
可能Holodeck現(xiàn)在的效果還不盡人意,但可以看見它會向什么方向發(fā)展。沉浸式VR體驗、高精度渲染,以及對周圍環(huán)境的物理模擬。Holodeck平臺將在今年9月正式開放。
接下來的話題是“機器學習時代”。黃仁勛展示了在過去五年中,基于AI的神經(jīng)網(wǎng)絡都發(fā)展出了哪些能力,并表示我們正在進入一個機器自學、機器自編程的時代,這將是人類技術領域最重要的革命之一。
近期一個重要的創(chuàng)新就是對抗網(wǎng)絡,神經(jīng)網(wǎng)絡A嘗試其誤導神經(jīng)網(wǎng)絡B,但B網(wǎng)絡試圖對抗這種誤導,每次對抗成功,正確的決策行為就會被強化。
圖丨用深度學習進行光線追蹤
舉個例子,用深度學習來試圖為一張色彩不完整的圖片重新上色,機器自己會知道哪些地方是需要優(yōu)化的,而不用還原光照條件,同時還節(jié)省了大量的計算資源。
當前,全世界最熱門的課程之一可能就是機器學習了。比如在斯坦福大學、麻省理工學院等,越來越多的人投入到了這個領域。隨著人才的涌入和計算能力的提升,真正迎來了“計算的民主化時代”。
圖丨現(xiàn)代AI大爆發(fā)
而Nvidia在這個新時代的戰(zhàn)略就是:為機器學習創(chuàng)造最高效的平臺。黃仁勛也非常自信的表示,世界上所有提供云服務的平臺,沒有一個不會用到Nvidia的GPU產(chǎn)品。同時Nvidia一刻也沒有放松在AI領域的基礎科研及應用開發(fā)。
圖丨Nvidia與1300家深度學習初創(chuàng)公司建立了合作關系
下面將發(fā)布的是一個重量級產(chǎn)品,Nvidia投入數(shù)千人、耗時數(shù)年的研發(fā)成果,也是公司歷史上難度最大、最昂貴的項目:Tesla V100正式發(fā)布!
Tesla V100采用臺積電12nm工藝制程,815平方毫米面積,共210億個晶體管,15Tflops的單精度浮點性能,7.5Tflops的雙精度浮點性能,擁有5120個CUDA,16MB緩存,采用16GB HBM2顯存,顯存帶寬為900GB/S。
圖丨Tesla V100
Nvidia總共投入了30億美元來打造這款產(chǎn)品。黃仁勛在發(fā)布這款產(chǎn)品時顯得非常激動,稱Tesla V100的研發(fā)是一項幾乎不可能完成的任務,令人難以置信。
接下來,黃仁勛通過一系列視頻及游戲展示了Tesla V100怪獸級的性能。那些曾經(jīng)在Titan X上需要數(shù)分鐘才能處理完成的任務,在Tesla V100上只需要花數(shù)秒就能完成。
此外,基于8塊Tesla V100搭建的DGX-1也開始預售,價格為149000美元(合100萬人民幣),預計在今年第三季度交付。
圖丨DGX-1
當然,Nvidia還準備了低配版本的DGX Station,搭載了4塊Tesla V100,售價為69000美元(合48萬人民幣)。
此外,新發(fā)布的產(chǎn)品還包括Nvidia GPU Cloud, 這款產(chǎn)品為用戶提供云端硬件的同時,也提供軟件入口,只需要花幾分鐘進行簡單設置,就可以開始運行深度學習相關任務。其優(yōu)點是全棧優(yōu)化、實時更新、Nvidia官方負責測試及維護。其測試版將在今年7月推出。
圖丨Nvidia GPU Cloud
當然,Nvidia的發(fā)布會必然會談到自動駕駛的話題。黃仁勛宣布,豐田汽車已全面采用Nvidia Drive PX平臺。
隨后介紹的是Xavier系統(tǒng)芯片,這套搭載Volta架構GPU的系統(tǒng)其實早在2016年就已經(jīng)公布。Xavier擁有用于負責單線程任務的CPU、負責并行任務的GPU,以及負責深度學習的Tensor內(nèi)核。Nvidia表示,會將Xavier的深度學習加速器進行開源。
圖丨Xavier系統(tǒng)芯片
Xavier系統(tǒng)芯片對AI研究其實是具有重大意義的,但不知為何,黃仁勛在這一部分并沒有花太多時間進行詳述,而是快速轉到了最后一個話題:如何用深度學習來訓練機器人。
全新的機器人訓練系統(tǒng)ISAAC模擬器,允許人們在虛擬環(huán)境下訓練真實世界的機器人。由一個GPU來進行物理計算,其他GPU則根據(jù)計算出來的物理結果來進行神經(jīng)網(wǎng)絡訓練。
圖丨ISAAC機器人模擬器
這套機器人模擬器借鑒了遺傳學領域的一些算法,并將其應用到神經(jīng)網(wǎng)絡中,去嘗試教機器人打高爾夫。
評論