摩爾定律注定失效,存儲優(yōu)先架構(gòu)或是AI芯片的未來
AMD為GPU做的HBM高帶寬顯存方案
本文引用地址:http://cafeforensic.com/article/201812/396076.htm動態(tài)調(diào)整頻率則是通過軟硬件動態(tài)調(diào)整存儲器的讀寫頻率,來降低訪問調(diào)度的隨機性,實現(xiàn)更多預訪問,讓訪問變得更有序,進一步提升訪問效率,進而降低延遲。此種手段實施并不簡單,并且理論上提升的幅度十分有限,雖然可以一定程度上優(yōu)化,但并不足以應付未來AI場景的百倍千倍數(shù)據(jù)吞吐,畢竟每小時TB級別海量數(shù)據(jù)才是AI世界的真實常態(tài)。
將存儲結(jié)構(gòu)盡量靠近核心,做成片上存儲也是一種熱門思路。精簡的訪問路徑使得邏輯核心與存儲的訪問精度得到顯著提升,盡可能利用工藝極限提升存儲器的訪問效率。這種方式的理論上可以在減少訪問延遲5-10倍以上,這種量級的優(yōu)化進步對比之前的幾種方式就來得非??捎^。
在思路和技術(shù)兩個維度發(fā)現(xiàn)傳統(tǒng)芯片的“存儲墻”瓶頸之后,下一步就是從思想和技術(shù)兩方面進行突破,這也就引出了我們今天的核心“存儲優(yōu)先架構(gòu)”。
“存儲優(yōu)先架構(gòu)”原理和優(yōu)勢所在
簡單來理解,存儲優(yōu)先架構(gòu)實際上就是片上存儲技術(shù)+架構(gòu)思想革新,是技術(shù)手段變革和思想革新的雙重結(jié)合。
之前我們已經(jīng)提到了片上存儲這種設計方式的好處,它能夠帶來成倍的存儲訪問效率提升。但是片上存儲這套思路實際上技術(shù)本身沒有對架構(gòu)思想進行變革,依舊是按照馮·諾依曼架構(gòu)來的一套體系,雖然得益于片上存儲技術(shù),訪問的效率大大提升了,但是由于架構(gòu)不變,訪問的步驟依舊較多,這帶來了存儲效率的浪費。
于是,在片上存儲技術(shù)的基礎(chǔ)上,探境科技提出了一種顛覆性的思想,以存儲為中心帶動計算,重新設計整個AI芯片的架構(gòu)——即“存儲優(yōu)先架構(gòu)”(SFA)。
探境科技提出的“存儲優(yōu)先架構(gòu)”
上圖是存儲優(yōu)先架構(gòu)的示意圖,通過對比馮·諾依曼架構(gòu)示意圖,我們從上圖可以觀察到存儲架構(gòu)包括數(shù)據(jù)層、計算層和控制層組成,它們以存儲調(diào)度為核心邏輯形成一套計算架構(gòu),數(shù)據(jù)在存儲之間的遷移過程中同時完成計算,計算就那么自然而然隨著數(shù)據(jù)轉(zhuǎn)移同時進行了。理論上這種設計方案的能效能提升10-100倍,計算資源利用率提升40-50%,同時對DDR的占用率也能夠?qū)崿F(xiàn)大幅度下降。這就好像從前城里10萬老百姓辦手續(xù),不但路遠,還要跑很多趟?,F(xiàn)在百姓雖然已經(jīng)多達500萬,但是提高了辦事效率,辦事窗口離家門口更近了,還允許一次性辦齊。
據(jù)了解,目前探境科技全新的存儲優(yōu)先架構(gòu)并不僅僅只是停留在理論層面,而是真真正正已經(jīng)流片,并即將推向商用領(lǐng)域。在今年10月份舉行的IC WORLD大會上面,探境科技發(fā)布了即將推出的語音、圖像序列AI芯片和IP授權(quán)。這些產(chǎn)品可以被用在AI計算、邊緣計算、安放前端協(xié)處理、語音喚醒、命令詞識別、語義理解、通用降噪、自動駕駛等多個前沿領(lǐng)域。
存儲優(yōu)先架構(gòu)應用到實際能帶來什么體驗革新?舉個例子:
目前智能音箱一個使用痛點就是語音控制和反饋的延遲。智能音箱需要聽到用戶的喚醒詞進行喚醒,并在得到指令內(nèi)容之后,將內(nèi)容的聲音數(shù)據(jù)回傳到云端,進行分析和處理得到結(jié)果之后再返回到智能音箱播放出來。這中間由于信號、網(wǎng)絡延遲等一系列問題就會導致最終用戶體驗質(zhì)量的大幅下降,等待2、3秒也就成了常態(tài)。如果智能音箱采用存儲優(yōu)先架構(gòu)的AI芯片,能夠在本地接受內(nèi)容之后直接處理為結(jié)果,不需要回傳云端和大數(shù)據(jù)比對、分析和運算,實現(xiàn)高效的邊緣計算,這將根本性提升最終的用戶體驗。智能音箱如是,自動駕駛?cè)缡?,智慧新零售如是,智慧城市方方面面都離不開完整的AI、云計算、邊緣計算的配合。
摩爾定律注定失效,存儲優(yōu)先架構(gòu)或是AI芯片的未來
從某種意義上來說,摩爾定律是基于馮·諾依曼架構(gòu)提出的,而馮·諾依曼架構(gòu)本身的結(jié)構(gòu)路徑基于指令集模式的處理邏輯,存在對于海量數(shù)據(jù),尤其是不規(guī)則海量數(shù)據(jù)處理的先天短板。所以不管是摩爾定律和還是x86基礎(chǔ)的馮·諾依曼架構(gòu),它們隨著人類社會發(fā)展以及數(shù)據(jù)量的不斷攀升,是注定必將失效的?;蛘叻催^來說,我們海量數(shù)據(jù)洪流的時代漸漸淘汰舊的芯片規(guī)則約束,正催生芯片架構(gòu)進行一次大的革新。
存儲優(yōu)先架構(gòu)以其邏輯步驟精簡+片上存儲技術(shù)手段的方式,得到雙重性能提升,實現(xiàn)了以存儲調(diào)度為核心的計算架構(gòu),這的確是一次前所未有的創(chuàng)新實踐。隨著探境科技流片量產(chǎn)和隨后的應用場景部署,存儲優(yōu)先架構(gòu)的AI芯片必將幫助終端設備實現(xiàn)更多自動化的、低延遲的邊緣計算,以改善最終的智慧生活體驗。關(guān)于存儲優(yōu)先架構(gòu)的AI芯片產(chǎn)品以及未來的具體應用進展,我們不妨持續(xù)關(guān)注拭目以待。
評論