曾號稱碾壓英偉達!壁仞科技:單個國產(chǎn)AI芯片不強但數(shù)量多、軟件加持就不一樣了
7月10日消息,近日,壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆在談及計算瓶頸時表示,解決算力瓶頸問題需要從三個維度考慮:硬件集群算力、軟件有效算力、異構(gòu)聚合算力。
本文引用地址:http://cafeforensic.com/article/202407/460816.htm他認為,做好這三個維度的工作,即使國產(chǎn)AI芯片單個算力不強,也能通過綜合手段提升算力,滿足國內(nèi)大模型訓練的需求。
“我們2020年設計的第一代產(chǎn)品里就做了chiplet架構(gòu),國外巨頭在今年發(fā)布的產(chǎn)品如英偉達B100和英特爾Gaudi 3也采用了同樣的思路,他們用最先進的制程,但也需要chiplet來突破摩爾定律限制來提升單卡算力?!倍≡品f道。
據(jù)他介紹,壁仞科技用三級的異步checkpoint技術(shù),結(jié)合GPU的顯存和CPU內(nèi)存,甚至是多節(jié)點內(nèi)存的備份系統(tǒng)去達到一個平衡,目前已能夠大幅降低故障恢復成本。
之前,壁仞科技發(fā)布首款通用GPU芯片BR100,創(chuàng)下全球算力紀錄,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單芯片峰值算力達到PFLOPS級別。
當時,壁仞科技給出的數(shù)據(jù)顯示,其首款旗艦產(chǎn)品BR100對比英偉達在售的旗艦GPU峰值算力在Int8、BF16、TF32/TF32+、FP32數(shù)據(jù)格式下最少有3.3倍的峰值性能優(yōu)勢,在FP32數(shù)據(jù)格式下性能優(yōu)勢更是達到了13.1倍。
評論