科大訊飛發(fā)布星火一體機:鯤鵬CPU+昇騰GPU,算力達2.5PFlops!
8月15日,科大訊飛在合肥舉辦了“訊飛星火認知大模型V2.0升級發(fā)布會”。在此次發(fā)布會上,科大訊飛與華為共同發(fā)布用于構建專屬大模型的軟硬件一體化設備“星火一體機”。
科大訊飛董事長劉慶峰表示,“科大訊飛和華為已在聯合攻關算力卡脖子的問題。”在單卡算力上,“星火一體機”對標英偉達A100,同時還正在和華為一道打造面向超大規(guī)模大模型訓練的國產算力集群,形成集群化優(yōu)勢。
據了解,在大模型的研發(fā)過程中,需要可以支撐千億參數規(guī)模大模型并行訓練的算力和框架,這通常需要幾千張高算力的AI加速卡同時連續(xù)運行?;诖?,系統(tǒng)架構以及并行訓練的集群能力成為大模型研發(fā)的關鍵。
據了解,星火一體機基于華為鯤鵬CPU+昇騰GPU,另外還采用了華為存儲和網絡提供整機柜方案,FP16(半精度浮點數格式)算力2.5 petaFLOPS(1 petaFLOPS為每秒運行一千萬億次浮點運算)。在大模型訓練中最為流行的英偉達DGX A100,其單節(jié)點包含8塊GPU,可以輸出5 PetaFLOPS的FP16算力。
(星火一體機采用的昇騰芯片型號疑似為昇騰910B,性能較上一代有所提升。官網資料顯示,昇騰910的FP16算力為320TFLOPS。)
據介紹,星火一體機的訓練和推理一體化部署,可用于問答系統(tǒng)、對話生成、知識圖譜構建、智能推薦等多個領域的應用,具備大模型預訓練、多模態(tài)理解與生成、多任務學習和遷移等能力。
星火一體機還針對星火認知智能大模型的訓練算法和推理應用進行了硬件的量身定制,可大大降低企業(yè)的使用成本。可直接提供對話開發(fā)、任務編排、插件執(zhí)行、知識接入、提示工程等5種定制優(yōu)化模式,以及辦公、代碼、客服、運維、營銷、采購等10種以上即開即用的豐富場景包,支持3種模型尺寸供用戶選擇。
值得注意的是,上個月,科大訊飛就宣布訊飛星火將與昇騰AI聯合,打造基于中國自主創(chuàng)新的通用智能新底座。一方面,訊飛星火認知大模型基于訓練推理一體化設計,實現大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業(yè)落地應用和迭代;另一方面,以昇騰AI為核心,軟硬件協同優(yōu)化,構建算力集中、性能優(yōu)越、供給穩(wěn)定、數據安全的大模型訓練集群。
在當天的“訊飛星火認知大模型V2.0升級發(fā)布會”演講中,劉慶峰更為細致地講解道,“華為跟科大訊飛共同在昇騰AI的軟硬件平臺和軟件的支撐工具上,把高算力AI芯片、高性能的算子庫、多卡高速互聯以及分布式存儲結合起來,尤其是我們聯合針對人工智能所需要的最重要的算子庫進行甄別和打磨。然后在此基礎上,架構科大訊飛的訓練和數據閉環(huán)全流程設計,以及訓練和推理一體化設計的自研大模型訓練平臺,中間是支持大規(guī)模的異構算力兼容,也支持混合云架構易拓展,使得我們今天所看到的訊飛星火V2.0的演示以及所有產品,架構在安全可控的平臺上?!?span style="box-sizing: border-box; margin: 0px; padding: 0px; border: 0px; outline: 0px; max-width: 100%; color: rgb(64, 64, 64);">
據悉,“訊飛星火認知大模型V2.0”除了持續(xù)提升通用能力基礎外,重點突破代碼能力和多模態(tài)交互能力。據劉慶峰介紹,在OpenAI構建的代碼能力的公開測試集HumanEval上,訊飛星火大模型V2.0基于Python和C 進行代碼寫作的能力接近ChatGPT水平,差距僅為1%和2%,預計將于今年10月24日全面超越ChatGPT,明年上半年將正式對標GPT-4。
目前,訊飛星火大模型擁有130億、650億和1750億3個版本的模型參數可選。圍繞星火大模型,科大訊飛正在構建開發(fā)者生態(tài),目前有4000多個助手開發(fā)者團隊加入星火平臺。
編輯:芯智訊-林子 綜合自網絡
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。