自適應(yīng)計算:走進不斷擴張的Versal世界
2021 年 4 月,業(yè)界領(lǐng)先的 Versal? AI Core 和 Versal Prime 系列器件開始全面量產(chǎn)發(fā)貨,這也意味著賽靈思繼FPGA 之后而打造的ACAP 自適應(yīng)計算加速平臺謝列,取得了令人激動的階段性成果,
本文引用地址:http://cafeforensic.com/article/202111/429727.htm但是就如同我們的宇宙萬物一樣,Versal? 世界發(fā)展的腳步也從未停歇。從客戶設(shè)計,生態(tài)系統(tǒng)合作伙伴 (包括第三方參考設(shè)計、IP、軟件和操作系統(tǒng)支持)到產(chǎn)品系列 ( 如近期推出的 Versal AI Edge 和 HBM 系列 )及每個系列的多種器件,以及硬化 IP 特性,基準測試,軟 IP 庫和軟件庫等,齊頭并進,不斷推進。
本文我將著重為大家介紹人工智能開發(fā)者最關(guān)注的 Versal AI Core 系列的最新發(fā)展。
Versal AI Core 系列的新特性
Versal AI Core 系列的最新擴展,是新增兩大 VC2xxx ACAP 系列,即 VC2802 和 VC2602。如果您認為 VC2xxxx 器件肯定意味著 AI Core 系列中增添了某些重要的新的硬化 IP 特性,恭喜您答對了!如下表所示,VC2xxx 系列帶來了三大激動人心的新特性:
1.AIE-ML 是 AI 引擎的最新版本,其中包括緊密耦合的存儲器塊,可提供優(yōu)異的存儲器訪問并降低時延
2.具有多個視頻解碼器引擎 (VDE) 的集成視頻解碼器單元 (VDU)
3.PCIe? Gen5 支持
關(guān)于AIE-ML 及其與 VC1xxx 器件內(nèi)的 AI 引擎的差異,詳見 Xilinx.com 上的 AI 引擎技術(shù)頁面中的詳細介紹。
簡單地說,AIE-ML 使用的是與 AI 引擎相同的基礎(chǔ)架構(gòu)和工具流,但通過添加對 INT4、BFLOAT16 的原生支持,將每個 AI 引擎的本地數(shù)據(jù)存儲器容量倍增至 64KB,并新增與 AIE-ML 陣列直接耦合的 512KB 存儲器塊(即無需將自適應(yīng)引擎中的鄰近可編程邏輯 (PL) 用于存儲器緩存),AIE-ML 還能針對機器學習進行進一步優(yōu)化。這樣一來,與 AI 引擎相比,AIE-ML 的 AI 計算密度提高 4 倍,時延降低一半,與 GPU 相比單位功耗性能增加 4 倍。每個 AIE-ML 大約等同于 100 個 DSP58、2000 個 LUT,以及 16 個 PL 的Block RAM,使用基于 PL 的實現(xiàn)方案可以將功耗節(jié)省 33%。
VDU 能夠支持單路 4Kp60 流的 H.264 和 H.265 編解碼,或者最多 32 路 720p15 流及兩者之間的所有編解碼。如果要想在 PL 中實現(xiàn)上述標準,那么每單元就需要 12 萬個 LUT、50 個 DSP58 和 3 個Block RAM。使用硬化 VDU 后,可將每個 VDU 的功耗降低 3.6W。這使其理想適用于眾多智能視頻應(yīng)用。在這些應(yīng)用中,多部視頻攝像頭向中央樞紐饋送數(shù)據(jù),中央樞紐負責解碼并執(zhí)行先進 ML 算法
此外,PCIe Gen5 還新增了對最先進的 PCI Express 標準的支持。該標準即將在數(shù)據(jù)中心內(nèi)部署,以在云端實現(xiàn)更大帶寬和更高智能。增加硬化 PCIe Gen5 支持能帶來可觀的效益,不僅能節(jié)省 30 萬 LUT,還能將每核心功耗降低節(jié)省 3W 。
智能應(yīng)用
當然,VC2802 和 VC2602 ACAP 中的所有這些新特性,自然必有其用處。它們將支持大量全新的“智能”應(yīng)用,在邊緣和世界各地的數(shù)據(jù)中心中廣泛部署。其中一個示例就是智慧城市應(yīng)用。這類應(yīng)用使用多個視頻攝像頭監(jiān)測車流或人流,并使用實時 ML 算法評估實時流量或周邊安全。
另一種智能應(yīng)用是零售領(lǐng)域的“智能零售防損”應(yīng)用。視頻攝像頭可以用在商場和店鋪里,在銷售點實時監(jiān)控商品失竊或商品貼標錯誤。損耗 (Shrinkage )是零售業(yè)的一大難題,智能零售應(yīng)用能夠顯著降低損耗率。
這些只是 Versal 生態(tài)系統(tǒng)通過擴張,支持新市場和新用例的一小部分示例。
入門指南
如果您已準備好立即加入 Versal設(shè)計的世界,我想推薦兩種評估與原型設(shè)計平臺作為您的起點。一個是 VCK190 套件,也是首款 Versal AI Core 系列評估套件。另一個是SmartLynq+ 模塊,為實現(xiàn)高速調(diào)試與追溯而構(gòu)建,提供包含 AI 引擎在內(nèi)的對 Versal 架構(gòu)的完整可見性。
此外,我們還提供了豐富的文檔、示例、參考設(shè)計、資源和方法,為您在評估平臺上的開發(fā)工作提速。如果您剛剛開始接觸 Versal ACAP,也無需擔心!您可以先使用我們的設(shè)計流程助手 ( Design Flow Assistant)啟動開發(fā)規(guī)劃,然后使用我們的設(shè)計流程中心( Design Process Hubs),輕松地按設(shè)計流程找到全部文檔。此外,我們還在賽靈思 GitHub 上提供了大量的 Versal 和 Vitis 開源示例和有針對性的參考設(shè)計。
后續(xù)更精彩
VC2802 和 VC2602 的加入,為 AI Core 系列帶來了激動人心的新功能,然而, 這并不是全部,未來還會有更多令人興奮的消息。歡迎申請加入 Versal ACAP 快報更新列表,率先獲得最新產(chǎn)品訊息。
評論