AI計算平臺設計方案:901-基于3U VPX的圖像數(shù)據(jù)AI計算平臺
一、產(chǎn)品概述
設備基于3U VPX的導冷結構,集成FPGA接口預處理卡,GPU板卡、飛騰ARM處理卡,實現(xiàn)光纖、差分電口或者Camera link的圖像接入,F(xiàn)PGA信號預處理,GPU AI計算,飛騰ARM的采集管理存儲。
二、系統(tǒng)組成
系統(tǒng)組成包括:3U VPX機箱電源、3U VPX背板、 1塊3U VPX V7采集處理板、1塊3U VPX AGX orin GPU計算主板、1塊3U VPX飛騰處理器計算板。
2.1基于XC7V690T的3U VPX信號處理板(274)
本板卡系我司自主研發(fā)的基于3U VPX導冷架構的信號處理板,適用于高速圖像處理等。芯片采用工業(yè)級設計。該處理板包含1片Xilinx公司的Virtex7系列FPGA-XC7V690T-2FFG1761I。板載兩組64位寬DDR3,每組容量4GB,一個HPC FMC接口。VPX接口連接4組x4 GTH,24組LVDS,一路RS422,一路1000Base-T。板卡的電氣與機械設計依據(jù)VPX標準(VITA 46.0),支持導冷,能夠滿足用戶在特殊環(huán)境下的使用需求。
板卡功能 | 參數(shù)內(nèi)容 |
主處理器 | Xilinx XC7V690T-2FFG1761I |
板卡標準 | VPX VITA 46.0 |
電氣規(guī)范 | PCIe 2.0,3.0 X4 |
FMC接口 | FMC ANSI/VITA 57.1 – 2008 ,ASP-134486-01 |
板載緩存 | 兩組DDR3,每組512Mx64bit(4GB), MT41K512M8RH-125-IT |
加載Flash | BPI加載模式,BPI Flash 2Gb |
VPX接口 | P1: GTX x16, 支持PCIe、SRIO協(xié)議 |
仿真器接口 | 1x 6Pin JTAG接口,間距2.54mm |
LED | 兩個,電源狀態(tài)指示燈,F(xiàn)PGA狀態(tài)指示燈(可編程) |
復位方式 | 外復位 |
板卡尺寸 | 100mm x 160mm x20mm |
板卡重量 | (含散熱片) |
板卡供電 | +12V@4A |
板卡功耗 | 48W |
工作溫度 | Industrial -20℃到+70℃ |
光纖收發(fā)子卡、2711子卡、Cameralink子卡
2.2 基于3U VPX的AGX Orin GPU計算主板(735) 、
Jetson AGX Orin 采用 NVIDIA Ampere 架構 GPU 和 Arm Cortex-A78AE CPU,以及新一代深度學習和視覺加速器。高速 IO、204GB/s 的內(nèi)存帶寬以及 32GB 的 DRAM 能夠饋送多個并發(fā) AI 應用程序管道。采用 Jetson AGX Orin,您現(xiàn)在可以部署更大型、更復雜的模型,解決自然語言理解、3D 感知和多傳感器融合等問題。Jetson Orin算力高達275 TOPS,是上一代多個并發(fā) AI推理管道性能的8倍,加上支持多個傳感器高速接口,可為新時代機器人提供理想的解決方案.
GPU | 2048-core NVIDIA Ampere architecture GPU with |
CPU | 12-core Arm Cortex-A78AE v8.2 64-bit CPU |
顯存 | 64GB 256-bit LPDDR5 204.8GB/s |
存儲 | 64GB eMMC 5.1 |
DLA最大頻率 | 1.6 GHz |
AI性能 | 275 TOPS |
DL加速器 | 2x NVDLA v2 |
視頻加速器 | 1x PVA v2 |
視頻編碼 | 2x 4K60 (H.265), 4x 4K30 (H.265) |
視頻解碼 | 1x 8K30 (H.265), 3x 4K60 (H.265), 7x 4K30 (H.265) |
PCle | x8 PCle Gen4 |
顯示接口 | HDMI |
網(wǎng)絡 | RJ45 接口 (高達1 GbE) |
2.3 3U VPX飛騰處理器刀片計算機
2.3.1 產(chǎn)品概述
該產(chǎn)品是一款基于國產(chǎn)飛騰FT2000 4核或騰銳D2000 8核的高性能3U VPX刀片式計算機。產(chǎn)品提供了4個x4 PCIe 3.0總線接口,同時可配置為1個x16或2個x8 PCIe3.0接口,因此具有很強的擴展性,極大地滿足多負載多節(jié)點的應用需求。產(chǎn)品結構完全符合VITA 46.0規(guī)范,有很強的可靠性、可維護性、可管理性,并與軍用計算機的抗振動、抗沖擊、抗寬溫環(huán)境急劇變化等惡劣環(huán)境特性進行完美融合。
2.3.2 功能指標
● 3U 5HP VPX規(guī)格。
● 支持FT-2000/4 四核處理器和騰銳D2000 八核處理器
FT-2000/4標準版,2.6GHz,16W
騰銳D2000/8標準版,2.3GHz,25W
● 板載16GB雙通道DDR4內(nèi)存,頻率2400MHz。
● 支持2個VGA接口,最大分辨率1920x1080@60Hz;其中1路VGA為后出接口。
● 支持4個x4 PCIe3.0接口,可配置成1個x16 PCIe 3.0或2個x8 PCIe 3.0。
● 前面板支持1路10/100/1000Mbps網(wǎng)絡接口,后出2路10/100/1000Mbps網(wǎng)絡信號,其中1路后出網(wǎng)口與前面板網(wǎng)口二選一切換。
● 板載1個mSATA接口,支持SATA3.0;后出2路SATA3.0信號,用于擴展存儲。
● 前面板支持2個USB3.0接口;后出2路USB3.0接口信號。
● 提供2路RS232后出串口,其中1路可選RS422/RS485模式。
● 提供1路RS232后出CPU管理串口。
● 前面板帶復位按鍵和LED指示燈。
● 單板管理功能(可選功能)。
● 支持銀河麒麟、UOS、Centos、ubuntu、VxWorks系統(tǒng)。
(本項目使用ubuntu操作系統(tǒng))
三、軟件開發(fā)內(nèi)容
3.2 TLK2711收發(fā)整體流程設計
在背板設計中,飛騰主板和GPU千兆網(wǎng)互聯(lián)和RS232互聯(lián)??紤]傳輸速度,使用千兆網(wǎng)進行傳輸。使用TCP/IP協(xié)議,飛騰處理器為TCP服務端,GPU為TCP客戶端主動進行鏈接請求。
3.7 客戶端界面
雙通道TLK2711子卡界面
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。