基于FPGA的嵌入式視覺的應(yīng)用
什么樣的積極創(chuàng)新可以幫助您設(shè)計出這樣一個系統(tǒng)——它能夠提醒用戶有兒童在游泳池中溺水,或是有入侵者試圖闖入住宅或者辦公場所?這種技術(shù)還能夠提醒駕駛員道路上即將發(fā)生的危險,甚至可以制止他們并線、加速及其它可能會給自身或他人帶來危險的操作。它能夠給軍用無人機或其他機器人配上電子“眼”,使這些設(shè)備部分實現(xiàn)甚至完全實現(xiàn)自動化操作。它能夠協(xié)助內(nèi)科醫(yī)生診斷患者的病情。它能夠準確地進行面部識別,隨后啟動一系列操作(例如自動登錄用戶賬號,或者獲取相關(guān)新聞及其它信息),解讀姿態(tài), 甚至覺察人的情緒狀態(tài)。與GPS、指南針、加速計、陀螺儀和其他功能配合,它還能夠提供數(shù)據(jù)強化(data augmented) 的場景再現(xiàn)。
本文引用地址:http://cafeforensic.com/article/201809/389108.htm上面談到的應(yīng)用實例都采用了一項共同的技術(shù),即嵌入式視覺。該技術(shù)正準備書寫新一代電子系統(tǒng)的成功篇章。嵌入式視覺最初應(yīng)用于組裝生產(chǎn)線檢測、光學字符識別、機器人、監(jiān)視和軍用系統(tǒng)等傳統(tǒng)的計算機視覺應(yīng)用。不過近年來,隨著關(guān)鍵技術(shù)構(gòu)建塊成本的不斷下降以及功能的不斷豐富,嵌入式視覺技術(shù)不斷向主要的大批量市場加速滲透。
例如,在日益豐富和不斷提高的應(yīng)用需求的推動下,圖像傳感器的分辨率、低亮度性能、幀速率、尺寸、功耗和成本等關(guān)鍵特性都有著明顯的改善。同樣,嵌入式視覺應(yīng)用也要求處理器具備高性能、低成本、低功耗以及靈活的可編程功能。這些理想的特性在不計其數(shù)的產(chǎn)品設(shè)計中正日漸變?yōu)楝F(xiàn)實。最新一代光學系統(tǒng)、照明模塊、易失性和非易失性存儲器以及I/O 標準也正在實現(xiàn)類似的特性優(yōu)化。因此,算法到了迎接挑戰(zhàn)的關(guān)口,需要充分利用這些硬件性能的改進來提供更穩(wěn)健可靠的分析結(jié)果。
嵌入式視覺指的是能夠通過視覺方式理解其所處環(huán)境的機器。“嵌入式”的意思指內(nèi)置圖像傳感器的非通用型計算機系統(tǒng)。比如,嵌入式可以是手機、平板電腦、監(jiān)視系統(tǒng)、地面或者具備飛行能力的機器人、安裝有一套 360°攝像頭的車輛或者是醫(yī)療診斷設(shè)備。它也可以是有線或者無線用戶界面外設(shè)。這方面微軟針對 Xbo x360 游戲機提供的 Kinect 可能是最好的例證,上市頭 2 個月就銷售出 800萬件。
FPGA 的商機:案例研究
可供選用的穩(wěn)健可靠的嵌入式視覺處理產(chǎn)品豐富多樣,如微處理器與嵌入式控制器、專用 SoC、DSP、圖形處理器、ASIC 和 FPGA。FPGA 是一款用于實現(xiàn)嵌入式視覺技術(shù)的極富吸引力的芯片平臺,因為它將 ASIC的高性能和低功耗硬件以及可運行在CPU、GPU 或 DSP 上的軟件算法的靈活性和快速上市優(yōu)勢集于一身。在嵌入式視覺市場處于襁褓時期的當前階段,靈活性具有特別重要的意義。因為為了支持多樣化的算法選擇,迅速完成缺陷修正和特性集改進是一種常態(tài),而非偶然。FPGA 的硬件可配置能力也便于讓設(shè)計經(jīng)簡單直觀修改就能適用于支持各種串行和并行(以及模擬和數(shù)字)接口的圖像傳感器。
嵌入式視覺聯(lián)盟是由世界各地的開發(fā)商和提供商組成的統(tǒng)一的全球性聯(lián)盟,其宗旨是以豐富、迅速和高效的方式將嵌入式視覺的潛力變?yōu)楝F(xiàn)實(見側(cè)邊欄)。該聯(lián)盟的兩個創(chuàng)始成員 (BD) 伯克利設(shè)計技術(shù)公司和賽靈思已聯(lián)合開發(fā)出一個參考設(shè)計,用于證實嵌入式視覺技術(shù)不可估量的市場前景以及 FPGA 在實現(xiàn)該前景中可能發(fā)揮的作用。這個項目的目的是探索系統(tǒng)設(shè)計人員在開發(fā)高度復雜的智能視覺平臺時可進行的典型架構(gòu)決策,該平臺所包含的元件需要高強度硬件處理和復雜的軟件及算法控制。
BD 和賽靈思對設(shè)計進行了分區(qū),其中 FPGA 架構(gòu)負責處理數(shù)字信號處理密集型運算,而 CPU 則負責處理復雜的控制和預測算法。在這個探索性實現(xiàn)方案中,CPU 電路板通過以太網(wǎng)接口連接到 FPGA 開發(fā)板。FPGA 執(zhí)行高帶寬處理,僅有元數(shù)據(jù)通過網(wǎng)絡(luò) (network tether) 進行交換。該項目還探索了軟硬件同步開發(fā),故要求在最終的 FPGA 硬件實現(xiàn)之前使用精準的仿真模型。
第一階段:道路標志檢測
項目的第一階段和第二階段均采用了兩個基于 PC 的專門功能:正在開發(fā)中的賽靈思視頻 IP 模塊的仿真模型和一個由 BD 開發(fā)的處理應(yīng)用(見圖 1)。輸入數(shù)據(jù)為 720p 高清分辨率、60 fps 的 YUV 編碼視頻流,代表車輛正前方攝像頭可能采集到的圖像。其目的是識別(雖然沒有采用光學字符職別技術(shù)“讀取”,但這項功能可以自然延伸出來)視頻幀中的四種類型的對象,以輔助駕駛員駕駛:
? 綠色方向標志
? 黃色和桔紅色危險標志
? 藍色信息標志
? 桔紅色安全錐
賽靈思提供的 IP 模塊仿真模型負責輸出用于識別每幀中各顏色像素組的位置和大小的元數(shù)據(jù),這些也是最終硬件 IP 模塊生成的元數(shù)據(jù)。許多嵌入式視覺系統(tǒng)的精度受多種外部因素的影響,比如成像傳感器的噪聲、突然的照度變化以及難以預測的外部運動。對本項目的必要要求之一是要求FPGA 硬件在盡量節(jié)約硬件資源的情況下,借助能夠容忍大量外部干擾且不降低檢測精確度的預測性軟件,在有大量外部干擾的條件下完成圖像處理并生成元數(shù)據(jù)。
BDTI 針對這種特定應(yīng)用,對這些IP 模塊豐富的配置參數(shù)集進行了優(yōu)化,而且 BDTI 的后處理算法還提供了進一步的優(yōu)化和預測功能。例如,在某些情況下,該硬件只能部分識別一幀中的對象,但應(yīng)用層軟件使用跟蹤算法能夠繼續(xù)預測對象的位置。這種方法非常有效,因為在許多情況下物理探測無法做到持續(xù)不斷,因此軟件智能層對提供持續(xù)的預測起著關(guān)鍵作用。
再舉一個例子。高速公路綠色指路標志上的黑色或白色字符可能會擾亂 IP 模塊普通的圖像分析功能,會將路標錯誤地分解成多像素的子集合(見圖 2)。根據(jù)該應(yīng)用中使用的成像傳感器的質(zhì)量和設(shè)置,IP 模塊還會混淆紅色和桔紅色,從而將其他車輛的尾燈或剎車燈誤認為交通錐或交通標識。
因此,BDTI 開發(fā)的針對特定應(yīng)用定制的算法可用于進一步處理賽靈思提供的元數(shù)據(jù)。例如,BDTI 的算法知道什么樣的標志看上去應(yīng)該是怎么樣的(大小、形狀、顏色、圖案、在幀中的位置等),故而能夠?qū)⑾嚓P(guān)的像素集群組合成更大的群組。類似的,這些算法也能判斷什么時候應(yīng)該去除看似顏色相近但并非標志的像素集群,比如前面提及的車輛剎車燈。
第二階段:行人檢測與跟蹤
在項目的第一階段中,攝像頭處于運動狀態(tài)而待識別的對象(即道路標志)處于靜止狀態(tài)。第二階段主要針對安全應(yīng)用,攝像頭處于靜止狀態(tài)而對象(本例中為行人)則未必。對這種情況,視頻分析算法就不能依靠預設(shè)的顏色、圖案或其它對象特征,因為行人可以穿著各種衣物,可以高矮胖瘦各異,可以膚色、頭發(fā)顏色和發(fā)型不同(另外還可能戴著遮擋頭發(fā)的帽子、墨鏡等裝飾物)。軟件還需要解決另一個難題,不僅需要識別和跟蹤行人,還需要在行人穿越一道數(shù)字“絆網(wǎng)”,進入視頻幀的特定區(qū)域時發(fā)出警報(見圖 3)。
項目第二階段與第一階段采用的硬件配置完全相同,只是軟件有所變化。視頻流饋送到視頻分析 IP 核的仿真模型中,所生成的元數(shù)據(jù)傳輸?shù)蕉壦惴ㄆ骷┻M一步處理。此時面臨的難題包括:
? 解決不必要的噪聲和適當?shù)膶ο蠓指钪g根本性的權(quán)衡取舍問題
? 對象不斷變化的形態(tài)(外形和結(jié)構(gòu))
? 對象不斷變化的運動狀態(tài),包括行人間的運動狀態(tài)變化以及特定行人隨時間的運動狀態(tài)變化
? 元數(shù)據(jù)消失。比如當行人停止行走,被中間的障礙物遮擋或者是與背景圖案混為一體
? 有其他對象出現(xiàn)在場景中,包括靜態(tài)和動態(tài)的
? 行人與攝像頭之間的距離不斷發(fā)生變化
? 人群中個別行人與群體的運動矢量對比,主體運動矢量和反向運動矢量的對比
就“絆網(wǎng)”的實現(xiàn),四種不同的視頻流對視頻分析算法的調(diào)試和優(yōu)化尤其有效:
? 以相反方向行走的“近處”行人
? 以不同方向行走的“近處”行人
? 一個“遠處”行人和一輛行駛的卡車,從某種角度看,兩者大小相仿
?“遠處”的多名行人與一輛駛近的卡車,卡車看上去比人群大
第三階段:硬件轉(zhuǎn)換及未來發(fā)展
項目的最后階段采用賽靈思真正的視頻分析 IP 模塊(代替之前使用的仿真模塊),運行在 Spartan ?-3A 3400 視頻入門套件上。MicroBlaze?軟核處理器嵌入在 Spartan-3A FPGA內(nèi),采用額外的專用功能模塊予以強化,并實現(xiàn)了網(wǎng)絡(luò)協(xié)議棧。該網(wǎng)絡(luò)協(xié)議棧主要負責處理高數(shù)位率和以太網(wǎng)分組的元數(shù)據(jù)并將其傳輸?shù)?BDTI 開發(fā)的第二級處理算法,同時實現(xiàn)道路標志檢測和行人檢測與跟蹤功能。雖然這些算法之前在基于 X86 的 PC 上運行,BDTI 已成功地將它們移植到基于ARM? Cor tex TM-A8 的硬件平臺(BeagleBoard) 上(見圖 4)。
對已經(jīng)熟悉賽靈思產(chǎn)品計劃的用戶來說,可能立即就會想到將 FPGA 和Cortex-A8 CPU 集成在單個芯片上的ZynqTM 可擴展處理平臺。能不能在單個 Zynq 器件上運行整個視頻分析參考設(shè)計呢? 答復顯然是肯定的, 因為Zynq 產(chǎn)品系列的各器件包含有足夠的可編程邏輯資源,同時 BDTI 算法對ARM CPU 核來說負載適中。
嵌入式視覺正在為系統(tǒng)開發(fā)商及其半導體和軟件供應(yīng)商書寫新一篇重大的技術(shù)成功篇章。正如本文中介紹的案例研究所示,F(xiàn)PGA 以及 FPGA 與 CPU組合的 SoC 能夠成為實現(xiàn)嵌入式視覺算法極富吸引力的芯片平臺。
評論