3D手勢(shì)識(shí)別背后的技術(shù)
摘要:探討了3D手勢(shì)識(shí)別需要的技術(shù)。
本文引用地址:http://cafeforensic.com/article/136829.htm隨著觸摸屏技術(shù)的不斷推廣,用戶已經(jīng)適應(yīng)并逐漸熟悉了與機(jī)器的互動(dòng)?,F(xiàn)在,人機(jī)互動(dòng)技術(shù)已邁上了更高的臺(tái)階,進(jìn)入了手勢(shì)識(shí)別時(shí)代,不過這也并不是一帆風(fēng)順的。手勢(shì)識(shí)別現(xiàn)已在娛樂及游戲市場(chǎng)出現(xiàn),然而這種技術(shù)將對(duì)我們的日常生活產(chǎn)生怎樣的影響呢?不妨假想一下,有人坐在沙發(fā)上,只需一揮手就能操控?zé)艄夂碗娨?,或者汽車自?dòng)檢測(cè)附近是否有行人。隨著手勢(shì)識(shí)別技術(shù)支持人機(jī)互動(dòng)的不斷深入發(fā)展,這些及其它功能將很快得以實(shí)現(xiàn)。手勢(shì)識(shí)別技術(shù)長(zhǎng)期以來一直采用 2D 視覺進(jìn)行研究,但隨著 3D 傳感器技術(shù)的出現(xiàn),其應(yīng)用將日益廣泛并多樣化。
2D視覺的局限
計(jì)算機(jī)視覺技術(shù)一直在努力向堪比人類智慧的智能方向發(fā)展,以更好地了解場(chǎng)景。如果不能解釋周圍的世界,計(jì)算機(jī)就無法與人實(shí)現(xiàn)自然交流對(duì)接。計(jì)算機(jī)在了解周圍場(chǎng)景方面面臨的主要問題包括細(xì)分、對(duì)象表征、機(jī)器學(xué)習(xí)與識(shí)別等。由于 2D 場(chǎng)景表征本身存在局限性,手勢(shì)識(shí)別系統(tǒng)必須應(yīng)用其它各種提示信息才能得到包含更有用信息的更好結(jié)果。在可能性信息包含整個(gè)身體跟蹤時(shí),盡管將多種提示信息整合在一起,單靠 2D 表征也很難獲得超越手勢(shì)識(shí)別的任何信息。
“z”(深度)創(chuàng)新
向 3D 視覺及手勢(shì)識(shí)別發(fā)展過程中的挑戰(zhàn)一直都是第三坐標(biāo) —z 軸坐標(biāo)的獲取。人眼能看到 3D 對(duì)象,能自然識(shí)別 (x,y,z) 坐標(biāo)軸,從而能夠看到一切事物,而后大腦能夠以 3D 影像的形式表達(dá)這些坐標(biāo)軸。機(jī)器無法獲得 3D 視覺的一大挑戰(zhàn)就在于影像分析技術(shù)。目前有 3 種應(yīng)對(duì) 3D 采集問題的常見解決方案,每種方案都有其獨(dú)特的功能與特定的用途。這三種方案分別為:立體視覺、結(jié)構(gòu)光模式以及渡越時(shí)間 (TOF)。有了這些技術(shù)提供的 3D 影像輸出,就可實(shí)現(xiàn)手勢(shì)識(shí)別技術(shù)。
立體視覺
立體視覺系統(tǒng)可能是最為人所熟知的 3D 采集系統(tǒng)。該系統(tǒng)使用 2 個(gè)攝像機(jī)獲得左右立體影像,該影像有些輕微偏移,與人眼同序。計(jì)算機(jī)通過比較這兩個(gè)影像,就可獲得對(duì)應(yīng)于影像中物體位移的不同影像。該不同影像或地圖可以是彩色的,也可以為灰階,具體取決于特定系統(tǒng)的需求。立體視覺系統(tǒng)目前通常用于 3D 電影,能帶來低成本而又震撼人心的娛樂體驗(yàn)。
結(jié)構(gòu)光模式
結(jié)構(gòu)光模式可用來測(cè)量或掃描 3D 對(duì)象。在該類系統(tǒng)中,可在整個(gè)對(duì)象上照射結(jié)構(gòu)光模式,光模式可使用激光照明干擾創(chuàng)建,也可使用投影影像創(chuàng)建。使用類似于立體視覺系統(tǒng)的攝像機(jī),有助于結(jié)構(gòu)光模式系統(tǒng)獲得對(duì)象的 3D 坐標(biāo)。此外,單個(gè) 2D 攝像機(jī)系統(tǒng)也可用來測(cè)量任何單條的移位,然后通過軟件分析獲得坐標(biāo)。無論使用什么系統(tǒng),都可使用坐標(biāo)來創(chuàng)建對(duì)象外形的數(shù)字 3D 圖形?! ?/p>
渡越時(shí)間 (TOF)
渡越時(shí)間 (TOF) 傳感器是一種相對(duì)較新的深度信息系統(tǒng)。TOF 系統(tǒng)是一種光雷達(dá) (LIDAR) 系統(tǒng),同樣可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖。接收器則可通過計(jì)算光脈沖從發(fā)射器到對(duì)象,再以像素格式返回到接收器的運(yùn)行時(shí)間來確定被測(cè)量對(duì)象的距離。
TOF 系統(tǒng)不是掃描儀,因?yàn)槠洳恢С贮c(diǎn)對(duì)點(diǎn)測(cè)量。TOF 系統(tǒng)可同時(shí)獲得整個(gè)場(chǎng)景,確定 3D 范圍影像。利用測(cè)量得到的對(duì)象坐標(biāo)可創(chuàng)建 3D 影像,并可用于機(jī)器人、制造、醫(yī)療技術(shù)以及數(shù)碼攝影等領(lǐng)域的設(shè)備控制。
實(shí)施 TOF 系統(tǒng)所需的半導(dǎo)體器件現(xiàn)已開始供貨。目前的器件支持實(shí)現(xiàn) TOF 系統(tǒng)所需的處理性能、速度與帶寬。
三維掃描儀相關(guān)文章:三維掃描儀原理 全息投影相關(guān)文章:全息投影原理
評(píng)論