基于計算機視覺的虛實場景合成方法研究與應(yīng)用
摘要 :開發(fā)了一種虛擬場景與實時視頻之間的合成技術(shù),成功地將該技術(shù)應(yīng)用于虛擬規(guī) 劃系統(tǒng)中,詳細介紹了系統(tǒng)所采用的基于計算機視覺的標識識別和實時、自動攝像機位置、姿態(tài)跟蹤算法,并給出了系統(tǒng)運行結(jié)果。
本文引用地址:http://cafeforensic.com/article/202214.htm0 引 言
虛擬現(xiàn)實技術(shù) 的最終目的是使用戶完全沉浸在一個 由計算機生成的虛擬環(huán)境中,該技術(shù)已經(jīng)被成功地應(yīng)用到軍事、教育、娛樂等眾多領(lǐng)域。隨著應(yīng)用 的增多 ,虛擬現(xiàn)實技術(shù) 的缺陷也逐漸暴露出來,主要表現(xiàn)在如下兩個方面:(1)虛擬現(xiàn)實 中的場景完全由計算機生成,隨著繪制場景真實程度的提高,對系統(tǒng)硬件配置的要求也相應(yīng)提高,從而形成了繪制效果和實時性兩個同等重要又難以同時解決 的問題 。(2)交互方式受限.鼠標、鍵盤等傳統(tǒng)輸入設(shè)備并沒有提供給用戶一種直觀 自然的交互方式,而數(shù)據(jù)手套等較為昂貴的外圍設(shè)備不僅使用起來不方便,而且對工作范圍也有一定的限制。
混合現(xiàn)實 技術(shù)的出現(xiàn)很大程度上解決了以上兩個問題,它將計算機生成的虛擬場景、提示信息實時疊加到用戶所能觀察到的真實世界當中,并以此來增強用戶視覺感受 。在混合現(xiàn)實環(huán)境中用戶所能觀察到的主體是來源于真實世界的圖像信息,虛擬場景只起到輔助、提示作用,因此不需要真實感圖形繪制所需的高端的硬件配置。另一方面,由于圖像信息來源于真實世界,這就使得用戶本身能夠很自然地融合到整個系統(tǒng)中,并且能夠 以一種 自然 、直觀的方式與系統(tǒng)交互,而不必添加額外的硬件設(shè)備。正是由于以上特性,混合現(xiàn)實技術(shù)已經(jīng)被應(yīng)用到眾多領(lǐng)域當中,而且能夠比虛擬現(xiàn)實更好地完成某些任務(wù),如交互式規(guī)劃、動態(tài)虛擬展示等。
一個實用的混合現(xiàn)實系統(tǒng)所必須具備的特性之一是幾何一致性,即系統(tǒng)必須實時準確地判斷攝像機相對于真實世界的位置和姿態(tài).以便將虛擬場景正確地疊加到真實世界的具體位置上,使得用戶從感官上認為虛擬場景確實是真實世界的一部分。傳統(tǒng)的方法是利用硬件設(shè)備(電磁式、機械式跟蹤系統(tǒng))來獲取攝像頭位置信息,但這些方法不僅工作范圍受限,而且求得的結(jié)果也不夠精確。本文采用當前流行的基于計算機視覺的方法來獲取位置信息,事實證明該方法是有效、可行的。
系統(tǒng)結(jié)構(gòu)及工作流程
筆者構(gòu)建 了一個如圖 1所示的混合現(xiàn)實原型系統(tǒng),主要由如下幾個部分組成:(1)平面標識塊:一個帶有黑色邊框的正方形.尺寸、內(nèi)部圖案由用戶定義,主要功能是使系統(tǒng)能夠根據(jù)實際圖像中標識的變形來計算虛實配準所需的位置、姿態(tài)信息,同時還可以用不同的內(nèi)部圖案代表不同的虛擬場景,以增強系統(tǒng)的實用性。(2)圖像采集設(shè)備(攝像機):主要完成實時視頻采集功能。(3)圖形渲染系統(tǒng):生成與視頻合成所需的虛擬場景。(4)虛實合成:利用攝像機位置、姿態(tài)信息將視頻與虛擬場景相融合。(5)顯示設(shè)備 :包括頭盔式顯示器以及桌面臺式顯示器,用以將虛實合成的影像展現(xiàn)給使用者。
系統(tǒng)運行過程中,首先將采集到的一幀彩色圖像轉(zhuǎn)換成一幅二值(黑 白)圖像,然后對該二值圖像進行連通域分析,找出其中所有的四邊形區(qū)域作為候選匹配區(qū)域,將每一候選區(qū)域與模板庫中的模板進行匹配,如果產(chǎn)生匹配,則認為找到了一個標識,在生成與該標識對應(yīng)的虛擬場景的同時利用該標識區(qū)域的變形來計算攝像機相對于已知標識的位置和姿態(tài),最后根據(jù)得到的變換矩陣實現(xiàn)虛實之間的無縫融合。
2 標識識別與攝像機位置、姿態(tài)跟蹤算法
由上一節(jié)可知,構(gòu)建該系統(tǒng)有兩個關(guān)鍵問題需要解決 ,即如何識別標識內(nèi)部的不同圖案以生成與之對應(yīng)的虛擬場景 以及如何利用標識的變形計算虛實配準所需的坐標變換關(guān)系。以下分別介紹以上兩個問題的解決方法。
2.1標識識別
本系統(tǒng) 所采用的標識識別方法可 以分為以下幾步。
2.1.1圖像二值化
首先對采集到的彩色圖像進行二值化,處理成黑白(0,1)圖像,如圖 2(b)。具體方法為:設(shè)定一個 閾值,對圖像進行遍歷 ,根據(jù)該閾值,對圖像重新賦值。為了克服光照對識別結(jié)果造成的影響,同時采用 了自適應(yīng)閾值法 來提高系統(tǒng)穩(wěn)定性,設(shè)定當前 閾值 為上一幀圖像中標識投影區(qū)域像素灰度的平均值,實驗證明該方法對改善系統(tǒng)性能有較為明顯的效果。
2.1.2連通域分析
連通域分析的 目的是從復雜背景中提取標識的投影區(qū)域。分析過程為:查找所有像素值為 1的連通區(qū)域,首先根據(jù)大小約束對區(qū)域進行預篩選,然后利用最小二乘直線擬合法篩選出所有四邊形區(qū)域 ,結(jié)果見圖 2(c)。
2.1.3 區(qū)域規(guī)則化與模板匹配
區(qū)域規(guī)則化是將圖像中經(jīng)過投影變換的標識區(qū)域變換到標準模板空間,本文利用仿射變換 將標識經(jīng)過投影變形后 的區(qū)域直接映射到一個 64×64大小的正方形模板,效果見圖2(d)。接下來的工作是將規(guī)則化圖像與模板庫中的模板進行匹配,以返回代表不同虛擬場景的 ID值。本文采用相關(guān)系數(shù)法來完成匹配工作,方法如下:
首先利用以下四式計算規(guī)則化圖像 I和標準模板圖像 P各自的均值和方差。
然后計算兩幅圖像的相關(guān)系數(shù) p,本文選擇所有模板中與規(guī)則化圖像具有最大相關(guān)系數(shù) p且 p>0.5的模板作為當前匹配結(jié)果,并返回與之對應(yīng)的 ID值 2.2攝像機位置、姿態(tài)估計
首先給出系統(tǒng)的坐標變換關(guān)系如圖 3所示。規(guī)定平面標識在世界坐標系中的位置為已知,攝像機位置、姿態(tài)計算問題轉(zhuǎn)化為攝像機坐標系與世界坐標系之間三維變換矩陣的求解。
世界坐標 系與攝像機坐標系間的變換關(guān)系可以用式(5)表示。其中 W為世界坐標系下某點坐標,C為該點在攝像機坐標系中的位置,T :[R R R:T] 為待求三維變換矩陣,包含三個旋轉(zhuǎn)分量和一個平移分量。
評論