基于模型的單目視覺(jué)定位方法研究概述
圖2 直線的透視投影
對(duì)于P3L問(wèn)題,大部分學(xué)者是通過(guò)圖像直線和攝像機(jī)光心構(gòu)成的投影平面的法向量和物體直線垂直來(lái)建立數(shù)學(xué)模型。這種方法要求確定物體位姿的三條直線不同時(shí)平行且不和光心共面,進(jìn)而建立由三條直線構(gòu)成的三個(gè)非線性方程。Horaud等 [3],Dhome等[4],Chen [5],Liu等[6]都是使用的這種方法。其數(shù)學(xué)模型可以描述如下:假設(shè)攝像機(jī)坐標(biāo)系和物體坐標(biāo)系之間的旋轉(zhuǎn)矩陣為,已知空間直線在物體坐標(biāo)系下的方向向量為,經(jīng)過(guò)旋轉(zhuǎn)變換到攝像機(jī)坐標(biāo)系下的方向向量為:。由數(shù)學(xué)模型得到關(guān)于旋轉(zhuǎn)矩陣的關(guān)系式為:。因此只要通過(guò)三條直線的投影方程,就能通過(guò)解方程組求得到矩陣的三個(gè)參量,即可以求得矩陣。這種方法有效地解決了使用直線特征如何進(jìn)行視覺(jué)定位的問(wèn)題,其中的不足之處是非線性方程組比較復(fù)雜,定位誤差偏大。
基于直線特征進(jìn)行單目視覺(jué)定位,大部分的研究集中在對(duì)定位數(shù)學(xué)模型的求解問(wèn)題上。目前,求解的方法主要有兩種,一種是閉式解,一種是數(shù)值解。對(duì)于閉式解方法,Dhome[4]和Chen[5]由空間任意三條線通過(guò)建立特殊的模型坐標(biāo)系推導(dǎo)出一個(gè)八次多項(xiàng)式,這個(gè)八次多項(xiàng)式可以由閉式解的方法來(lái)確定物體的位姿。Radu Horaud[3]對(duì)于非共面的三條直線得到一個(gè)四次多項(xiàng)式,最后可以由迭代的方法也可以由閉式解的方法確定物體的位姿。閉式解方法的優(yōu)點(diǎn)是實(shí)時(shí)性好,適合應(yīng)用在實(shí)時(shí)系統(tǒng)中,缺點(diǎn)是存在多解問(wèn)題,定位誤差偏大。許多學(xué)者提出來(lái)各種不同的迭代方法來(lái)解決閉式解的多解問(wèn)題,也就是數(shù)值解方法。
對(duì)于數(shù)值解方法,Yuan[7]建議把R參數(shù)從T參數(shù)中分離出來(lái),集中計(jì)算R參數(shù)。R旋轉(zhuǎn)矩陣是通過(guò)正交矩陣來(lái)表示,解是通過(guò)六個(gè)二次多項(xiàng)式的公共根來(lái)表示,這個(gè)公共根通過(guò)牛頓迭代梯度法得到,然而作者注意到在使用牛頓迭代梯度法時(shí)會(huì)出現(xiàn)局部最優(yōu)解,只有給迭代方法合適的初值才能得到全局最小值。Lowe等[8]使用牛頓迭代法估計(jì)物體相對(duì)于攝像機(jī)的方向和位置參數(shù),以模型投影和圖像之間距離的平方和作為誤差函數(shù),然后對(duì)誤差函數(shù)計(jì)算最小值。和Yuan的方法一樣,Lowe等[8]注意到牛頓迭代法的一些問(wèn)題,并且在以后的文章中他研究了怎樣處理初值和穩(wěn)定性問(wèn)題,提供好的初值,算法的穩(wěn)定性是可以保證的。Liu等[6]使用交替迭代方法來(lái)求解視覺(jué)參數(shù)。一條直線的對(duì)應(yīng)可以由兩個(gè)點(diǎn)的對(duì)應(yīng)來(lái)確定,作者注意到,使用線特征對(duì)應(yīng),旋轉(zhuǎn)參數(shù)很容易從位置參數(shù)中分離出來(lái),一旦旋轉(zhuǎn)參數(shù)確定下來(lái)了,對(duì)平移參數(shù)的求解是線性問(wèn)題,旋轉(zhuǎn)參數(shù)用歐拉角來(lái)表示。作者把誤差函數(shù)線性化,他們注意到當(dāng)三個(gè)角度都比三十度小的時(shí)候,該方法效果好。數(shù)值解方法的優(yōu)點(diǎn)是定位精度較高。其缺點(diǎn)是在優(yōu)化過(guò)程中容易出現(xiàn)局部極小值,并不能保證解的唯一性;計(jì)算量偏大,迭代時(shí)間較長(zhǎng),不適合應(yīng)用在實(shí)時(shí)系統(tǒng)中。綜合來(lái)看,現(xiàn)有的直線特征單目視覺(jué)定位算法在定位精度和實(shí)時(shí)性上很難滿足實(shí)際工程應(yīng)用的需要,有待進(jìn)一步的提高,因此,探討并研究定位精度高、實(shí)時(shí)性好的直線特征單目視覺(jué)定位算法非常有必要。
4 高級(jí)幾何特征定位
高級(jí)幾何特征包括圓,橢圓,二次曲線等。對(duì)于基于模型的單目視覺(jué)定位問(wèn)題,很多學(xué)者作了這方面的研究工作。通常,他們使用點(diǎn)或直線的投影作為基元,由三個(gè)圖像點(diǎn)或三條圖像直線以及在物體坐標(biāo)下點(diǎn)或直線之間的相對(duì)位置關(guān)系,確定模型的姿態(tài)。有時(shí),基于模型單目視覺(jué)定位問(wèn)題的模型采用曲線表面的物體,所以使用曲線進(jìn)行曲線表面物體的定位成為另外一個(gè)積極研究的方向。
使用曲線定位的好處是:首先,自然界許多物體的表面上有曲線特征;其次,曲線包含三維物體的全局位姿信息;最后,對(duì)曲線的表示是對(duì)稱矩陣,因此數(shù)學(xué)處理起來(lái)很方便。在很多情況下,我們可以獲得閉式解,從而避免了非線性搜索。對(duì)比于其它兩種特征,不足的地方是自然界中還是點(diǎn)特征和直線特征更普遍存在,具有廣泛的適用性。
對(duì)于曲線表面的物體,一些學(xué)者提出了使用曲線進(jìn)行定位的方法,如圖3所示。當(dāng)用曲線進(jìn)行姿態(tài)估計(jì)時(shí),一定要對(duì)復(fù)雜的非線性系統(tǒng)進(jìn)行求解。Forsyth等[9]對(duì)于共面曲線提出一種定位方法,這種方法是對(duì)兩個(gè)四次多項(xiàng)式進(jìn)行求解。Ma Songde[10]提出,對(duì)于兩個(gè)非共面曲線,它的姿態(tài)可以對(duì)有六個(gè)二次多項(xiàng)式組成的非線性系統(tǒng)進(jìn)行求解得到;當(dāng)兩個(gè)空間曲線共面時(shí),可以得到物體姿態(tài)的閉式解。
圖3 曲線的透視投影
圓和橢圓是曲線的一種。文獻(xiàn)[11]提出一種對(duì)圓特征進(jìn)行定位,如圖4所示,屬于代數(shù)方法。在文獻(xiàn)[12]中,提出一種新的使用圓特征進(jìn)行定位的方法,屬于幾何方法。
圖4 圓的透視投影
5 結(jié)論
基于模型的單目視覺(jué)定位方法研究是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要問(wèn)題??梢詰?yīng)用在多方面,包括機(jī)器人自主導(dǎo)航、陸地和空間移動(dòng)機(jī)器人定位、視覺(jué)伺服、攝像機(jī)校正、目標(biāo)跟蹤、視覺(jué)監(jiān)測(cè)、物體識(shí)別、零部件裝配等。
本文根據(jù)基于模型的單目視覺(jué)定位方法所使用的定位特征類型把定位方法進(jìn)行了分類,并且詳細(xì)介紹了各種特征定位方法的研究現(xiàn)狀。
對(duì)于基于點(diǎn)特征的定位方法,很多研究者進(jìn)行了深入廣泛的研究,目前的研究成果已經(jīng)比較成熟。對(duì)于基于直線特征和基于高級(jí)幾何特征的定位方法,目前的研究不是很多。在定位精度和實(shí)時(shí)性方面還很難滿足實(shí)際工程應(yīng)用的需要,在方法上有待于進(jìn)一步改進(jìn)和完善。在實(shí)際工程應(yīng)用中,探討并研究基于直線特征和基于高級(jí)幾何特征的高精度、實(shí)時(shí)性好的定位算法具有一定的研究?jī)r(jià)值。
評(píng)論