機(jī)器學(xué)習(xí)在無人駕駛中的現(xiàn)狀及挑戰(zhàn)
丨機(jī)器學(xué)習(xí)的端對端控制
本文引用地址:http://cafeforensic.com/article/201901/396877.htm當(dāng)然一種應(yīng)用就是針對我們前面說反應(yīng)式的結(jié)構(gòu),假設(shè)整個(gè)控制器我們不管它的內(nèi)部結(jié)構(gòu),完全由一個(gè)神經(jīng)網(wǎng)絡(luò)這樣的程序來解決,這個(gè)大概就是現(xiàn)在比較端對端的控制,什么意思?直接從傳感器到車輛的動(dòng)作,這就是所謂的端對端的學(xué)習(xí)控制,端對端本身也不是新鮮的事物,在1989年的時(shí)候美國機(jī)器人研究所就用當(dāng)時(shí)的三層網(wǎng)絡(luò)就實(shí)現(xiàn)了簡單的無人駕駛,因?yàn)楫?dāng)時(shí)的網(wǎng)絡(luò)它的標(biāo)定能力是非常有限的,因此它能夠完成的任務(wù)也是非常簡單的。
神經(jīng)網(wǎng)絡(luò)大家知道從80年代到90年代甚至到2000年之后很長一段時(shí)間,發(fā)展是非常非常緩慢的,目前兩種方案,一種是前饋神經(jīng)網(wǎng)絡(luò),一種基于遞歸神經(jīng)網(wǎng)絡(luò),都在做一些研究。
大家可以看到上面這個(gè)視頻,英偉達(dá)在2016年的神經(jīng)網(wǎng)絡(luò)端對端控制,說到這里是不是用端對端學(xué)習(xí)控制這個(gè)問題就解決了,實(shí)際上大家仔細(xì)看是不可能的,前面有一個(gè)十字路口,用端對端學(xué)習(xí)控制怎么能夠?qū)崿F(xiàn)讓車選擇不同的路線呢?這個(gè)事情在他做的這個(gè)實(shí)驗(yàn)里面就不涉及到這個(gè)問題。
實(shí)際上這個(gè)問題英偉達(dá)做這個(gè)實(shí)驗(yàn)還有很多問題沒有解決,從控制上來說,車要適應(yīng)不同的坡路和材質(zhì),這個(gè)本身就是很復(fù)雜的,對于剛才說的端對端的學(xué)習(xí)控制,要做采集數(shù)據(jù)是非常困難的,而網(wǎng)絡(luò)本身結(jié)構(gòu)也沒有辦法支持,退而求其次就有其他的研究,大家去看一下Deep Driving:Learning Affordance for Direct Perception in Autonomous Driving 這篇文章,這個(gè)想法就跟這個(gè)端對端不太一樣,它把這個(gè)系統(tǒng)分為控制和感知,把控制環(huán)節(jié)還是用控制的方法去做,但是后面感知希望用神經(jīng)網(wǎng)絡(luò)來解決,設(shè)計(jì)一個(gè)神經(jīng)網(wǎng)絡(luò),輸入一個(gè)圖象,輸出就是車道和車道上的線得到這樣一個(gè)抽象的模型,把這個(gè)模型再由后端輸入再去控制車輛運(yùn)動(dòng),這個(gè)是他們展示的一段視頻,這個(gè)是神經(jīng)網(wǎng)絡(luò)的輸入,這個(gè)就是網(wǎng)絡(luò)的輸出,后端控制的輸入,這是他們做的一個(gè)實(shí)驗(yàn)。
這種端對端的方案,我感覺下面幾個(gè)問題對他來說可能是比較重要的,最大的問題相對于我們說的駕駛?cè)蝿?wù),現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)還是太簡單了,表達(dá)能力非常有限。
首先我們可以看,從數(shù)據(jù)的意義上來說,你要完成一個(gè)駕駛?cè)蝿?wù),你拿到的數(shù)據(jù)有任務(wù)信息,有離線地理信息,有環(huán)境信息還有本體的運(yùn)動(dòng)狀態(tài)等等,對于這樣一些完全抑制的信息,我們設(shè)計(jì)一個(gè)什么樣網(wǎng)絡(luò)結(jié)構(gòu)才能綜合起來實(shí)現(xiàn)車輛的駕駛,這個(gè)本身我認(rèn)為是一個(gè)比較大的問題。第二就是我們選擇困境,在不同的路網(wǎng)里面,你碰到十字路口的到底怎么走,可能很難解決。如果用端對端的方案可能很難解決這個(gè)問題。還有第三個(gè)比如說駕駛行為在時(shí)間上的不確定性,實(shí)際上它的復(fù)雜性是非常非常大的,也是現(xiàn)在很難解決的一個(gè)問題。這是我們說的端對端的學(xué)習(xí)控制。
丨慎思式結(jié)構(gòu)中的機(jī)器學(xué)習(xí)
我們能不能把機(jī)器學(xué)習(xí)慎思式方案用到無人駕駛里面去,很多研究用機(jī)器學(xué)習(xí)去提取交通場景中的各種各樣的交通物體,道路環(huán)境等等,用深度神經(jīng)元網(wǎng)絡(luò)實(shí)現(xiàn)場景中的各種交通物體,道路、建筑物的一個(gè)分割,把它作為下一步的決策規(guī)劃的輸入。再比如說對于我們知道現(xiàn)在無人車頭上都頂著一個(gè)激光雷達(dá),也可以用深度神經(jīng)原的方法進(jìn)行處理獲取道路上各種各樣的物體,交通標(biāo)志的信息等等。這個(gè)實(shí)際上用深度學(xué)習(xí)在做這種三維微場景分析,這也是目前用深度學(xué)習(xí)來解決環(huán)境的一個(gè)重要的研究方向。
我們說了,可以用它去解決物體的識(shí)別,場景的分析問題,當(dāng)然也可以用它解決決策規(guī)劃問題。近年來,我覺得做的比較好的工作就是他們提出的ChauffeurNet,他做的工作就是設(shè)計(jì)一個(gè)非常復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),要來實(shí)現(xiàn)抑制數(shù)據(jù)的處理融合,這是他們設(shè)計(jì)的整個(gè)網(wǎng)絡(luò)結(jié)構(gòu),用來把各種各樣的信息能夠融合到整個(gè)駕駛過程中去,這是我們說的從決策的角度,當(dāng)然也有人研究用機(jī)器學(xué)習(xí)解決控制問題。
丨國防科技大學(xué)無人駕駛團(tuán)隊(duì)實(shí)踐
現(xiàn)在我們回到我們團(tuán)隊(duì),我們這些年在這方面也做了很多研究工作,我們用學(xué)習(xí)解決車輛控制,車輛縱向控制,甚至包括像我們把這個(gè)環(huán)境變成一個(gè)多車道的模型,實(shí)現(xiàn)無人車在環(huán)境里面的自主決策等等,這也是用機(jī)器學(xué)習(xí)做的。我們有兩個(gè)博士生在這一塊做的非常好,一個(gè)是基于廣義Haar濾波器的實(shí)時(shí)目標(biāo)檢測,我們在考慮能夠壓縮計(jì)算資源,使得利用十分之一或者五分之一的資源來實(shí)現(xiàn)同樣類似的效果,這對于機(jī)器學(xué)習(xí)的應(yīng)用應(yīng)該說是有非常幫助的。另外我們也做了交通場景的多任務(wù)學(xué)習(xí),什么意思?一個(gè)神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)多個(gè)任務(wù),像今天早上有院士做報(bào)告也說到這個(gè)問題,對于人工智能是一個(gè)困難,我們也在做這方面的嘗試,這是我們自己做的實(shí)際的情況,包括物體的分割,行為場景的分割等等。
另外我們在記憶式網(wǎng)絡(luò),在目標(biāo)檢測方面的應(yīng)用也做了很多工作。什么意思呢?大家有沒有注意到,所謂的深度神經(jīng)網(wǎng)絡(luò)往往需要人工去標(biāo)注大量的樣本,這很顯然是很復(fù)雜的工作,我們做的探索是怎么能夠?qū)崿F(xiàn)目標(biāo)檢測,實(shí)現(xiàn)機(jī)器學(xué)習(xí)。這個(gè)如果大家感興趣可以下去關(guān)注一下我們做的工作,應(yīng)該說是比較好的,當(dāng)然它的基本原理就是我們首先在靜態(tài)的情況下拍一些視頻。我是在靜態(tài)的環(huán)境、背景下去檢測動(dòng)態(tài)的目標(biāo),通過這個(gè)辦法不斷地收集大量的樣本,然后再把學(xué)習(xí)好的檢測器用在一個(gè)動(dòng)態(tài)的載體上,這是我們已經(jīng)做的一些工作。
最后我說一下自己對這個(gè)事的一點(diǎn)理解:第一說我們機(jī)器學(xué)習(xí)對于解決無人駕駛的問題是非常非常重要的,但是它不是全部,它只能解決其中一部分問題。第二深度神經(jīng)網(wǎng)絡(luò)它場景建模與理解的有力工具。第三統(tǒng)計(jì)學(xué)習(xí)、增強(qiáng)學(xué)習(xí)對于解決行為決策問題會(huì)有所幫助,但是目前看來前提是必須要由人工建立一個(gè)合適的決策模型的基礎(chǔ)上用學(xué)習(xí)的方法來實(shí)現(xiàn)決策的前件的學(xué)習(xí)。第四是用積極學(xué)習(xí)的方法解決動(dòng)力學(xué)控制問題,這個(gè)問題按說傳統(tǒng)方法已經(jīng)解決比較好了,但是對于機(jī)器學(xué)習(xí)來說,好象沒有那么簡單,反而是比較復(fù)雜的問題。第五能夠?qū)崿F(xiàn)任務(wù)、本體狀態(tài)、環(huán)境信息并行輸入的網(wǎng)絡(luò)結(jié)構(gòu)應(yīng)該是未來把機(jī)器學(xué)習(xí)用在無人駕駛上的一個(gè)研究重點(diǎn)。第六現(xiàn)有的計(jì)算能力仍不足以支持神經(jīng)網(wǎng)絡(luò)在無人車中的大規(guī)模應(yīng)用。我的匯報(bào)就到這里,謝謝大家。
評論