機(jī)器學(xué)習(xí)在無(wú)人駕駛中的現(xiàn)狀及挑戰(zhàn)
1月10日,在青島舉行的2019國(guó)家智能產(chǎn)業(yè)峰會(huì)智能駕駛平行論壇上,孫振平研究員結(jié)合國(guó)內(nèi)外機(jī)器學(xué)習(xí)相關(guān)技術(shù)在智能駕駛領(lǐng)域的研究現(xiàn)狀和課題組近年來(lái)的一些研究成果,向與會(huì)人員分享了題為《機(jī)器學(xué)習(xí)在無(wú)人駕駛中的應(yīng)用現(xiàn)狀及面臨挑戰(zhàn)》的精彩報(bào)告。
本文引用地址:http://cafeforensic.com/article/201901/396877.htm
國(guó)防科技大學(xué)智能科學(xué)學(xué)院無(wú)人系統(tǒng)研究所副所長(zhǎng)孫振平
談到國(guó)內(nèi)自動(dòng)駕駛研究的起源,總繞不開(kāi)一所有名的高校——國(guó)防科技大學(xué)。20世紀(jì)80年代末,國(guó)防科技大學(xué)先后研制出基于視覺(jué)的CITAVT系列智能車輛。1992年,國(guó)防科技大學(xué)成功研制出中國(guó)第一輛真正意義上的無(wú)人駕駛汽車。2011年7月,由一汽集團(tuán)與國(guó)防科技大學(xué)共同研制的紅旗HQ3無(wú)人駕駛汽車完成了286km的面向高速公路的全程無(wú)人駕駛試驗(yàn),而在背后主持研究紅旗無(wú)人駕駛汽車實(shí)現(xiàn)高速長(zhǎng)距離無(wú)人駕駛的,便是國(guó)防科技大學(xué)智能科學(xué)學(xué)院無(wú)人系統(tǒng)研究所副所長(zhǎng)孫振平研究員。2012年,孫振平研究員作為技術(shù)負(fù)責(zé)人,組織團(tuán)隊(duì)研制了我國(guó)第一臺(tái)邊防無(wú)人巡邏車。同時(shí),他作為主要技術(shù)骨干或負(fù)責(zé)人與團(tuán)隊(duì)一起參加了十余次國(guó)家自然科學(xué)基金委委主辦“中國(guó)智能車未來(lái)挑戰(zhàn)賽”和軍隊(duì)“跨越險(xiǎn)阻”無(wú)人系統(tǒng)挑戰(zhàn)賽,多次獲得冠軍。
1月10日在青島舉行的2019國(guó)家智能產(chǎn)業(yè)峰會(huì)智能駕駛平行論壇上,孫振平研究員結(jié)合國(guó)內(nèi)外機(jī)器學(xué)習(xí)相關(guān)技術(shù)在智能駕駛領(lǐng)域的研究現(xiàn)狀和課題組近年來(lái)的一些研究成果,向與會(huì)人員分享了題為《機(jī)器學(xué)習(xí)在無(wú)人駕駛中的應(yīng)用現(xiàn)狀及面臨挑戰(zhàn)》的精彩報(bào)告。
孫振平研究員在報(bào)告中表達(dá)了一下觀點(diǎn):
機(jī)器學(xué)習(xí)對(duì)解決無(wú)人駕駛問(wèn)題很重要,但不是全部;
深度神經(jīng)網(wǎng)絡(luò)是場(chǎng)景建模與理解的有力工具;
統(tǒng)計(jì)學(xué)習(xí)、增強(qiáng)學(xué)習(xí)對(duì)于解決行為決策問(wèn)題會(huì)有所幫助,前提是人工建立合適的決策模型;
用機(jī)器學(xué)習(xí)方法解決動(dòng)力學(xué)控制問(wèn)題似乎并不簡(jiǎn)單;
能夠?qū)崿F(xiàn)任務(wù)、本體狀態(tài)、環(huán)境信息并行輸入的網(wǎng)絡(luò)結(jié)構(gòu)是研究的重點(diǎn);
現(xiàn)有計(jì)算能力仍不足以支持深度神經(jīng)網(wǎng)絡(luò)在無(wú)人車中的大規(guī)模應(yīng)用
以下是孫振平研究員在2019國(guó)家智能產(chǎn)業(yè)峰會(huì)的報(bào)告,智車科技在不改變?cè)獾幕A(chǔ)上進(jìn)行了修改:
大家好,非常榮幸能在這兒跟大家一塊聊無(wú)人駕駛,因?yàn)闄C(jī)器學(xué)習(xí)在無(wú)人駕駛應(yīng)用方面比較熱,針對(duì)這個(gè)事情跟大家分享一點(diǎn)思考。
大家可能不知道,國(guó)防科大在無(wú)人駕駛方面應(yīng)該說(shuō)做的歷史也比較長(zhǎng)了,這些年有一些成績(jī)也有很多不足,特別是最近幾年我們看到整個(gè)社會(huì)對(duì)無(wú)人駕駛特別追捧,我們參與其中,肯定是非常非常的高興,但是在熱的過(guò)程中,我們也得認(rèn)真地去思考,是不是無(wú)人駕駛到現(xiàn)在已經(jīng)比較好的被解決了,這個(gè)我們還是要冷靜地去思考的。我個(gè)人就針對(duì)這方面的一些情況跟大家一塊兒分享一下。主要就是目前國(guó)內(nèi)外的發(fā)展情況,以及我們自己在這方面做的一些工作。
丨無(wú)人車的控制結(jié)構(gòu)
說(shuō)到無(wú)人駕駛,從概念上來(lái),大家對(duì)這個(gè)事情應(yīng)該都非常清楚了,無(wú)非就是給車裝上各種各樣的傳感器,讓它能夠自己理解周圍的環(huán)境,自己做規(guī)劃,自己選擇運(yùn)動(dòng)的路徑,直到控制自己的運(yùn)動(dòng)。在這個(gè)過(guò)程中,希望人不參與或者說(shuō)盡可能少的參與,這么多的傳感器到底怎么組成無(wú)人駕駛的系統(tǒng)?這個(gè)事如果拿人來(lái)類比的話,比較容易理解。一個(gè)駕駛員開(kāi)車感知周圍的環(huán)境,往往是通過(guò)我們的眼睛、耳朵等一些感覺(jué)器官。在感知的基礎(chǔ)上當(dāng)然要做決策規(guī)劃,主要是大腦來(lái)完成的,決策規(guī)劃的結(jié)果就是怎么樣控制車,操作機(jī)構(gòu)來(lái)實(shí)現(xiàn)對(duì)車輛的控制。
對(duì)于我們的無(wú)人駕駛系統(tǒng)來(lái)說(shuō),很顯然從原理上也是一樣的,我們必須去構(gòu)建它的眼睛。這個(gè)主要兩大類,一類是環(huán)境感知的傳感器,二是運(yùn)動(dòng)感知的傳感器。其中大腦是什么?對(duì)于無(wú)人駕駛來(lái)說(shuō),當(dāng)然就是運(yùn)行在計(jì)算機(jī)上人工智能的程序,這個(gè)程序它綜合了傳感器信息和用戶的任務(wù)輸入,最后產(chǎn)生控制命令,控制命令就控制相應(yīng)的一些執(zhí)行機(jī)構(gòu)來(lái)控制整個(gè)車的運(yùn)動(dòng),這個(gè)我想從原理上來(lái)說(shuō)就是這樣的。
無(wú)人駕駛的技術(shù)真正困難就是人工智能的程序。我們?cè)趺慈ピO(shè)計(jì)它,說(shuō)到設(shè)計(jì),實(shí)際上在人工智能應(yīng)用在移動(dòng)信息研究中,有一些基本的方案,大家不妨一起簡(jiǎn)單地回顧一下。
在人工智能研究中,有幾種基本的控制結(jié)構(gòu),一是慎思形式的,什么意思?我們要去顯示做決策規(guī)劃和執(zhí)行控制這樣的環(huán)節(jié),對(duì)應(yīng)的是一個(gè)一個(gè)程序模塊。當(dāng)然要設(shè)計(jì)一個(gè)這樣的結(jié)構(gòu),或者設(shè)計(jì)這樣的軟件系統(tǒng),需要很多人參與,需要人的智力的投入,這個(gè)很顯然我們覺(jué)得做起來(lái)非常麻煩。
另外一個(gè)比較直接的想法,當(dāng)然就是所謂的反應(yīng)式,我們最好能夠設(shè)計(jì)一個(gè)簡(jiǎn)單的程序,不需要知道它內(nèi)部是怎么工作的,能夠直接從傳感器到執(zhí)行器的映射,這就是所謂的反應(yīng)式。
當(dāng)然實(shí)際在研究過(guò)程中,最后大家都發(fā)現(xiàn)不管是慎思式還是反應(yīng)式做來(lái)做去都不能夠很好的解決問(wèn)題,怎么辦?人類最大的本事就是把各式各樣的方法混在一起就是混合式,反應(yīng)式大家很容易理解,如果有一個(gè)控制方向我們用一個(gè)狀態(tài)方程組就能夠很好地描述它,當(dāng)我設(shè)計(jì)一個(gè)簡(jiǎn)單的控制器就能夠?qū)崿F(xiàn)對(duì)這樣對(duì)象的控制。對(duì)于我們說(shuō)的機(jī)器人和無(wú)人車也不例外,我們能夠很好地描述清楚,就可以設(shè)計(jì)出一個(gè)簡(jiǎn)單的控制器出來(lái)。最早在1948年的時(shí)候,當(dāng)時(shí)控制論剛剛產(chǎn)生,就有人設(shè)計(jì)了一個(gè)移動(dòng)的機(jī)器人系統(tǒng)。這個(gè)慎思式,實(shí)際上大家關(guān)注的最典型的可能是世界上第一個(gè)自主的機(jī)器人,就采用這種慎思式的研究。SHakey研究了一個(gè)機(jī)器人只要能夠不碰撞運(yùn)動(dòng)就可以了,這是1968年做出來(lái)的,這個(gè)也是我們現(xiàn)在智能機(jī)器人(無(wú)人車)研究真正的現(xiàn)代意義上的開(kāi)端。
在這些研究基礎(chǔ)上,到了1986年的時(shí)候,MIT提出了一種所謂的包容式結(jié)構(gòu),這個(gè)包容式結(jié)構(gòu),大家仔細(xì)去分析一下就會(huì)發(fā)現(xiàn),它實(shí)際上是一種混合式的結(jié)構(gòu)。如果只是把行為定義為行走的話當(dāng)然很簡(jiǎn)單,我們就可以設(shè)計(jì)反應(yīng)式控制來(lái)實(shí)現(xiàn)。隨著反應(yīng)式變得越來(lái)越復(fù)雜,就很難用反應(yīng)式結(jié)構(gòu)去實(shí)現(xiàn)了。這個(gè)事情我個(gè)人在看了這么多文獻(xiàn)之后,大概同樣是在1980年代,美國(guó)的James他提出了所謂4D/RCS結(jié)構(gòu),已經(jīng)是非常完備的或者非常好的方法或者是一個(gè)體系了,甚至他們也給出了一套工程化的方法,怎么設(shè)計(jì)一個(gè)復(fù)雜的機(jī)器人系統(tǒng)或者是無(wú)人車,我們自己也是基本上參照4D/RCS這樣復(fù)雜系統(tǒng)的控制結(jié)構(gòu)來(lái)設(shè)計(jì)我們的無(wú)人車的。
這是我們的無(wú)人車采取的一種結(jié)構(gòu),下面最基本的就是底層的執(zhí)行結(jié)構(gòu)以及到上面的交通,對(duì)交通場(chǎng)景的認(rèn)知、決策等等。只有知道了結(jié)構(gòu),我們反過(guò)來(lái)才能說(shuō)機(jī)器學(xué)習(xí)在無(wú)人車中怎么用,我們剛才說(shuō)了,對(duì)于無(wú)人車來(lái)說(shuō),它的核心就是人工智能程序,機(jī)器學(xué)習(xí)又是人工智能里面的一個(gè)重要的內(nèi)容,大家當(dāng)然就想著,是不是能夠把機(jī)器學(xué)習(xí)用在無(wú)人車上,讓無(wú)人車能夠變得越來(lái)越聰明,能夠越來(lái)越好的去適應(yīng)環(huán)境,我們就一起來(lái)看一看機(jī)器學(xué)習(xí)在無(wú)人車上到底能怎么用。
評(píng)論