目前的人工智能缺失了一個(gè)關(guān)鍵環(huán)節(jié)
2012年,谷歌神秘機(jī)構(gòu)X實(shí)驗(yàn)室里的一項(xiàng)令人驚奇的項(xiàng)目被世界所知曉。這些擁有三百萬(wàn)個(gè)神經(jīng)元的模擬神經(jīng)網(wǎng)絡(luò)在沒(méi)有人工幫助的情況下,只依靠從YouTube里獲得的圖片就識(shí)別出了圖片中的貓和人物。
本文引用地址:http://cafeforensic.com/article/201602/287266.htm項(xiàng)目的成員組建了一個(gè)新的研究小組,這就是公司搜索部門(mén)下面的“谷歌大腦”( Google Brain)。他們和其他的研究者一起很快向世界證明了一個(gè)擁有幾十年歷史的發(fā)明——人工神經(jīng)網(wǎng)絡(luò)將圖像識(shí)別和語(yǔ)音識(shí)別的精確度提升到了一個(gè)前所未有的新高度。深度學(xué)習(xí)的成功促使谷歌和其他公司開(kāi)始大舉投資人工智能,甚至使一些專(zhuān)家開(kāi)始宣稱(chēng)“我們應(yīng)該為出現(xiàn)比人類(lèi)更加聰明的軟件做好準(zhǔn)備。”
然而,谷歌這個(gè)“貓檢測(cè)器”在某種程度上是一條死胡同。近期深度學(xué)習(xí)的成功是建立在那些需要人工幫助其學(xué)習(xí)的軟件之上的,這極大限制了人工智能的上升空間。
谷歌的實(shí)驗(yàn)使用了一種非監(jiān)督式學(xué)習(xí)的方法,軟件被輸入未經(jīng)加工的原始數(shù)據(jù),然后必須在沒(méi)有人工幫助的情況下計(jì)算出結(jié)果。盡管它可以學(xué)會(huì)識(shí)別貓、人臉和其他物體,但它的精確度還沒(méi)有達(dá)到可以使用的水平。深度學(xué)習(xí)研究和基于此的產(chǎn)品開(kāi)發(fā)的爆發(fā)都是基于監(jiān)督式學(xué)習(xí),數(shù)據(jù)需要人工打好標(biāo)簽之后再提供給軟件——例如,我們要給圖片中的各個(gè)物體都標(biāo)上名稱(chēng)。
事實(shí)證明,這對(duì)于解決一些問(wèn)題非常有效,比如說(shuō)識(shí)別圖片中的物體、過(guò)濾垃圾郵件,甚至是為用戶回復(fù)短信提供建議(這是谷歌去年上線的一項(xiàng)功能)。但如果需要軟件更好地去理解世界,那可能就需要非監(jiān)督式學(xué)習(xí)了,Jeff Dean如是說(shuō),他現(xiàn)在領(lǐng)導(dǎo)著谷歌大腦項(xiàng)目,也曾經(jīng)在Google X 的“貓檢測(cè)器”項(xiàng)目中工作過(guò)。
“我非常確信我們需要它,”Dean 說(shuō),“當(dāng)你有正確的數(shù)據(jù)集時(shí),監(jiān)督式學(xué)習(xí)會(huì)表現(xiàn)得很好,但終極的非監(jiān)督式學(xué)習(xí)會(huì)成為構(gòu)建真正的智能系統(tǒng)中重要的一環(huán)——如果你觀察人類(lèi)的學(xué)習(xí)方式,你就會(huì)發(fā)現(xiàn)全部都是非監(jiān)督式的。”
一個(gè)絕好的例子就是,嬰兒的學(xué)習(xí)方式為成年時(shí)期的智能打下了基礎(chǔ)。比如說(shuō)我們知道,當(dāng)一個(gè)物體移到視線之外時(shí)依然存在,或者沒(méi)有支撐就會(huì)掉到地上,這些事情是我們通過(guò)觀察世界而學(xué)習(xí)到的,并不需要明確的指引。和動(dòng)物一樣,如果機(jī)器人想要探索真實(shí)世界,那它們就需要這種常識(shí)。這也能鞏固更加抽象的任務(wù),例如對(duì)語(yǔ)言的理解。
Facebook人工智能研究組主管Yann LeCun說(shuō),如果人工智能要滿足人們更大的野心,就必須弄清楚軟件如何才能完成那些對(duì)人類(lèi)嬰兒來(lái)說(shuō)十分容易的事情。他說(shuō):“我們都知道,最終的答案就是非監(jiān)督式學(xué)習(xí)。解決了非監(jiān)督式學(xué)習(xí)的問(wèn)題,將把我們帶向更高的級(jí)別。”
盡管他們還沒(méi)有得到最終的答案,但Facebook、Google等公司以及學(xué)術(shù)界的研究者正在對(duì)某些有限的非監(jiān)督式學(xué)習(xí)進(jìn)行實(shí)驗(yàn)。
其中一個(gè)研究分支的目的是創(chuàng)造出一個(gè)人工神經(jīng)網(wǎng)絡(luò),讓它消化吸收視頻和圖像,并用它們獲得的關(guān)于世界的知識(shí)產(chǎn)生出新的圖像——這意味著它們已經(jīng)形成了關(guān)于世界是如何運(yùn)行的內(nèi)部表征。對(duì)世界作出精準(zhǔn)的預(yù)測(cè)是人類(lèi)智能中一個(gè)非常重要的基本特征。
Facebook的研究者建造了一個(gè)稱(chēng)為 EyeScream的軟件。這個(gè)軟件可以根據(jù)提示(例如“教堂”或“飛機(jī)”)生成可識(shí)別的圖像。他們也在研究對(duì)視頻做出預(yù)測(cè)的軟件。Google旗下DeepMind的研究者已經(jīng)開(kāi)發(fā)了一種軟件,給它一些部分遮掩的圖片,它能用十分真實(shí)的圖像來(lái)進(jìn)行填補(bǔ)。
DeepMind還在研究一種完全的非監(jiān)督式學(xué)習(xí),叫做強(qiáng)化學(xué)習(xí)(reinforcement learning)。在強(qiáng)化學(xué)習(xí)中,軟件被訓(xùn)練來(lái)接收關(guān)于自我表現(xiàn)的自動(dòng)反饋——比如說(shuō),這些反饋會(huì)來(lái)自電腦游戲的得分系統(tǒng)。還有一些不使用深度學(xué)習(xí)的研究者則證明,軟件可以從單個(gè)例子中學(xué)會(huì)識(shí)別手寫(xiě)字體(見(jiàn)《人工智能終于能像人類(lèi)一樣學(xué)習(xí)》)。
但是迄今為止,這些嘗試都尚未揭示出一條能讓非監(jiān)督式學(xué)習(xí)達(dá)到人類(lèi)水平的路徑,或者說(shuō),軟件尚不能僅通過(guò)經(jīng)歷或?qū)嶒?yàn)就學(xué)會(huì)與真實(shí)世界有關(guān)的復(fù)雜東西。百度硅谷AI實(shí)驗(yàn)室主任Adam Coates說(shuō):“目前,我們似乎缺失了某個(gè)關(guān)鍵的思想。”
Coates說(shuō),隨著搜尋的繼續(xù),監(jiān)督式學(xué)習(xí)依然還能帶給我們很多東西:互聯(lián)網(wǎng)公司可以獲得大量數(shù)據(jù),包括人們做了什么事和關(guān)心什么事,可以用這些原料來(lái)建造比今天的產(chǎn)品更加有用的語(yǔ)音交互和個(gè)人助理等產(chǎn)品。他說(shuō):“在不遠(yuǎn)的未來(lái),你還可以用標(biāo)記數(shù)據(jù)來(lái)做很多事。”大公司在這方面花了許多金錢(qián),讓合約商為他們的機(jī)器學(xué)習(xí)系統(tǒng)標(biāo)記數(shù)據(jù)。
Facebook的LeCun相信,研究者不會(huì)永遠(yuǎn)依靠標(biāo)記數(shù)據(jù)。但是,他拒絕評(píng)價(jià)軟件還需要多久才能到達(dá)人類(lèi)智能的水平。他說(shuō):“我們知道原材料,但卻不知道菜譜。這可能還需要花費(fèi)一些時(shí)間。”
評(píng)論