王馥芳:面向機器人的大規(guī)模知識引擎
近年來,隨著計算機和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,諸多大規(guī)模知識引擎的創(chuàng)建在很大程度上改變了人類的知識共享和表征生態(tài)。受此啟發(fā),美國康奈爾大學(xué)和斯坦福大學(xué)的一些學(xué)者通過多模態(tài)大數(shù)據(jù)挖掘,創(chuàng)建了一種新的、主要面向機器人的、同時能供任何要執(zhí)行任務(wù)的設(shè)備自由訪問的大規(guī)模知識引擎:機器人大腦(RoboBrain)。
機器人大腦:面向機器人的大規(guī)模知識引擎
在面向人類的知識數(shù)據(jù)庫中,信息搜索是一件簡單的事情,我們只需在電腦或移動終端上輸入幾個字就可以得到答案,在很多情況下,模糊和缺省檢索也能解決問題。但是,對于機器人來說事情就沒有這么簡單。即便要完成最簡單的任務(wù),機器人都需要詳盡甚而完備的操作細節(jié)。基于面向人類的搜索引擎所得出的搜索結(jié)果,機器人難以讀懂。比如,要使機器人讀懂“如何烘焙蛋糕”的搜索結(jié)果,除了指出常規(guī)的烘焙過程和步驟之外,還需要提供各種各樣詳盡的相關(guān)附帶信息,如雞蛋可以打破;打破雞蛋流出的液體必須裝在器皿如杯子里;杯子只有在杯口朝上的情況下才可以盛裝液體;水來自水龍頭,能夠在壺或者微波爐里加熱,且能夠和蛋液混合等等。因此,要創(chuàng)建一個面向機器人的大規(guī)模知識引擎不是一件簡單的事情。
在人工智能產(chǎn)業(yè)發(fā)展前景被普遍看好的當(dāng)下,康奈爾大學(xué)和斯坦福大學(xué)聯(lián)合創(chuàng)建了一個面向機器人的大規(guī)模知識引擎——機器人大腦,并為此創(chuàng)建了一個網(wǎng)站。這主要是一個供機器人學(xué)習(xí)和共享知識表征并執(zhí)行多種任務(wù)的大規(guī)模知識引擎。
“機器人大腦”網(wǎng)站的首頁顯示,該知識引擎主要通過搜索互聯(lián)網(wǎng)及其他一些數(shù)據(jù)來源學(xué)習(xí)各種概念:“它能解釋自然語言文本,意象和錄像;能運用其傳感器來觀察人類;且能通過與它們互動的方式來學(xué)習(xí)事物?!眲?chuàng)建者相信,通過學(xué)習(xí)和共享大規(guī)模知識,不同的機器人能夠在各種新情境下更快速敏捷地完成各種任務(wù)?!皺C器人大腦”的創(chuàng)建改變了機器人的深度學(xué)習(xí)方式。傳統(tǒng)上,機器人學(xué)習(xí)的重心是規(guī)則學(xué)習(xí)。隨著大數(shù)據(jù)時代的到來,機器人開始從規(guī)則學(xué)習(xí)轉(zhuǎn)向多模態(tài)數(shù)據(jù)學(xué)習(xí)。
機器人大腦:使機器人深度學(xué)習(xí)成為可能
“機器人大腦”本質(zhì)上是一個大規(guī)模眾源(crowd-sourcing)大數(shù)據(jù)庫,它所存儲的知識來源多樣,包括機器人在完成各種任務(wù)(如感知、計劃和控制等)時所關(guān)涉的物理互動、萬維網(wǎng)知識基礎(chǔ)以及領(lǐng)先的機器人研究小組所創(chuàng)建的各種可學(xué)習(xí)性知識表征。
“機器人大腦”的創(chuàng)建在很大程度上改變了大數(shù)據(jù)挖掘過度依賴單一文本數(shù)據(jù)模態(tài)來源的現(xiàn)狀。受制于技術(shù)局限性,面向人類的大規(guī)模知識引擎的數(shù)據(jù)來源主要是萬維網(wǎng)中“結(jié)構(gòu)化”的文本模態(tài)數(shù)據(jù),而無法有效挖掘其他一些“非結(jié)構(gòu)化”的數(shù)據(jù)模態(tài)如符號、圖片、視頻、音頻等。“結(jié)構(gòu)化數(shù)據(jù)”主要指能被數(shù)據(jù)庫所理解的、可以被邏輯表征的數(shù)據(jù),而“非結(jié)構(gòu)化數(shù)據(jù)”主要指無法被邏輯表征的數(shù)據(jù),主要包括多種數(shù)據(jù)模態(tài):文本、圖片或圖像、觸感、XML、HTML、各類圖表或報表、音頻和視頻信息等等。
據(jù)資料統(tǒng)計,在大數(shù)據(jù)變革風(fēng)起云涌的今天,世界約80%的數(shù)據(jù)都是“非結(jié)構(gòu)化數(shù)據(jù)”。在云計算出現(xiàn)之前,傳統(tǒng)計算機無法處理這些巨量數(shù)據(jù)。借助于以云計算為基礎(chǔ)的信息挖掘、存儲、處理和展示技術(shù),我們可以在某種程度上有效地對其進行分析和計算。如此一來,“非結(jié)構(gòu)化數(shù)據(jù)”的價值得到極大凸顯。由于面向機器人的知識引擎在很大程度上是由“非結(jié)構(gòu)化數(shù)據(jù)”組成的,而其本質(zhì)上又是眾源數(shù)據(jù),因此,如何有效編碼多種不同的數(shù)據(jù)模態(tài)并構(gòu)建一個能與多種數(shù)據(jù)來源兼容的知識表征構(gòu)架是“機器人大腦”面臨的最大挑戰(zhàn)。為此,“機器人大腦”訴諸于圖表構(gòu)架以解決不同數(shù)據(jù)模態(tài)之間的沖突和不一致問題。
研究小組將“機器人大腦”知識表征構(gòu)架的創(chuàng)建看作是網(wǎng)絡(luò)理論問題。他們把知識表征為定向圖表,其中的節(jié)點以各種各樣的數(shù)據(jù)模態(tài)體現(xiàn),如圖像、文本、視頻、觸覺數(shù)據(jù)或者學(xué)術(shù)概念等?!皺C器人大腦”是一個“無止境學(xué)習(xí)”的知識引擎,它不間斷地實時獲取以邊集形式呈現(xiàn)的新信息,這些新信息通過和節(jié)點子集鏈接的方式得到表征。例如,“坐著的人可以使用杯子”這一常識概念可能會鏈接“杯子”、“坐著的人”和“能夠使用”等節(jié)點概念(即檢索的中心概念,以檢索與該概念直接相關(guān)的概念)。任何在“機器人大腦”中搜索節(jié)點概念的機器人,都可以通過下載相關(guān)邊集和它們所代表的節(jié)點概念來進行深度學(xué)習(xí)。
“機器人大腦”的核心是,不但讓機器人通過搜索大規(guī)模知識引擎自我深度學(xué)習(xí),而且意圖使其將一個情境中學(xué)到的知識應(yīng)用于其他新情境。例如,將“倒水到杯子里”的能力擴展到倒水到其他容器里,如倒洗澡水到澡盆里等?!皺C器人大腦”團隊對于未來有著宏大的計劃:讓該知識引擎納入更加多樣的知識來源,如在線視頻,并設(shè)想讓機器人通過查詢在線指引視頻學(xué)會如何做各種各樣的家務(wù)。
此外,“機器人大腦”著力于解決不同領(lǐng)域的研究挑戰(zhàn):機器學(xué)習(xí)、大規(guī)模資料處理、語言和對話、感知、人工智能和推理系統(tǒng)、體驗和機器人學(xué)以及自動化。該知識引擎的創(chuàng)建有助于三個重要研究領(lǐng)域的工作:基礎(chǔ)自然語言、感知和計劃。這三項工作是很多機器人完成任務(wù)的關(guān)鍵要素。
機器人大腦:將進一步拓展人工智能產(chǎn)業(yè)前景
“機器人大腦”的創(chuàng)立,標(biāo)志著人類在人工智能產(chǎn)業(yè)化的道路上又邁出了實質(zhì)性的一步。雖然其在目前初創(chuàng)階段,還面臨諸多技術(shù)難題和構(gòu)架創(chuàng)建挑戰(zhàn),但是,其在諸多方面的技術(shù)潛力無疑將進一步助推人工智能產(chǎn)業(yè)的發(fā)展。
其一,“機器人大腦”試圖對不同數(shù)據(jù)模態(tài)進行有效編碼和表征,此舉意在試圖實現(xiàn)“非結(jié)構(gòu)化數(shù)據(jù)”向“結(jié)構(gòu)化數(shù)據(jù)”的轉(zhuǎn)換,以使之能被機器人學(xué)習(xí)、理解,進而運用其完成各種任務(wù)。此舉不但極大地拓展了機器人學(xué)習(xí)的內(nèi)容、深度以及學(xué)習(xí)的復(fù)雜性,而且革新了機器人的學(xué)習(xí)方式。經(jīng)過多模態(tài)數(shù)據(jù)學(xué)習(xí)訓(xùn)練的機器人有望在智能化方面更加“類人化”,從而進一步加快人工智能產(chǎn)業(yè)化的發(fā)展步伐。
其二,“機器人大腦”試圖在一定程度上消除機器人和人類使用者在信息共享中的障礙,此舉有助于進一步增強人機互動的質(zhì)和量,并加快人工智能和人類智能的進一步融合。
其三,“機器人大腦”試圖把各種機器人任務(wù)公式化為各種問題,從而為各種人機交互任務(wù)的完成提供一個問題驅(qū)動的知識學(xué)習(xí)和任務(wù)訓(xùn)練數(shù)據(jù)庫。此舉有助于進一步提高機器人完成任務(wù)的概率,并可能催生出新的智能化產(chǎn)品。
其四,由于“機器人大腦”的數(shù)據(jù)來源多樣,因此,其團隊致力于構(gòu)建一種能和多種數(shù)據(jù)來源兼容的圖表表征構(gòu)架。這個目標(biāo)的最終達成將在很大程度上解決因多種信息源之間的沖突或不一致而導(dǎo)致的“數(shù)據(jù)不可讀”問題,并將極大地便利人工智能大數(shù)據(jù)的挖掘、生成、存儲、管理、查詢、提取、處理以及展示等,從而拓展其產(chǎn)業(yè)化前景。
在“人工智能”已發(fā)展成一個商業(yè)前景廣闊的產(chǎn)業(yè)的背景下,“機器人大腦”的創(chuàng)建無疑為其注入了一針強心劑。
評論