最好的人工智能仍敵不過中二少年
2012年,IBM的Watson獲得了克利夫蘭診所勒納大學(xué)醫(yī)學(xué)院的錄取通知書,作為一名醫(yī)生院學(xué)生開始了求學(xué)之旅。Watson是IBM的人工智能,而它進(jìn)入醫(yī)學(xué)院是在讓醫(yī)生們訓(xùn)練它,用于醫(yī)學(xué)研究。
本文引用地址:http://cafeforensic.com/article/201602/287126.htm三年后,你可能想當(dāng)然地認(rèn)為,或許Watson至少在對醫(yī)學(xué)的理解上有一些進(jìn)步了。但從它的同類來看,人工智能的表現(xiàn)很不如人意,甚至不能通過美國八年級的科學(xué)測試,更不要說符合醫(yī)學(xué)院的錄取標(biāo)準(zhǔn)了。或許Watson當(dāng)初是走后門進(jìn)去的吧。
華盛頓大學(xué)的計算機(jī)科學(xué)教授OrenEtzioni和艾倫人工智能研究所最近舉行了一場比賽,邀請800個人工智能團(tuán)隊讓其AI系統(tǒng)參加八年級(相當(dāng)于國內(nèi)的初二)科學(xué)測試。如今結(jié)果出來了:表現(xiàn)最好的也只答對了60%的問題。換句話說:在座的各人工智能都是……不如中二少年。
對Etzioni來說,這場長達(dá)五個月的測試說明了人工智能的發(fā)展現(xiàn)狀。得益于深度神經(jīng)網(wǎng)絡(luò)(模擬人腦神經(jīng)元網(wǎng)絡(luò)的軟硬件網(wǎng)絡(luò))的興趣,Google和Facebook還有微軟等公司的系統(tǒng)在圖像語音識別等領(lǐng)域,達(dá)到了人類高度的表現(xiàn)水平。但要讓機(jī)器學(xué)會思考,還是一件不太可能的事,他們甚至不能進(jìn)行對話,也不能通過基本的科學(xué)測試。
Watson們?nèi)ツ膬?
遙想2011年,Watson在問答節(jié)目Jeopardy!上擊敗了最優(yōu)秀的人類選手;就在前不久,Google的人工智能還在圍棋上戰(zhàn)勝了人類職業(yè)選手。但對機(jī)器來說,這些都沒科學(xué)測試難。
研究所的科學(xué)測試不僅包括知識問答,它還會要求機(jī)器理解基本的概念,回答進(jìn)化適應(yīng)這類復(fù)雜的問題。其中一個多項選擇問題是:
一些魚類成熟后的多數(shù)時間都生活在鹽水中,但會在淡水中產(chǎn)蛋。它們適應(yīng)不同環(huán)境的能力是什么的最佳例證?
這些多項選擇機(jī)器還是應(yīng)付不過來,就算是用神經(jīng)網(wǎng)絡(luò)也不行。Etzioni表示,自然語言處理,推理,理解科學(xué)書籍上的概念,這些都是更為復(fù)雜的挑戰(zhàn),需要很多推理。
雖然多數(shù)參賽的人工智能都屬于學(xué)術(shù)機(jī)構(gòu)和獨立研究員,但Etzioni認(rèn)為科技巨頭的表現(xiàn)也不會好到哪里去?!癎oogle那樣公司的得分很可能高些,但‘集體的智慧’說明了一切,而且參賽的還有一些很聰明的人?!?/p>
親愛的Watson呢?Etzioni說IBM拒絕參加比賽,因為對這類比賽沒什么興趣,更關(guān)注解決現(xiàn)實世界中的問題。不過Watson也不是最好的測試對象了,它以前可能主要關(guān)注問答比賽,但現(xiàn)在已經(jīng)是一系列人工智能工具的集合了,也不能代表普遍的水平。
Etzioni測試是對自然語言處理的測試,能用來了解機(jī)器能在多大程度上理解人類語言。IBM的服務(wù)包括自然語言處理,但自Watson誕生以來,這類技術(shù)逐漸更多受到了深度神經(jīng)網(wǎng)絡(luò)的影響。正如你能用大量喵星人圖片訓(xùn)練神經(jīng)網(wǎng)絡(luò)識別貓一樣,你也能用對話教它理解自然語言。Google甚至還用這種方式開發(fā)了一個聊天機(jī)器人,能與你探討人生的意義。
但聊天機(jī)器人并不能讓人信服,而且人工智能的現(xiàn)狀不取決于單一的技術(shù)。在沒有通用方法前,我們需要多種機(jī)器學(xué)習(xí)和人工智能工具。就像在Etzioni的測試中,很多參賽者也用了多種工具,但結(jié)果仍舊不理想。
不過也有人認(rèn)為讓機(jī)器通過科學(xué)測試沒多大意義,我們關(guān)注的應(yīng)該更深遠(yuǎn)。完全多項選擇題并不是人工智能的目標(biāo)。既然還無法戰(zhàn)勝中二少年,人工智能們還需努力。
評論