百度人工智能機器人小度戰(zhàn)勝最強大腦 真要取代人類?
1 月 20 日,第四季的最強大腦落下帷幕,這季比賽由于選手當中新增加了一位特殊成員被備受關注,來自百度的人工智能機器人小度在一場三局「人機大戰(zhàn)」中取得兩勝一平的成績,這個結果徹底碾壓了三位代表人腦極限的人類選手。這三場比賽中的每個細節(jié)都成為社交媒體上熱議的焦點,這些爭議一方面是公眾驚嘆于人工智能如此強大,或將取代人類;另一方面也夾雜了太多陰謀論的想象,強調此次人機大戰(zhàn)的不公平性。
本文引用地址:http://cafeforensic.com/article/201701/343356.htm如果說前一種緣由源自于于技術,特別是對人工智能發(fā)展的無知;那么后一種聲音則不僅是對人工智能的無知,也是對人類自身存在和未來的無知,可謂愚蠢至極。
棋盤和人類大腦都是人工智能的標尺
事實上,盡管 2016 年人工智能領域如此火熱,但從 2016 年 1 月到現在整整一年的時間,人工智能領域的震撼性事件只有三個:
· 2016 年 1 月 24 日,人工智能先驅馬文明斯基離世;
· 2016 年 1 月 27 日,Google DeepMind 在《自然》雜志發(fā)表論文,正式宣布破解了圍棋;
· 2017 年 1 月 20 日,百度人工智能機器人小度擊敗第三位人類選手,在三局人機大戰(zhàn)中完勝;
之所以將上述三件時間、空間都沒有關系的事件擺在一起,根本原因在于,這三個事件既是結束,也開啟了一個屬于人工智能的新時代。從 60 多年前開始,不管是明斯基還是另外幾位人工智能的先驅,擺在這些最頂尖科學家、數學家面前的首要問題就是:如何衡量人工智能?
1920年代,美國心理學家 Louis Lean Thurstone 在研究中發(fā)現,受訪者在回答問題時更傾向于回答一些相對意義或者比較意義的問題,比如類似這樣的問題「你更喜歡誰的畫,A 還是B?」就比單純回答「你對A 畫喜歡多少?」要容易簡單的多。這套理論被稱為「比較性判斷準則(Law of Comparative Judgement)」。通過讓人們每次比較多個對象中的兩個,而最終可以計算出每個對象的測量分數(定距尺度)。
其運用范圍非常廣泛,人工智能研究者終于不再為定義「智能」來擔憂了,只需要將機器與人類放在某個同樣環(huán)境下繼續(xù)比賽,利用人的智能來衡量機器的智能。棋類游戲首先被用于測試機器的智能,是因為棋類游戲是一種「完美」信息的游戲,對玩家們而言,無論人類還是機器,所面對的信息是透明且對等的——就是棋盤和棋子而已。
這樣的曖昧情節(jié)始于1956年,IBM 工程師 Arthur Samuel 創(chuàng)造了一種西洋跳棋的應用程序,并使用強化學習來訓練這個程序。1962年的時候,Arthur Samuel 的這個西洋跳棋程序打敗了當時全美最強的業(yè)余選手 Robert Nealey。
接下來的最吸引人的兩個故事就是卡斯帕羅夫與深藍的世紀之戰(zhàn)以及李世石大戰(zhàn) AlphaGo,借助于電視、互聯網、社交媒體等大眾傳媒的發(fā)展,全世界的人都看到了東西方兩大棋類里的頂級人物低頭認輸的場景。
人工智能已經在國際象棋、圍棋證明了自己的能力,而挑戰(zhàn)人類的最強大腦則成了衡量人工智能的另一個標尺。
此次最強大腦比賽,三場比賽涵蓋了人臉識別、語音識別與視頻(動態(tài)模糊圖像)識別等多個領域。這些「技能」是人類長期進化過程所形成的,百度首席科學家吳恩達這樣解釋人類的人臉識別能力:“一個3歲的孩子看見媽媽時,不管媽媽是微笑、生氣,睜著眼、閉著眼,長頭發(fā)、短頭發(fā),穿什么衣服,孩子都可以輕易認出這是媽媽。”
更重要的是,人類的這種識別幾乎是瞬間完成的,即便到現在,全世界頂尖的科學家也無法理解這背后的真正原理。而要讓計算機擁有這種能力,科學家們在過去五十年里提出了諸多想法,但直到這幾年,圖像識別才真正實現了技術突破。
與圖像識別相似,語音、動態(tài)圖像識別的技術發(fā)展進程也經歷了漫長過程,這些依托新算法的人工智能技術,究竟離人類大腦,特別是那些具備超強能力的人類大腦還有多大差距,這次比賽提供了一個最好的觀察視角,而比賽結果也充分說明了人工智能在某些領域的已然超越人類。
當下人工智能只聚焦在特定領域
早幾年的時候,李彥宏在參加《最強大腦》節(jié)目擔任嘉賓后感言:“某些對于人類艱難的事情,對于電腦來說非常簡單。”這話說得并不夸張,比如圍棋這個領域,相比于人類棋手的成長速度,計算機的進化速度“令人窒息”,2016 年年底橫掃中韓高手的 Master,也是AlphaGo 的進化版,要 Alpha Go 真正「進入職業(yè)棋屆」不過一年多一點的時間,這種學習和進化速度是人類根本無法匹及的。
當下人工智能領域的火熱得益于過去幾年深度學習的崛起。最主要聚焦在三個領域:圖像識別、語音識別以及自然語言處理。投資人David Kelnar提供了兩幅圖像識別和語音識別進化速度對比圖:
以圖像識別為例,在 2012 年的圖片分類競賽ImageNet 上,以深度神經網絡為技術支撐的研究團隊奪得第一,并將錯誤率降低到 20% 以下,讓包括 Google 、Facebook 這樣的巨頭都震驚,隨后,Google 買下了這個團隊,也讓深度神經網絡「教父」Geoff Hinton 進入 Google 工作。在深度神經網絡的幫助下,Google 的圖像識別水平有了大幅提升,并將錯誤率降低到 10 %以內。
評論