AlphaGo增強版學會國際象棋和將棋 不到一天超越人類水平
12月7日據(jù)國外媒體報道,谷歌旗下人工智能公司DeepMind一直都熱衷于在棋盤上擊敗所有人類對手。雖然大部分時間關于人工智能技術的討論都是在無人駕駛汽車等領域,但是作為一種屬于未來的新技術,其實人工智能可以應對各種各樣的挑戰(zhàn)。雖然距離最終的目標還有很長的一段路,但是根據(jù)DeepMind公布的一項最新研究成果來看,人工智能至少已經(jīng)走在了正確的道路上。
本文引用地址:http://cafeforensic.com/article/201712/372727.htm在一篇最新論文中我們看到了DeepMind開發(fā)的人工智能技術是如何在圍棋以外的領域繼續(xù)不斷超越人類。這次的新技術AlphaZero在學習8個小時之后就成功的擊敗了之前“碾壓”人類冠軍的前任AlphaGo。同時又只用4個小時的訓練就能擊敗頂級的國際象棋引擎Stockfish。最后,又經(jīng)過2個小時的訓練后擊敗了日本傳統(tǒng)棋類項目將棋的Elmo引擎,三種棋類都已經(jīng)超越了國際頂級水準。
這項技術的關鍵是名為AlphaZero的新一代人工智能程序,算是之前AlphaGo的增強版。其實這項技術并非是專門針對下棋設計,雖然它能夠遵守基本的棋類規(guī)則,但是并沒有專門的策略和戰(zhàn)術代碼。這項技術通過名為“強化學習”的訓練方法,能夠通過不斷重復訓練快速掌握規(guī)則。
其實這種強化式學習方式本身并不新鮮。DeepMind工程師之前使用了同樣的方法在今年10月創(chuàng)建了AlphaGo Zero。但是這次新的AlphaZero要比之前更具有通用性,因此能夠在沒有事先準備的情況下應用于更廣泛的用途。
值得注意的是,在不到24小時的時間里,同一個計算機程序能夠通過自我學習的方式實現(xiàn)在三種不同棋類項目同時達到“超越人類”的水平,這是人工智能領域所取得的新成就。
現(xiàn)在DeepMind距離公司夢寐以求的通用思維機器目標又近了一步,不過依然面對著非常大的挑戰(zhàn)。今年年初,DeepMind首席執(zhí)行官Demis Hassabis在展示最新成果時表示,雖然該技術未來可能對解決一系列科學問題有所幫助,比如創(chuàng)新設計和藥品研發(fā),但是這些用途與棋類游戲相比有本質(zhì)的區(qū)別。團隊需要大量的工作來找出如何解決這些問題的方式。
評論