不止Alexa和AWS,揭秘亞馬遜人工智能發(fā)展史
《連線》雜志近日刊文,介紹了深度學(xué)習(xí)技術(shù)如何賦能Alexa和AWS,以及亞馬遜內(nèi)部的幾乎所有部門。
本文引用地址:http://cafeforensic.com/article/201802/375360.htm以下為騰訊科技編譯整理的文章概要:
2014年初,斯里坎斯·希魯梅拉(Srikanth Thirumalai)面見亞馬遜CEO杰夫·貝索斯(Jeff Bezos)。希魯梅拉是一名計算機科學(xué)家。他于2005年從IBM離職,成為亞馬遜商品推薦團(tuán)隊的負(fù)責(zé)人。這一次,他提出了一項全面的新計劃,將人工智能的最新成果應(yīng)用至自己的部門。
在會議上,希魯梅拉帶來了一份6頁紙的計劃書。很久以前,貝索斯就提出要求,即匯報給他的產(chǎn)品和服務(wù)計劃必須限制在這一長度范圍內(nèi),同時還要配上一份模擬的新聞稿,用于描述最終成果?,F(xiàn)在,貝索斯正在依靠自己的助手們,將公司轉(zhuǎn)型成人工智能發(fā)電站。在亞馬遜的發(fā)展早期,商品推薦功能就已集成人工智能技術(shù),發(fā)貨調(diào)度和倉庫機器人也是如此。然而近年來,這個領(lǐng)域正在掀起一場革命:機器學(xué)習(xí)正變得越來越高效,尤其是在所謂“深度學(xué)習(xí)”技術(shù)的推動下。計算機視覺、語音識別,以及自然語言處理等技術(shù)也都因此獲得了飛速的發(fā)展。
在這個10年的起步階段,亞馬遜并沒有大力投入這些技術(shù)。然而現(xiàn)在,亞馬遜意識到,需求非常迫切。這個時代最關(guān)鍵的競爭將發(fā)生在人工智能領(lǐng)域:谷歌、Facebook、蘋果和微軟都在押注此類技術(shù),而亞馬遜已經(jīng)落后。亞馬遜設(shè)備和服務(wù)副總裁大衛(wèi)·利普(David Limp)表示:“我們找到每個團(tuán)隊負(fù)責(zé)人,問他們,‘你要如何利用這些技術(shù),將這些技術(shù)嵌入自己的業(yè)務(wù)?’”
希魯梅拉牢牢記住了這點,并在年度計劃會議上找到貝索斯,向他提出了關(guān)于如何更積極地發(fā)展機器學(xué)習(xí)技術(shù)的設(shè)想。他認(rèn)為,亞馬遜的核心業(yè)務(wù)已發(fā)展20多年,而機器學(xué)習(xí)技術(shù)的最佳應(yīng)用場景是與亞馬遜核心業(yè)務(wù)不相關(guān)的圖像識別和語音識別,因此利用機器學(xué)習(xí)技術(shù)完全重新開發(fā)現(xiàn)有系統(tǒng)風(fēng)險太大。他表示:“從來沒有人真正將深度學(xué)習(xí)應(yīng)用于商品推薦,并帶來更好的結(jié)果。因此,我們自己需要有信心。”然而,貝索斯想要更多,而希魯梅拉實際上并沒有做好萬全的準(zhǔn)備。因此,他分享了一個更激進(jìn)的選擇,即利用深度學(xué)習(xí)技術(shù)去顛覆商品推薦的運轉(zhuǎn)方式。這需要用到他團(tuán)隊尚不具備的能力,尚未開發(fā)出的工具,以及從沒有人想過的算法。貝索斯很喜歡這個選擇,所以希魯梅拉重寫了一份模擬新聞稿,并著手去做。
過去幾年,大批亞馬遜管理者都曾攜帶6頁紙的計劃書去找貝索斯,希魯梅拉只是其中之一。他們提出的想法涉及到各式各樣的產(chǎn)品和完全不同的客戶。然而,他們每個人設(shè)想的都是希魯梅拉計劃的一個變種:用先進(jìn)的機器學(xué)習(xí)技術(shù)來改造亞馬遜的某個部分。其中部分涉及到對當(dāng)前項目的重新思考,例如機器人方面的工作及龐大的數(shù)據(jù)中心業(yè)務(wù)AWS。另一部分則是開發(fā)全新的業(yè)務(wù),例如基于語音的家電,這隨后發(fā)展成為Echo智能音箱。
最終結(jié)果的影響遠(yuǎn)遠(yuǎn)超出單個項目。希魯梅拉表示,在他面見貝索斯時,亞馬遜的人工智能人才還是相互孤立的。“我們會交流,但不會分享很多東西,因為我們彼此的經(jīng)驗不太容易直接轉(zhuǎn)移。”他認(rèn)為。在龐大的工程海洋里,這些是人工智能孤島。在用機器學(xué)習(xí)去改革公司之后,這樣的局面得到了改變。
盡管所有這些6頁紙計劃書都屬于亞馬遜的“單線程”團(tuán)隊,即某個特定團(tuán)隊是技術(shù)的“擁有者”,但亞馬遜的團(tuán)隊之間已展開跨項目的合作。內(nèi)部科學(xué)家嘗試解決難題,并與其他團(tuán)隊分享各自的解決方案。在整個公司里,人工智能孤島開始相互連接起來。隨著亞馬遜人工智能項目目標(biāo)的擴大,挑戰(zhàn)的復(fù)雜性也成為了吸引頂尖人才的磁石,尤其是對那些希望自己的工作立即發(fā)揮影響力的人才來說。這改變了以往亞馬遜對純學(xué)術(shù)研究的厭惡:亞馬遜的公司文化要求所有創(chuàng)新必須以服務(wù)客戶為中心。
亞馬遜喜歡使用“飛輪”一詞來描述,業(yè)務(wù)的不同部分如何運轉(zhuǎn),并形成統(tǒng)一的永動機?,F(xiàn)在,亞馬遜擁有強大的人工智能飛輪,來自某個團(tuán)隊的機器學(xué)習(xí)創(chuàng)新成為了賦能其他團(tuán)隊的利器,反過來這些團(tuán)隊開發(fā)產(chǎn)品、提供服務(wù),從而影響其他團(tuán)隊,甚至整個公司。以付費服務(wù)的形式將機器學(xué)習(xí)平臺提供給外界本身就是種能盈利的業(yè)務(wù)。在某些情況下,這還有助于收集更多數(shù)據(jù),進(jìn)一步提高技術(shù)水平。
在亞馬遜從深度學(xué)習(xí)門外漢發(fā)展成為行業(yè)重要力量的過程中,有許多這樣的6頁紙計劃書出現(xiàn)。轉(zhuǎn)型的成果在亞馬遜公司內(nèi)隨處可見,例如基于機器學(xué)習(xí)基礎(chǔ)架構(gòu)的推薦系統(tǒng)。目前亞馬遜正變得更聰明,能建議用戶下面應(yīng)該閱讀什么,應(yīng)該在購物清單上添加什么,以及今晚可以看什么電影。今年,希魯梅拉開展了一項新工作,即負(fù)責(zé)亞馬遜的搜索服務(wù)。他希望將深度學(xué)習(xí)技術(shù)應(yīng)用于搜索服務(wù)的方方面面。
華盛頓大學(xué)頂尖的計算機科學(xué)教授佩德羅·多明格斯(Pedro Domingos)直言:“如果在七八年前問我,亞馬遜在人工智能領(lǐng)域的影響力有多大,我可能會說,‘他們什么也不是’。但他們非常努力?,F(xiàn)在,他們已成為了這個領(lǐng)域的一股力量。”
或許,亞馬遜已經(jīng)是一股重要力量。
Alexa效應(yīng)
亞馬遜進(jìn)軍人工智能的旗艦產(chǎn)品是智能音箱Echo,以及基礎(chǔ)性的Alexa語音平臺。這些項目也來自于6頁紙計劃書。這樣的計劃于2011年通過名為“1號運營計劃”的年度規(guī)劃流程提交給貝索斯。其中的參與者之一是自2004年就開始就供職于亞馬遜的阿爾·林賽(Al Lindsay)。當(dāng)時,他被要求轉(zhuǎn)而負(fù)責(zé)Prime技術(shù)團(tuán)隊,從事全新的項目。他還記得當(dāng)時提出的概念:“一種低成本、無所不在的電腦,大腦位于云端,你可以用語音與之互動。你對它說話,它也對你說話。”
然而當(dāng)時,開發(fā)這樣的系統(tǒng)聽起來就像科幻小說,產(chǎn)品似乎就像《星際迷航》中的對話計算機。這需要強大的人工智能能力,而當(dāng)時亞馬遜還沒有掌握這樣的技術(shù)。更糟糕的是,有能力開發(fā)此類系統(tǒng)的專家人才很稀缺,愿意在亞馬遜工作的就更加鳳毛麟角。谷歌和Facebook正在爭奪這個領(lǐng)域的頂尖人才。林賽表示:“我們是弱者。”他現(xiàn)在已晉升為副總裁。
華盛頓大學(xué)教授多明格斯表示:“亞馬遜的形象有點不太好。在外界看來,該公司對以研究為導(dǎo)向的人才不夠友好。”亞馬遜完全專注于客戶,而企業(yè)文化也崇尚好斗精神,這與學(xué)術(shù)界和競爭對手的風(fēng)格完全不同。多明格斯表示:“谷歌會對你很寬容。而在亞馬遜,你需要自己從元件開始組裝電腦。”此外,亞馬遜還有更不好的形象:該公司的創(chuàng)新工作往往被視為企業(yè)機密。
2014年,頂尖的機器學(xué)習(xí)專家延恩·勒昆(Yann LeCun)在內(nèi)部會議上為亞馬遜的科學(xué)家們做了一次講座。在他被邀請參加此次活動以及活動舉行之間,勒昆接受了Facebook的職位邀請,但他還是來到了亞馬遜的活動現(xiàn)場。勒昆回憶,在一個大約可容納600人的禮堂里,他發(fā)表了演講。隨后他被領(lǐng)進(jìn)一間會議室,不同的小組一個接一個進(jìn)來,向他提問。然而當(dāng)勒昆向他們提問時,這些人的反應(yīng)都很遲鈍。這讓他感覺不好。他最終選擇Facebook的職位部分也是因為,F(xiàn)acebook同意將人工智能團(tuán)隊的很大一部分工作開源。
由于缺乏內(nèi)部人才,亞馬遜動用強大的財力去收購具有這方面專業(yè)性的公司。利普表示:“在Alexa的發(fā)展早期,我們收購了許多公司。”2011年9月,亞馬遜收購了語音轉(zhuǎn)文本技術(shù)公司Yap。該公司擅長于將語音轉(zhuǎn)換為文字。2012年,亞馬遜又將來自英國劍橋的Evi收入麾下。該公司的軟件可以像Siri一樣對語音命令做出響應(yīng)。2013年1月,亞馬遜再次收購一家語音轉(zhuǎn)文本技術(shù)公司,即來自波蘭的Ivona。該公司的技術(shù)可以讓Echo獲得交談能力。
然而,亞馬遜的保密文化仍然不利于頂尖人才的加盟。埃里克斯·斯莫拉(Alex Smola)曾是亞馬遜的招聘候選人之一。他是行業(yè)明星,曾供職于雅虎和谷歌。AWS深度學(xué)習(xí)和人工智能總經(jīng)理馬特·伍德(Matt Wood)表示:“他實際上是深度學(xué)習(xí)的教父之一。”(谷歌學(xué)術(shù)搜索上列出了9萬多篇引用斯莫拉成果的論文。)亞馬遜高管甚至不愿向候選人透露他們未來的工作內(nèi)容。斯莫拉拒絕了亞馬遜的邀請,選擇去帶領(lǐng)卡耐基梅隆大學(xué)的一所實驗室。
林賽說:“甚至是在我們即將啟動之前,還是有許多阻力。他們會說,‘為什么我要去亞馬遜工作?我對賣別人東西不感興趣。’”
亞馬遜也有自己的辦法。由于該公司從想象中的最終產(chǎn)品去反推,所以藍(lán)圖中包括許多尚未發(fā)明出來的功能。這些棘手的問題對雄心勃勃的科學(xué)家極具吸引力。語音功能需要一定水平的會話式人工智能,包括“喚醒詞”(嘿,Alexa!)、監(jiān)聽和解釋命令,給出合理的答案。這一切都不存在。
即使亞馬遜沒有給出任何細(xì)節(jié),這個項目也吸引了羅希特·普拉薩德(Rohit Prasad)。普拉薩德是一名受到廣泛認(rèn)可的語音識別科學(xué)家,來自波士頓的技術(shù)承包商雷神BBN。(亞馬遜也因此讓他在自己老家組建一支團(tuán)隊。)他認(rèn)為,亞馬遜相關(guān)專業(yè)能力的缺乏是系統(tǒng)性問題,而不僅僅是小缺陷。他指出:“這里是一片空白。谷歌和微軟開發(fā)語音技術(shù)已經(jīng)有幾年時間。在亞馬遜,我們從頭開始去開發(fā),去解決困難的問題。”在2013年加入之后,他就被分配至Alexa項目。他表示:“設(shè)備用硬件來實現(xiàn),但語音技術(shù)在很早就已經(jīng)起步。”
Echo項目中最棘手的部分在于遠(yuǎn)距離語音識別。為了解決這個問題,亞馬遜被迫涉足新領(lǐng)域,并推動了機器學(xué)習(xí)整體的發(fā)展。遠(yuǎn)距離語音識別是指在一定距離遠(yuǎn)處識別語音,這樣的語音命令可能被淹沒在環(huán)境噪聲中。挑戰(zhàn)之一是,設(shè)備不能浪費一丁點時間去思考你究竟說的是什么。它必須把音頻內(nèi)容即時發(fā)送至云端,并迅速獲得答案,給用戶的感覺就是實時對話,而不會出現(xiàn)令人尷尬的冷場。開發(fā)機器學(xué)習(xí)系統(tǒng),在嘈雜環(huán)境中理解并響應(yīng)用戶的語音命令,這需要大量數(shù)據(jù),即用戶與Echo互動的大量此類案例。當(dāng)時并不清楚,亞馬遜要從何處獲得這樣的數(shù)據(jù)。
作為亞馬遜設(shè)備和服務(wù)副總裁的利普表示,遠(yuǎn)距離技術(shù)此前已經(jīng)被實現(xiàn),但當(dāng)時是用在三叉戟潛艇的鼻錐上,研發(fā)耗資達(dá)到10億美元。亞馬遜希望將這種技術(shù)集成至一個可以放在廚房臺面上的設(shè)備中,而價格必須足夠便宜,從而吸引用戶的購買。普拉薩德表示:“在我的團(tuán)隊中,90%的人都認(rèn)為這根本做不到。在亞馬遜以外,我們也有技術(shù)咨詢委員會。我們沒有告訴他們具體要做什么。但他們總是對我們提起,‘不管做什么,都不要碰遠(yuǎn)距離識別技術(shù)。’”
然而,普拉薩德的經(jīng)歷給他帶來了信心。他認(rèn)為這是可實現(xiàn)的。然而,亞馬遜并不具備工業(yè)級系統(tǒng),將機器學(xué)習(xí)技術(shù)應(yīng)用于產(chǎn)品開發(fā)。“我們有少數(shù)科學(xué)家正在研究深度學(xué)習(xí),但我們?nèi)狈A(chǔ)設(shè)施將這些技術(shù)應(yīng)用于生產(chǎn)。”他說。好消息在于,亞馬遜已經(jīng)掌握了全部模塊:無與倫比的云計算服務(wù),可運行機器學(xué)習(xí)算法、安裝了大量GPU的數(shù)據(jù)中心,以及熟悉如何移動數(shù)據(jù)的工程師。
他的團(tuán)隊利用這些模塊開發(fā)了平臺,而除了用于Echo項目之外,這個平臺本身就是寶貴的資產(chǎn)。Alexa高級科學(xué)家斯派羅斯·馬特索卡斯(Spyros Matsoukas)表示:“當(dāng)我們在Echo上實現(xiàn)遠(yuǎn)距離語音識別之后,就發(fā)現(xiàn)這里的機會原來有這么大,我們可以將Alexa發(fā)展成為語音服務(wù)。”他此前曾在雷神BBN與普拉薩德共事,當(dāng)時的工作包括從事美國國防部高級研究計劃局(DARPA)的項目Hub4,利用廣播新聞節(jié)目和竊聽的電話通話來發(fā)展語音識別和自然語言理解技術(shù),這對Alexa項目來說也很有用。推動Alexa發(fā)展的最直接方式是向第三方開放,讓開發(fā)者開發(fā)基于語音技術(shù)的迷你應(yīng)用,即“技能”,并在Echo平臺上運行。然而,這才只是開始。
在Alexa突破Echo音箱的限制之后,亞馬遜的人工智能文化開始形成合力。公司內(nèi)的不同團(tuán)隊都開始意識到,Alexa可以為他們各自項目提供有用的語音服務(wù)。普拉薩德表示:“盡管我們的單線程所有權(quán)模式已經(jīng)很成熟,但仍然可以將所有數(shù)據(jù)和技術(shù)融合在一起。”
最開始,亞馬遜的其他產(chǎn)品開始集成Alexa:通過對Alexa設(shè)備的語音命令,你可以訪問亞馬遜音樂、Prime視頻、獲得亞馬遜主站的商品推薦信息,以及使用其他服務(wù)。隨后,這項技術(shù)開始推廣至亞馬遜的其他業(yè)務(wù)。林賽表示:“一旦我們掌握了最基本的語音能力,就可以將其集成至非Alexa產(chǎn)品,例如Fire TV、語音購物、亞馬遜生鮮的Dash按鈕,以及AWS。”
在這個過程中,亞馬遜內(nèi)部的人工智能孤島開始逐漸靠近。
亞馬遜轉(zhuǎn)型的另一大關(guān)鍵在于,一旦數(shù)百萬客戶(亞馬遜拒絕透露具體數(shù)字)開始使用Echo和其他Alexa設(shè)備,亞馬遜就能掌握豐富的數(shù)據(jù)。這或許是任何會話式設(shè)備所能積累的規(guī)模最龐大的數(shù)據(jù)集。對人才招聘來說,這樣的數(shù)據(jù)集也是極具吸引力的資源。突然之間,亞馬遜就成了那些機器學(xué)習(xí)專家夢寐以求的雇主。去年加入亞馬遜的Alexa機器學(xué)習(xí)副總裁拉威·簡恩(Ravi Jain)表示:“Alexa對我的最大吸引力之一在于,一旦你在市場上推出了一款設(shè)備,那么就掌握了獲得信息反饋的來源。不僅僅是用戶反饋,這些實際數(shù)據(jù)是優(yōu)化所有一切,尤其是底層平臺的基礎(chǔ)。”
因此,隨著越來越多用戶使用Alexa,亞馬遜獲得的信息不僅能讓系統(tǒng)性能變得更好,也有利于自主機器學(xué)習(xí)工具和平臺的加速發(fā)展,并成為該公司吸引機器學(xué)習(xí)科學(xué)家的重要武器。
“飛輪”終于開始旋轉(zhuǎn)起來。
更聰明的云計算
亞馬遜從2014年開始面向Prime會員銷售Echo。這一年,斯瓦米·西瓦蘇布拉曼尼(Swami Sivasubramanian)也開始對機器學(xué)習(xí)發(fā)生興趣。當(dāng)時,負(fù)責(zé)AWS數(shù)據(jù)庫和數(shù)據(jù)分析業(yè)務(wù)的西瓦蘇布拉曼尼正和全家人回印度旅行。由于時差的關(guān)系和小女兒的吵鬧,他不得不在半夜去工作。他嘗試了谷歌的TensorFlow,以及Facebook和學(xué)術(shù)界支持的機器學(xué)習(xí)框架Caffe,發(fā)現(xiàn)將這些工具與亞馬遜的云計算服務(wù)結(jié)合在一起可以創(chuàng)造巨大的價值。他認(rèn)為,通過在云端運行機器學(xué)習(xí)算法,公司可以挖掘新的需求。他表示:“我們希望每月為數(shù)百萬開發(fā)者提供服務(wù)。他們中的大部分人并不是麻省理工學(xué)院的教授,只是毫無機器學(xué)習(xí)專業(yè)背景的開發(fā)者。”
在下一次面見貝索斯時,他帶著一份6頁紙的計劃書。從某種意義上來說,這是將機器學(xué)習(xí)服務(wù)添加至AWS的藍(lán)圖。不過西瓦蘇布拉曼尼認(rèn)為,實際意義還要更加廣泛:這份計劃說明了AWS如何成為機器學(xué)習(xí)研究核心的宏大愿景。
確實,向成千上萬亞馬遜云計算客戶提供機器學(xué)習(xí)服務(wù)是不可避免的。AWS機器學(xué)習(xí)經(jīng)理伍德表示:“在首次提出AWS的商業(yè)計劃時,我們就確定了自己的使命,即充分利用只有財力雄厚的公司才能掌握的技術(shù),并盡可能地去推廣。我們在計算、存儲、數(shù)據(jù)分析和數(shù)據(jù)庫等方面已經(jīng)取得成功,我們要用同樣的方法去對待機器學(xué)習(xí)。”在這個過程中,AWS團(tuán)隊可以利用亞馬遜其他團(tuán)隊積累的經(jīng)驗,這使得工作變得略微容易。
伍德表示,AWS的亞馬遜機器學(xué)習(xí)服務(wù)最初于2015年推出,讓類似C-Span的客戶可以建立私有的頭像目錄。此外,Zillow使用該服務(wù)估計房價,而Pinterest則將其用于可視化搜索。多家自動駕駛創(chuàng)業(yè)公司也在利用AWS機器學(xué)習(xí),通過數(shù)百萬公里的上路測試來優(yōu)化產(chǎn)品。
2016年,AWS又發(fā)布了新的機器學(xué)習(xí)服務(wù),更直接地利用Alexa的創(chuàng)新。這其中包括文本轉(zhuǎn)語音組件Polly,以及自然語言處理引擎Lex。這些產(chǎn)品幫助AWS的客戶,包括Pinterest、Netflix和多家小型創(chuàng)業(yè)公司開發(fā)屬于自己的迷你Alexa。一款涉及可視化技術(shù)的第三方服務(wù)Rekognition就利用了此前Prime Photos取得的成果,嘗試在谷歌、Facebook和蘋果的照片產(chǎn)品中植入同樣的深度學(xué)習(xí)功能。Prime Photos是亞馬遜內(nèi)部一個不太知名的團(tuán)隊。
這些機器學(xué)習(xí)服務(wù)既是強大的營收來源,也是亞馬遜人工智能“飛輪”的關(guān)鍵。各類機構(gòu)和公司,包括美國宇航局(NASA)和美國職業(yè)橄欖球大聯(lián)盟(NFL),都開始付費使用亞馬遜的機器學(xué)習(xí)服務(wù)。如果企業(yè)在AWS平臺內(nèi)開發(fā)關(guān)鍵的機器學(xué)習(xí)工具,那么轉(zhuǎn)移至云計算競爭對手平臺的可能性就會大幅下降。(對不起,谷歌、微軟和IBM。)
以一家規(guī)模數(shù)十億美元的公司Infor為例。該公司為企業(yè)客戶開發(fā)應(yīng)用。近期,該公司發(fā)布了一款全新的應(yīng)用Coleman(以NASA數(shù)學(xué)家的名字來命名),通過會話式界面幫助客戶實現(xiàn)各種流程的自動化,分析性能并與數(shù)據(jù)交互。該公司沒有從頭開發(fā)自主的會話機器人,而是使用了AWS的Lex技術(shù)。Infor副總裁馬西莫·卡珀西亞(Massimo Capoccia)表示:“亞馬遜已經(jīng)在做這些事,所以我們?yōu)槭裁催€要在這上面花時間?我們了解客戶,應(yīng)該做的是將這些技術(shù)應(yīng)用于客戶。”
AWS在這個領(lǐng)域的主導(dǎo)地位也使其獲得了相對于競爭對手,尤其是谷歌的優(yōu)勢。谷歌此前曾希望利用機器學(xué)習(xí)技術(shù)的領(lǐng)先優(yōu)勢,在云計算市場趕超AWS。是的,谷歌服務(wù)器或許向客戶提供了超快速、針對機器學(xué)習(xí)優(yōu)化的芯片。但使用AWS的企業(yè)能更方便地與其他也使用AWS的企業(yè)互動。DigitalGlobe首席技術(shù)官沃爾特·斯科特(Walter Scott)就解釋了,他的公司為什么臺使用亞馬遜的技術(shù)。“這就像是威利·薩頓(Willie Sutton)所說的,搶銀行是因為銀行里有錢。我們使用AWS的機器學(xué)習(xí)技術(shù)是因為我們的客戶也在這個平臺上。”
去年11月,在AWS的re:Invent大會上,亞馬遜發(fā)布了更全面的機器學(xué)習(xí)工具SageMaker。這是個非常強大,但也很易用的平臺。SageMaker的開發(fā)者之一正是機器學(xué)習(xí)領(lǐng)域的超級明星埃里克斯·斯莫拉,5年前他曾拒絕亞馬遜的邀請。當(dāng)斯莫拉決定重回產(chǎn)業(yè)界時,他希望協(xié)助開發(fā)強大的工具,讓所有普通軟件開發(fā)者都可以用上機器學(xué)習(xí)技術(shù)。所以,他加入了他認(rèn)為能帶來最大影響力的公司。他表示:“亞馬遜非常強,你不會放棄這樣的機會。你可以寫論文,但如果不實際開發(fā),那么沒有人會使用你漂亮的算法。”
斯莫拉曾對西瓦蘇布拉曼尼說,開發(fā)工具,將機器學(xué)習(xí)技術(shù)傳播給數(shù)百萬人比新發(fā)表一篇論文更重要。當(dāng)時,他得到了意外之喜。后者表示:“這也不會耽誤你發(fā)表論文!”是的,在允許科學(xué)家發(fā)表論文方面,亞馬遜正變得更開放。協(xié)助制定這方面指導(dǎo)原則的斯派羅斯·馬特索卡斯表示:“這給招聘頂尖人才帶來了巨大的幫助,同時也讓外界更好地了解,亞馬遜內(nèi)部正在開展什么樣的研究。”
目前還無法判斷,AWS的數(shù)百萬用戶是否會用SageMaker,將機器學(xué)習(xí)集成至產(chǎn)品。然而這樣做的開發(fā)者往往都會投入大筆資金,將亞馬遜定位為機器學(xué)習(xí)服務(wù)提供商。此外,這個平臺非常強大,就連亞馬遜內(nèi)部的人工智能團(tuán)隊,例如Alexa團(tuán)隊,也表示愿意成為SageMaker的客戶,使用這些原計劃提供給外部的工具。他們相信,這可以成為項目的基礎(chǔ),節(jié)約他們的時間,而他們自己可以將更多精力用于高級算法的研究。
盡管只有部分AWS客戶使用SageMaker,但亞馬遜發(fā)現(xiàn),該公司已經(jīng)掌握了關(guān)于系統(tǒng)性能的大量數(shù)據(jù)(當(dāng)然,不包括客戶自己保管的機密數(shù)據(jù))。這將帶來更好的算法、更棒的平臺、更多的客戶。“飛輪”正在加班加點地運轉(zhuǎn)。
無所不在的人工智能
隨著機器學(xué)習(xí)帶來顛覆,亞馬遜在人工智能領(lǐng)域的專業(yè)性已經(jīng)滲透至許多團(tuán)隊,這令貝索斯和他的助手們感到高興。雖然亞馬遜并沒有中心化的人工智能辦公室,但有一個部門專門負(fù)責(zé)機器學(xué)習(xí)的推廣和技術(shù)支持,而另一些部門則嘗試應(yīng)用研究成果,推動新科技進(jìn)入亞馬遜的項目。曾供職于微軟必應(yīng)團(tuán)隊和Facebook的拉爾夫·赫布里奇(Ralf Herbrich)與2012年加入亞馬遜,目前負(fù)責(zé)“核心機器學(xué)習(xí)集團(tuán)”。他表示:“重要的是在公司內(nèi)部擁有這樣的社區(qū)。”(同樣的,他所在團(tuán)隊的使命也在6頁紙計劃書中列出,并獲得了貝索斯的批準(zhǔn)。)
他的部分職責(zé)是培育亞馬遜快速發(fā)展的機器學(xué)習(xí)文化。由于亞馬遜采取以客戶為中心的策略,即總是嘗試解決問題而不是單純地做研究,因此亞馬遜高管們承認(rèn),他們在招聘中總是傾向于那些有興趣開發(fā)產(chǎn)品,而不是追求科技突破的人才。Facebook的勒昆則換了句話去總結(jié)亞馬遜的態(tài)度:“不嘗試成為科技先驅(qū),也可以做得很好。”
不過,在培訓(xùn)員工接受人工智能方面,亞馬遜也在效仿Facebook和谷歌。亞馬遜開設(shè)了關(guān)于機器學(xué)習(xí)策略的內(nèi)部課程,并組織內(nèi)部專家開展研討會。從2013年開始,亞馬遜每年春季都會在總部舉辦一場內(nèi)部的機器學(xué)習(xí)大會,這也可以被認(rèn)為是只有亞馬遜參加的NIPS大會。赫布里奇表示:“在剛剛開始時,亞馬遜的機器學(xué)習(xí)大會只有幾百人參加,而現(xiàn)在已經(jīng)有數(shù)千人。我們在西雅圖最大的辦公室也沒有這么大的容納能力,因此除了主會場之外,我們還向園區(qū)中的其他6個會議室直播。”亞馬遜的一名高管表示,如果規(guī)模變得更大,那么就不應(yīng)該叫亞馬遜機器學(xué)習(xí)活動,而直接叫亞馬遜的活動。
赫布里奇的團(tuán)隊繼續(xù)推動機器學(xué)習(xí)技術(shù)滲透至公司的各類項目。例如,物流部門希望更好地預(yù)測,如何根據(jù)顧客的訂單在8種尺寸的包裝盒中做選擇。因此,他們找到赫布里奇的團(tuán)隊尋求幫助。赫布里奇表示:“這個部門不需要自己的科研團(tuán)隊,但需要算法,并能方面地使用這些算法。”大衛(wèi)·利普則提到了另一個例子,即亞馬遜如何預(yù)測有多少顧客可能會購買一款新產(chǎn)品。“我參與消費電子行業(yè)已有30年,在其中25年的時間里,預(yù)測是基于人工判斷,會用到表格,一些魔法球和飛鏢。當(dāng)我們開始在預(yù)測過程中運用機器學(xué)習(xí)技術(shù)后,錯誤率大幅下降。”
不過有些時候,赫布里奇的團(tuán)隊仍然會將尖端科技用于解決特定問題。亞馬遜生鮮快遞服務(wù)亞馬遜Fresh的經(jīng)營已有10年,但仍需要更好的方式來評估生鮮果蔬的質(zhì)量。人工檢測速度太慢,也無法保持標(biāo)準(zhǔn)的一致性。他的柏林團(tuán)隊開發(fā)了集成大量傳感器的硬件和新算法,以彌補系統(tǒng)無法感知食品的缺陷。“經(jīng)過3年之后,我們已經(jīng)有了原型產(chǎn)品,可以更可靠地判斷食品質(zhì)量。”
當(dāng)然,這樣的技術(shù)進(jìn)步可以滲透到整個亞馬遜生態(tài)系統(tǒng)。以近期正式開業(yè)的亞馬遜Go無人店為例。亞馬遜Go技術(shù)副總裁迪利普·庫馬爾(Dilip Kumar)表示:“作為AWS的客戶,我們從規(guī)模效應(yīng)中受益。但AWS也是受益者。”他指出,亞馬遜Go開發(fā)了獨特的系統(tǒng),能從數(shù)百個追蹤顧客購物活動的攝像頭傳送數(shù)據(jù)。他團(tuán)隊的創(chuàng)新影響了名為Kinesis的AWS服務(wù)。該服務(wù)使客戶可以從多個設(shè)備將視頻流媒體傳送至AWS云端,而AWS將對其進(jìn)行處理、分析,優(yōu)化未來的機器學(xué)習(xí)算法。
即使一款亞馬遜服務(wù)尚未使用機器學(xué)習(xí)平臺,也可以主動參與到這一過程中。亞馬遜Prime Air無人機快遞服務(wù)仍處于原型階段,但也開發(fā)了獨立人工智能能力,因為無人機無法依靠云連接。然而,Prime Air也從人工智能“飛輪”中獲益良多,無論是向公司的其他部門學(xué)習(xí)經(jīng)驗,還是弄清楚應(yīng)該使用什么工具。Prime Air副總裁古爾·金姆奇(Gur Kimchi)表示:“我們將這視為餐廳的菜單,所有人都在分享他們有什么樣的美味。”他預(yù)計,他的團(tuán)隊最終也將拿出自己的美味菜單。“在Prime Air,我們學(xué)到的經(jīng)驗和解決的問題毫無疑問能吸引亞馬遜其他部門的興趣。”
實際上,這似乎已經(jīng)在發(fā)生。亞馬遜機器人首席科學(xué)家貝斯·馬庫斯(Beth Marcus)表示:“如果有人在公司的某個部門,例如Prime Air或亞馬遜Go看到一幅畫面,學(xué)到一些東西,開發(fā)一種算法,他們就會與公司內(nèi)的其他人交流。所以,我團(tuán)隊中有些人就可以借鑒,例如弄清楚商品在物流中心里究竟是怎么移動的。”
一家以商品為中心的公司能否勝過擁有大量深度學(xué)習(xí)超級明星的競爭對手?亞馬遜正在努力實現(xiàn)這個目標(biāo)。艾倫人工智能研究所CEO奧林·艾奇奧尼(Oren Etzioni)表示:“盡管他們還在追趕,但他們的產(chǎn)品發(fā)布令人印象深刻。亞馬遜是世界級的公司,開發(fā)了世界級的人工智能產(chǎn)品。”
“飛輪”一直在旋轉(zhuǎn),許多6頁紙計劃書的影響尚未體現(xiàn)出來。這或許意味著更多數(shù)據(jù),更多顧客,更優(yōu)秀的平臺,更豐富的人才。
如果你去問Alexa,亞馬遜在人工智能領(lǐng)域做得怎么樣?那么答案或許是貝索斯的大笑。
評論