吳恩達:百度下一秒的世界
多年前曾有人說,“下床找鞋是個比較麻煩的事,如果百度可以告訴我,該多好。”
本文引用地址:http://cafeforensic.com/article/201701/342401.htm就吳恩達的信心來看,或許在不久的某年中的某一天就可以實現(xiàn)這一智能生活。
吳恩達是百度首席科學家,他習慣以1年、3年、5年及10年的時間的度量看未來和計劃工作。
他說他對人工智能的未來充滿希望。包括百度正在研究的下一秒,以及未來運用后的可以對著窗簾、燈光、安保系統(tǒng)直接說你的訴求的智能家居。
當這一切越來越智能,也預(yù)示著人工智能由互聯(lián)網(wǎng)成功晉級,成為未來主要的智能生活和商業(yè)價值趨勢。人工智能也在經(jīng)歷兩次寒冬后,真正走向成熟。
下一秒
“有人問我,人工智能發(fā)展這么快,它到底可以為你做什么?我想第一,假如有一件事是一個正常人可以在一秒以后做到的,也可以使用人工智能來自動做。比如你想輸入一張圖片,一個正常人看這張圖片思考一秒就可以理解圖片上的人是否好看,這樣的事情人工智能可以做得非常好。”吳恩達舉例稱,再如語音識別能力,人工智能在聽一段語音后不需要想太久,一秒以后可以識別出語音說了什么。再如,這個烤鴨讓你嘔吐,如果問覺得這個用戶喜歡或者不喜歡這個餐館,也只需要想一秒以下就可以知道。
在吳恩達的描述中,一秒以下,是在非常短期的時間,在一個具體重復(fù)發(fā)生的事情中可以利用海量數(shù)據(jù),用這些數(shù)據(jù)來預(yù)測下一次的結(jié)果。
這一預(yù)測方式,在百度命名為“深度學習”。深度學習,即主要依靠硬件——機器及算法模仿類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進行信息處理的模型,它讓機器執(zhí)行人類的活動,如看、聽和思考,為模式識別提供了可能性。
深度學習也被譽為拯救人工智能的主要方式。在學界研究中已進行了數(shù)年,而吳恩達是百度深度學習的主要引導(dǎo)者。
深度學習的另一名稱為機器學習,吳恩達是國際人工智能、機器學習領(lǐng)域最權(quán)威的學者之一。
當年,吳恩達加盟百度,也被業(yè)界譽為百度的下一秒——人工智能將更迎來美好的發(fā)展前景。
據(jù)了解,吳恩達未加入百度前,是線上教育公司Coursera的聯(lián)合創(chuàng)始人。吳恩達于2008年發(fā)起了Stan-ford Engineering Everywhere”(SEE)項目,這個項目把斯坦福的許多課程放到網(wǎng)上供大家免費學習。吳恩達的理想是讓世界上每個人能夠接受高質(zhì)量的、免費的教育。
但吳恩達的最大興趣是研究機器學習。2013年,他的老朋友余凱敦促他專注于人工智能。余凱那時任職于百度。在老友的敦促下,他與百度CEO李彥宏會面。在三個小時的午餐中,兩人就百度研究部門形態(tài)和將要解決哪類問題進行了商討和愿景展望。
吳恩達最知名的一個人工智能開發(fā)項目是,人工神經(jīng)網(wǎng)絡(luò)通過觀看一周YouTube視頻,自主學會識別哪些是關(guān)于貓的視頻。在人工智能界,這個案例被譽為是人工智能領(lǐng)域的新篇章。
另一起知名事件是,他與谷歌頂級工程師開始合作建立全球最大的“神經(jīng)網(wǎng)絡(luò)”,這個神經(jīng)網(wǎng)絡(luò)能以與人類大腦學習新事物相同的方式來學習現(xiàn)實生活。谷歌將這個項目命名為“谷歌大腦”。包括2010年,時任斯坦福大學教授的吳恩達加入谷歌開發(fā)團隊XLab——這個團隊已先后為谷歌開發(fā)無人駕駛汽車和谷歌眼鏡兩個知名項目。
時間再向前推,吳恩達的履歷或許自帶與百度相吸的基因。他1976年出生于倫敦,父親是一位香港醫(yī)生,年輕時在香港和新加坡度過。1992年吳恩達就讀新加坡萊佛士書院,并于1997年獲得了卡內(nèi)基梅隆大學的計算機科學學士學位。1998年獲得了麻省理工學院的碩士學位。
隨著不斷學習和深造,他的履歷中與人工智能最接近的描述是,斯坦福大學計算機科學系和電子工程系副教授,人工智能實驗室主任。吳恩達主要成就在機器學習和人工智能領(lǐng)域。
全球有三個在用深度學習來做人工智能的頂尖的公司:Google、百度,還有Facebook。
2014年,吳恩達加入百度,出任百度首席科學家,全面負責負責運營百度在美國硅谷和中國北京的人工智能研究室。
加入百度后,吳恩達花時間最多的人工智能的兩個方向是,自動駕駛和語音識別。
這一利用深度學習締造的下一秒產(chǎn)物很快實現(xiàn)落地——2015年12月初,百度完成無人駕駛汽車混合道路上路測試,之后于12月4日宣布正式成立自動駕駛事業(yè)部,計劃三年商用,五年量產(chǎn)。
吳恩達認為這兩個方向能夠在很大程度上改變?nèi)藗兊纳?。自動駕駛可以減少車禍,可以幫人們節(jié)省時間去做更多的事情。而語音識別,可以改變?nèi)伺c設(shè)備交互的方式,這將是顛覆性的改變。
2015年底,百度硅谷人工智能實驗室(SVAIL)開發(fā)出深度語音識別系統(tǒng)(Deep Speech 2),該系統(tǒng)能通過簡單學習算法準確的識別英語和漢語,并且轉(zhuǎn)錄普通話片段的準確率有時可以超越人類。
商業(yè)價值
深度學習也被譽為拯救人工智能的主要方式。在百度,深度學習被歸列在百度大腦框架內(nèi),百度大腦融合深度學習算法、數(shù)據(jù)建模、大規(guī)模GPU并行化平臺等技術(shù)。
2013年,在加州庫比蒂諾,百度悄然成立了專注于深度學習研究的前沿實驗室。深度學習尋求通過模擬人腦運行機制來大規(guī)模提升計算任務(wù)處理,是人工智能的一個分支領(lǐng)域。
吳恩達說,他對人工智能,以及百度的人工智能發(fā)展前景充滿了信心。而這一次人工智能的高潮,將伴隨著經(jīng)濟價值的實現(xiàn),得到長遠延續(xù),不會再度迎來寒冬。
據(jù)吳恩達介紹,人工智能或者深度學習的想法已經(jīng)存在好幾十年,不過這種技術(shù)近五六年才開始變好。
事實上,到2016年世界人工智能的技術(shù)剛好出了60年,但前面50年都不成功,因為那時候用的是Rule Based的技術(shù)。一直到十年前,2006年深度學習的興起,大家發(fā)現(xiàn)這個技術(shù)有所突破。用深度學習來做人工智能,有了很大發(fā)展。
吳恩達認為,取得這樣的成就主要有兩個原因,第一就是有了海量數(shù)據(jù),比如有百度、Google、Facebook等這類大公司。第二就是百度計算平臺,比如百度有高性能計算超級計算機,也就是說有了這些平臺才可以使用這些海量數(shù)據(jù)。
一個事物的壯大,必然需要社會其他因素的輔助。在人工智能領(lǐng)域尤為明顯。“確切地說,人工智能領(lǐng)域在過去曾經(jīng)歷過快速進展和炒作的階段,緊接著的卻是投資和興趣的冷卻,這通常被稱為‘AI寒冬’。由于進展放緩和政府資助干涸,第一次寒冬發(fā)生于20世紀70年代。第二次寒冬發(fā)生于20世紀80年代,那一次是因為新的AI趨勢未能產(chǎn)生預(yù)期的商業(yè)影響。”吳恩達稱。
評論