人工智能科學(xué)家李飛飛的逆襲之路
這個(gè)自從來(lái)到美國(guó)以后,就飽受經(jīng)濟(jì)壓力的乖乖女,卻少見(jiàn)地叛逆了一回。她決定去西藏研究一年藏藥,之后去加州理工學(xué)院攻讀PhD。
本文引用地址:http://cafeforensic.com/article/201701/343232.htm
當(dāng)我們今天縱觀李飛飛的人生時(shí),會(huì)發(fā)現(xiàn),這種追隨內(nèi)心的熱情和強(qiáng)硬堅(jiān)韌的作風(fēng),始終貫穿著她的行為軌跡。正如博士畢業(yè)后,她選擇了當(dāng)時(shí)還不太流行的圖像識(shí)別作為研究方向一樣。
圖像識(shí)別技術(shù),是人工智能發(fā)展道路上的一座高峰。簡(jiǎn)單來(lái)說(shuō),它就是要教會(huì)計(jì)算機(jī)看圖說(shuō)話。要知道,“看到”和“懂得”是不一樣的。比如,你可以告訴計(jì)算機(jī),“貓”就是有著圓臉、胖身子、 兩個(gè)尖尖的耳朵,還有一條長(zhǎng)尾巴的東西。
可是,如果圖片是這樣的呢?
一個(gè)3歲小孩都能從圖片中識(shí)別出“貓”,可是計(jì)算機(jī)卻做不到。
李飛飛研究了很長(zhǎng)時(shí)間,始終沒(méi)有突破。交好的教授都勸她換個(gè)方向,以便拿到tenure(終生教職:在西方高校,有了tenure就相當(dāng)于終生的職業(yè)生涯都有了保障)。
她當(dāng)然沒(méi)有同意。有一天,李飛飛突然意識(shí)到,由于人眼每200毫秒就能獲取一幅圖像,一個(gè)3歲兒童可能已經(jīng)獲得了上億次的圖像識(shí)別訓(xùn)練,是計(jì)算機(jī)的幾何級(jí)倍數(shù)。
也就是,關(guān)鍵在于自主訓(xùn)練量。
李飛飛馬上開(kāi)始著手,從twitter上抓取海量照片,將它們統(tǒng)統(tǒng)打上標(biāo)簽后,訓(xùn)練計(jì)算機(jī)進(jìn)行機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)(machine learning),就是給出一定算法,讓計(jì)算機(jī)自己學(xué)習(xí)。
這個(gè)過(guò)程是艱苦的。如今,機(jī)器學(xué)習(xí)已經(jīng)是熱門概念,可在2007年,李飛飛的實(shí)驗(yàn)室缺少人手,又申請(qǐng)不到經(jīng)費(fèi)。最困難的時(shí)候,她一度想重開(kāi)洗衣店,籌集實(shí)驗(yàn)資金。
她從亞馬遜的眾包平臺(tái)中找到了解決辦法,讓全世界的網(wǎng)友一起給圖片打標(biāo)簽。當(dāng)時(shí),李飛飛的研究項(xiàng)目,一度是該眾包平臺(tái)全球最大的雇主。
一個(gè)前所未有的龐大數(shù)據(jù)庫(kù)建成了,這就是大名鼎鼎的ImageNet。李飛飛沒(méi)有敝帚自珍,而是將ImageNet數(shù)據(jù)庫(kù)開(kāi)源,供學(xué)術(shù)和商業(yè)界的每一個(gè)實(shí)驗(yàn)室調(diào)取。圖片識(shí)別技術(shù)從此飛速發(fā)展,如今已經(jīng)能辨識(shí)出大部分照片中的物體,還能用高度擬合的人類語(yǔ)言,將它們描述出來(lái)。
由于學(xué)術(shù)成就卓著,李飛飛收到了很多社會(huì)活動(dòng)的邀請(qǐng)。她曾經(jīng)接受過(guò) New York Times的訪談,也曾登上 TED的舞臺(tái),講述圖形識(shí)別技術(shù)發(fā)展的背后故事。
評(píng)論