從圖像識別到視頻識別 微軟小冰拿什么和谷歌PK人工智能?
1956年的夏天,一場在美國達特茅斯(Dartmouth)大學召開的學術(shù)會議,多年以后被認定為全球人工智能研究的起點。2016年的春天,一場AlphaGo與世界頂級圍棋高手李世石的人機世紀對戰(zhàn),把全球推上了人工智能浪潮的新高。
本文引用地址:http://cafeforensic.com/article/201607/293647.htm經(jīng)歷了兩次起伏,人工智能現(xiàn)在進入了全球爆發(fā)的前夜。僅在中國就有上億人直接或間接地觀看了AlphaGo與李世石的比賽,而在2016年初,還有IBM在全球大舉推廣基于IBM Watson的認知計算,Watson的前身就是1997年打敗了國際象棋大師卡斯帕羅夫的“深藍”。而2014年,微軟的人工智能機器人小冰也同樣在社交平臺掀起一股前所未有的“調(diào)戲”熱潮。
視頻識別成人工智能的重要突破
當AlphaGo戰(zhàn)勝李世石的消息傳來,有人評價說:“這是人工智能一個時代的開始。”
兩次人機大戰(zhàn)時隔20年,這其中最重要的差別在于象棋與圍棋的復雜度差異巨大。人工智能之所以能夠先戰(zhàn)勝國際象棋冠軍,在于國際象棋可以窮盡接近所有可能的棋局,而圍棋就不一樣了,其運算量接近無窮大。
而與谷歌的選擇不同,微軟則將計算機視覺作為主要突破點。因為微軟相信人工智能要融入人類世界,沒有視覺識別能力的機器人無法真正與外界交互。2015年,在微軟等大公司的推動下,計算機視覺已經(jīng)逼近全面突破的拐點。微軟不僅在ImageNet全球頂級的計算機視覺挑戰(zhàn)賽奪得冠軍,微軟人工智能機器人小冰還率先發(fā)布了圖像識別技能。在準確的圖像識別的基礎(chǔ)上,結(jié)合人工智能自己的觀點,對圖片進行人性化的評論。
而就在這幾天,微軟再次對小冰的視覺感官進行升級,實現(xiàn)了對視頻的識別和評論。率先實現(xiàn)了對人類視覺感官的模擬。從靜態(tài)圖片到動態(tài)視頻,人工智能機器人小冰率先實現(xiàn)了對人類視覺感官的模擬。開辟了一條與谷歌不同的人工智能發(fā)展之路。當然,從圖片識別到視頻識別,這一技術(shù)跨越是巨大的。半年前,Google人工智能的兩位軟件工程師在博客上公布了關(guān)于人工智能的一些研究成果,其中很重要的一個突破是,能夠初步辨識出動態(tài)視頻的內(nèi)容。他們的最終目標不僅要分辨出圖像中的物體或人,還要搞清楚他們在干什么。而在前段時間召開的Facebook開發(fā)者大會上,扎克伯格也透露將會把人工智能(AI)巧妙的運用在視頻播放中,根據(jù)視頻中人物的服飾、身材、發(fā)型等識別并標記人物,方便用戶日后檢索。小扎也明確表示,相比靜態(tài)圖像的識別,視頻識別更為困難,對技術(shù)的挑戰(zhàn)更大。
視頻識別擴展人工智能的想象空間
巨頭們極力看好并且大力發(fā)展人工智能,根本目的是讓人工智能幫助人類從低效率的重復勞動中解放出來,幫助我們解決很多依靠自身無法很好解決的問題。
在很多經(jīng)典的美國大片中,我們經(jīng)常看到警察可以通過全國的交通及安防攝像頭追蹤疑犯的動向,從而幫助警察迅速破案。但實際上,受于技術(shù)上的限制,現(xiàn)實生活中對視頻內(nèi)容的分析依然以人工為主,所以經(jīng)??吹絿鴥?nèi)新聞媒體報道,某地警察通過調(diào)取案發(fā)現(xiàn)場附近監(jiān)控視頻經(jīng)過數(shù)小時的分析終于確定疑犯容貌從而成功將其抓獲歸案。除了抓疑犯,通過調(diào)取監(jiān)控攝像頭數(shù)據(jù)進行分析對于尋找失蹤小孩也是有非常大的幫助,但是目前技術(shù)條件下,通過人工分析視頻效率非常低下,讓視頻監(jiān)控的價值大打折扣。
如果人工智能在視頻識別、視頻分析等方面取得重大突破,那么只需要輸入一張照片做參照,即可讓機器從一個地區(qū)數(shù)以千計的視頻監(jiān)控服務器中快速查找定位到相應目標,工作效率及準確度是人工分析根本無法比擬的。這也是為什么微軟小冰視頻識別能力發(fā)布后讓許多人感到興奮的重要原因,這代表著人工智能在視頻分析方面再次取得突破,后面將以此為基礎(chǔ)產(chǎn)生很多具備良好想象空間的應用案例。微軟對于人工智能、計算機視覺的投入正不斷加大,小冰自發(fā)布以來也經(jīng)歷了脫胎換骨的變化。微軟人工智能的下一步走向哪里,十分值得期待。
評論