DeepMind人工智能學(xué)會(huì)將平面圖像轉(zhuǎn)換為3D場景
據(jù)外媒報(bào)道,谷歌母公司Alphabet旗下DeepMind最近開發(fā)了一種人工智能技術(shù),它可以在觀察2D平面圖像之后以3D渲染整個(gè)場景。目前一些人工智能研究人員正在試圖教機(jī)器學(xué)習(xí)像人類一樣。我們不是以像素為單位看世界,而是環(huán)顧我們的環(huán)境并對(duì)其中的一切進(jìn)行假設(shè)。
本文引用地址:http://cafeforensic.com/article/201807/382626.htmDeepMind團(tuán)隊(duì)則訓(xùn)練了一個(gè)人工智能如何從其未見的角度猜測(cè)事物的樣子。 DeepMind的科學(xué)家提出了一個(gè)生成查詢網(wǎng)絡(luò)(Generative Query Network,GQN),這是一個(gè)神經(jīng)網(wǎng)絡(luò),旨在教人工智能如何從不同的角度想象物體的場景會(huì)是什么樣子?;旧?,人工智能觀察場景的2D平面圖像,然后嘗試重新創(chuàng)建它。在這種情況下,重要的是DeepMind的人工智能不使用任何人為標(biāo)記的輸入等。它只觀察三幅圖像,并開始預(yù)測(cè)場景的3D版本是什么樣子。
研究人員正在努力實(shí)現(xiàn)“完全無監(jiān)督的場景理解”。目前人工智能尚未接受真實(shí)世界的圖像訓(xùn)練,因此下一步將從照片中渲染逼真的場景。未來,DeepMind基于GQN的人工智能可能只使用照片就可以生成與現(xiàn)實(shí)世界幾乎完全相同的按需3D場景。
評(píng)論