色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<dl id="kg8cu"><xmp id="kg8cu"></xmp></dl>

<dl id="kg8cu"></dl>

<dfn id="kg8cu"><kbd id="kg8cu"></kbd></dfn>

<center id="kg8cu"></center>

<dd id="kg8cu"><tr id="kg8cu"></tr></dd>

<samp id="kg8cu"><optgroup id="kg8cu"></optgroup></samp>

"); //-->

博客專欄

EEPW首頁 > 博客 > 李飛飛「具身智能」新成果！機(jī)器人接入大模型直接聽懂人話，0預(yù)訓(xùn)練就能完成復(fù)雜指令（1）

李飛飛「具身智能」新成果！機(jī)器人接入大模型直接聽懂人話，0預(yù)訓(xùn)練就能完成復(fù)雜指令（1）

發(fā)布人：計(jì)算機(jī)視覺工坊時(shí)間：2023-07-11 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

發(fā)布文章

李飛飛團(tuán)隊(duì)具身智能最新成果來了：

大模型接入機(jī)器人，把復(fù)雜指令轉(zhuǎn)化成具體行動(dòng)規(guī)劃，無需額外數(shù)據(jù)和訓(xùn)練。

從此，人類可以很隨意地用自然語言給機(jī)器人下達(dá)指令，如：

打開上面的抽屜，小心花瓶！

大語言模型+視覺語言模型就能從3D空間中分析出目標(biāo)和需要繞過的障礙，幫助機(jī)器人做行動(dòng)規(guī)劃。

然后重點(diǎn)來了， 真實(shí)世界中的機(jī)器人在未經(jīng)“培訓(xùn)”的情況下，就能直接執(zhí)行這個(gè)任務(wù)。

新方法實(shí)現(xiàn)了零樣本的日常操作任務(wù)軌跡合成，也就是機(jī)器人從沒見過的任務(wù)也能一次執(zhí)行，連給他做個(gè)示范都不需要。

可操作的物體也是開放的，不用事先劃定范圍，開瓶子、按開關(guān)、拔充電線都能完成。

目前項(xiàng)目主頁和論文都已上線，代碼即將推出，并且已經(jīng)引起學(xué)術(shù)界廣泛興趣。

一位前微軟研究員評(píng)價(jià)到：這項(xiàng)研究走在了人工智能系統(tǒng)最重要和最復(fù)雜的前沿。

具體到機(jī)器人研究界也有同行表示：給運(yùn)動(dòng)規(guī)劃領(lǐng)域開辟了新世界。

還有本來沒看到AI危險(xiǎn)性的人，因?yàn)檫@項(xiàng)AI結(jié)合機(jī)器人的研究而改變看法。

機(jī)器人如何直接聽懂人話？

李飛飛團(tuán)隊(duì)將該系統(tǒng)命名為VoxPoser，如下圖所示，它的原理非常簡(jiǎn)單。

首先，給定環(huán)境信息（用相機(jī)采集RGB-D圖像）和我們要執(zhí)行的自然語言指令。

接著，LLM（大語言模型）根據(jù)這些內(nèi)容編寫代碼，所生成代碼與VLM（視覺語言模型）進(jìn)行交互，指導(dǎo)系統(tǒng)生成相應(yīng)的操作指示地圖，即3D Value Map。

所謂3D Value Map，它是Affordance Map和Constraint Map的總稱，既標(biāo)記了“在哪里行動(dòng)”，也標(biāo)記了“如何行動(dòng)”。

如此一來，再搬出動(dòng)作規(guī)劃器，將生成的3D地圖作為其目標(biāo)函數(shù)，便能夠合成最終要執(zhí)行的操作軌跡了。

而從這個(gè)過程我們可以看到，相比傳統(tǒng)方法需要進(jìn)行額外的預(yù)訓(xùn)練，這個(gè)方法用大模型指導(dǎo)機(jī)器人如何與環(huán)境進(jìn)行交互，所以直接解決了機(jī)器人訓(xùn)練數(shù)據(jù)稀缺的問題。

更進(jìn)一步，正是由于這個(gè)特點(diǎn)，它也實(shí)現(xiàn)了零樣本能力，只要掌握了以上基本流程，就能hold任何給定任務(wù)。

在具體實(shí)現(xiàn)中，作者將VoxPoser的思路轉(zhuǎn)化為一個(gè)優(yōu)化問題，即下面這樣一個(gè)復(fù)雜的公式：

它考慮到了人類下達(dá)的指令可能范圍很大，并且需要上下文理解，于是將指令拆解成很多子任務(wù)，比如開頭第一個(gè)示例就由“抓住抽屜把手”和“拉開抽屜”組成。

VoxPoser要實(shí)現(xiàn)的就是優(yōu)化每一個(gè)子任務(wù)，獲得一系列機(jī)器人軌跡，最終最小化總的工作量和工作時(shí)間。

而在用LLM和VLM將語言指令映射為3D地圖的過程中，系統(tǒng)考慮到語言可以傳達(dá)豐富的語義空間，便利用“感興趣的實(shí)體(entity of interest)”來引導(dǎo)機(jī)器人進(jìn)行操作，也就是通過3DValue Map中標(biāo)記的值來反應(yīng)哪個(gè)物體是對(duì)它具有“吸引力”的，那些物體是具有“排斥性”。

還是以開頭的例子舉

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

大嘴業(yè)話-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

國際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

WTC-AI型太陽能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

AI+機(jī)器視覺成趨勢(shì)，圖文詳解N大應(yīng)用場(chǎng)景

智能計(jì)算安森美 AI 機(jī)器視覺 | 2024-07-31

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

WTC-AI太陽能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計(jì)算 AI 智能計(jì)算深圳 | 2024-07-30

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統(tǒng)

智能計(jì)算 Meta AI | 2024-07-31

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

如何快速搭建手寫體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫體識(shí)別 | 2022-07-29

海聯(lián)達(dá)（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

萬家樂JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬家樂 | 2013-01-17

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

Nvidia的CEO談AI的未來：“我們將需要三臺(tái)電腦... 一臺(tái)來創(chuàng)建AI... 一臺(tái)來模擬AI... 一臺(tái)來運(yùn)行AI”

智能計(jì)算 AI | 2024-07-31

CSR8670CSR8675智能語音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專區(qū)

<dl id="oocsa"><xmp id="oocsa"></xmp></dl><li id="oocsa"></li>