色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<kbd id="pd3vw"><code id="pd3vw"><pre id="pd3vw"></pre></code></kbd>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 讓 AI “讀懂”人類(lèi)價(jià)值觀！朱松純團(tuán)隊(duì)工作登上 Science 頭條

讓 AI “讀懂”人類(lèi)價(jià)值觀！朱松純團(tuán)隊(duì)工作登上 Science 頭條

發(fā)布人：傳感器技術(shù) 時(shí)間：2023-05-10 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

發(fā)布文章

國(guó)際頂級(jí)學(xué)術(shù)期刊發(fā)表了朱松純團(tuán)隊(duì)（UCLA袁路遙、高曉豐、北京通用人工智能研究院鄭子隆、北京大學(xué)人工智能研究院朱毅鑫等作者）的最新研究成果——實(shí)時(shí)雙向人機(jī)價(jià)值對(duì)齊 In-situ bidirectional human-robotvalue alignment。論文同時(shí)被Science官網(wǎng)和Science Robotics官網(wǎng)頭條刊登。

論文地址：https://www.science.org/doi/10.1126/scirobotics.abm4183

本論文提出了一個(gè)可解釋的人工智能（XAI）系統(tǒng)，闡述了一種機(jī)器實(shí)時(shí)理解人類(lèi)價(jià)值觀的計(jì)算框架，并展示了機(jī)器人如何與人類(lèi)用戶(hù)通過(guò)實(shí)時(shí)溝通完成一系列復(fù)雜人機(jī)協(xié)作任務(wù)。朱松純團(tuán)隊(duì)長(zhǎng)期從事可解釋人工智能相關(guān)工作。此文是團(tuán)隊(duì)第二篇發(fā)表在 Science Robotics 的關(guān)于可解釋人工智能的論文。這項(xiàng)研究涵蓋了認(rèn)知推理、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)等多學(xué)科領(lǐng)域，是朱松純教授團(tuán)隊(duì)交叉研究成果的集中體現(xiàn)。

在這個(gè)人機(jī)共存的時(shí)代，為了讓機(jī)器更好地服務(wù)于人類(lèi)，理想的人機(jī)協(xié)作應(yīng)該是什么樣的？我們不妨借鑒一下人類(lèi)社會(huì)的協(xié)作，在人類(lèi)團(tuán)隊(duì)合作過(guò)程中，共同的價(jià)值觀和目標(biāo)是保證團(tuán)隊(duì)之間齊心協(xié)力、高效合作的基礎(chǔ)。當(dāng)前機(jī)器智能大多數(shù)基于數(shù)據(jù)驅(qū)動(dòng)（且很多情況下獲取不了數(shù)據(jù)）、且是單方面接受人類(lèi)指令（一種是人類(lèi)觀測(cè)受限的情況下是沒(méi)法給到指令的）

為了解決上述問(wèn)題，以及為了讓機(jī)器能夠進(jìn)行更好地“自主”探索，我們要讓機(jī)器學(xué)會(huì)“讀懂”人類(lèi)價(jià)值觀，因此我們提出“實(shí)時(shí)雙向價(jià)值對(duì)齊”。這就要求人類(lèi)要想辦法一次次地給到AI反饋，逐漸地教會(huì)AI“讀懂”人類(lèi)的價(jià)值觀，也就是讓機(jī)器和人類(lèi)的“價(jià)值觀”保持一致。

這個(gè)問(wèn)題也被稱(chēng)為價(jià)值對(duì)齊（value alignment），即如何保證人工智能在執(zhí)行任務(wù)過(guò)程中所實(shí)現(xiàn)的價(jià)值和用戶(hù)所在意的價(jià)值是一致的？

可以說(shuō)，價(jià)值對(duì)齊是人機(jī)協(xié)作過(guò)程中達(dá)成共識(shí)（common ground）的基礎(chǔ)，具有非常重要的研究?jī)r(jià)值。價(jià)值對(duì)齊也是未來(lái)的一個(gè)重要發(fā)展方向，是讓機(jī)器實(shí)現(xiàn)“自主智能”的關(guān)鍵所在，也是實(shí)現(xiàn)通用人工智能的必經(jīng)之路。鑒于此，北京通用人工智能研究院院長(zhǎng)朱松純團(tuán)隊(duì)一直在致力于此方向的研究。

理想的人機(jī)協(xié)作應(yīng)該是什么樣的？在人工智能發(fā)展方興未艾之時(shí)，控制論之父諾伯特-維納（Norbert Wiener）就提出了人機(jī)協(xié)作的基礎(chǔ)：

“如果我們使用一個(gè)機(jī)器來(lái)實(shí)現(xiàn)我們的目標(biāo)，但又不能有效地干預(yù)其運(yùn)作方式...那么我們最好能篤定，輸入給機(jī)器的目標(biāo)是我們真正所預(yù)期的?！?/span>

近幾年來(lái)，一系列研究進(jìn)展都表明：高效的人機(jī)協(xié)作依賴(lài)于團(tuán)隊(duì)之間擁有一致的價(jià)值觀、目標(biāo)，以及對(duì)任務(wù)現(xiàn)狀的理解。這就要求人類(lèi)通過(guò)與機(jī)器的溝通來(lái)高效地建立整個(gè)團(tuán)隊(duì)對(duì)任務(wù)的共識(shí)，每個(gè)團(tuán)隊(duì)成員都采取其他伙伴更容易理解的行為決策來(lái)完成協(xié)作。在大多數(shù)情況下，隊(duì)友之間的溝通過(guò)程都是雙向的，即每個(gè)成員都要扮演著傾聽(tīng)者和表達(dá)者兩種角色。這樣的雙向價(jià)值對(duì)齊決定了人機(jī)協(xié)作中的溝通是否能夠成功，即機(jī)器人是否能準(zhǔn)確地推斷出用戶(hù)的價(jià)值目標(biāo)，并有效地解釋自己的行為。如果這兩個(gè)條件沒(méi)有得到滿(mǎn)足，隊(duì)友間彼此的不理解和誤判很可能會(huì)導(dǎo)致協(xié)作失敗。因此，想要使人工智能更好地服務(wù)于人類(lèi)社會(huì)，必須讓它們?cè)谂c人類(lèi)互動(dòng)時(shí)扮演好這兩種角色。

從傾聽(tīng)者的角度來(lái)看，傳統(tǒng)人工智能算法（如逆強(qiáng)化學(xué)習(xí)（IRL）等）能夠?qū)⒔换?shù)據(jù)與機(jī)器學(xué)習(xí)算法相結(jié)合，以學(xué)習(xí)特定任務(wù)中用戶(hù)的價(jià)值目標(biāo)，即通過(guò)輸入用戶(hù)在特定任務(wù)中的行為方式，來(lái)恢復(fù)行為背后的獎(jiǎng)勵(lì)函數(shù)。然而，在眾多實(shí)際且重要（如軍事和醫(yī)療領(lǐng)域）的應(yīng)用中，數(shù)據(jù)的獲取經(jīng)常十分昂貴。這些機(jī)器學(xué)習(xí)方法對(duì)大型數(shù)據(jù)集的依賴(lài)是無(wú)法應(yīng)對(duì)即時(shí)互動(dòng)的人機(jī)協(xié)作場(chǎng)景的。

從表達(dá)者的角度來(lái)看，可解釋人工智能（XAI）的引入是為了促進(jìn)人機(jī)之間達(dá)成共識(shí)。當(dāng)前的XAI系統(tǒng)通常強(qiáng)調(diào)的是對(duì)“模型如何產(chǎn)生決策過(guò)程”的解釋。然而，不管用戶(hù)有多少主動(dòng)的輸入或互動(dòng)，都只能影響機(jī)器“生成解釋”的過(guò)程，而不影響機(jī)器“做出決策”的過(guò)程。這是一種單向的價(jià)值目標(biāo)對(duì)齊，我們稱(chēng)之為靜態(tài)機(jī)器-動(dòng)態(tài)用戶(hù)的交流，即在這種協(xié)作過(guò)程中只有用戶(hù)對(duì)機(jī)器或任務(wù)的理解發(fā)生了變化。

為了完成人與機(jī)器之間價(jià)值目標(biāo)的雙向?qū)R，需要一種人類(lèi)價(jià)值主導(dǎo)的、動(dòng)態(tài)機(jī)器-動(dòng)態(tài)用戶(hù)的交流模式。在這樣一種新的模式中，機(jī)器人除了揭示其決策過(guò)程外，還將根據(jù)用戶(hù)的價(jià)值目標(biāo)即時(shí)調(diào)整行為，從而使機(jī)器和人類(lèi)用戶(hù)能夠合作實(shí)現(xiàn)一系列的共同目標(biāo)。為了即時(shí)掌握用戶(hù)信息，我們采用通訊學(xué)習(xí)取代了傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法，機(jī)器將根據(jù)所推斷出的用戶(hù)的價(jià)值目標(biāo)進(jìn)行合理解釋。這種合作導(dǎo)向的人機(jī)協(xié)作要求機(jī)器具有心智理論（ToM），即理解他人的心理狀態(tài)（包括情緒、信仰、意圖、欲望、假裝與知識(shí)等）的能力。心智理論最早在心理學(xué)和認(rèn)知科學(xué)中被研究，現(xiàn)已泛化到人工智能領(lǐng)域。心智理論在多智能體和人機(jī)交互環(huán)境中尤為重要，因?yàn)槊總€(gè)智能體都要理解其他智能體（包括人）的狀態(tài)和意圖才能更好地執(zhí)行任務(wù)，其決策行為又會(huì)影響其他智能體做出判斷。設(shè)計(jì)擁有心智理論的系統(tǒng)不僅在于解釋其決策過(guò)程，還旨在理解人類(lèi)的合作需求，以此形成一個(gè)以人類(lèi)為中心、人機(jī)兼容的協(xié)作過(guò)程。

為了建立一個(gè)具有上述能力的AI系統(tǒng)，本文設(shè)計(jì)了一個(gè)"人機(jī)協(xié)作探索"游戲。在這個(gè)游戲中，用戶(hù)需要與三個(gè)偵察機(jī)器人合作完成探索任務(wù)并最大化團(tuán)隊(duì)收益。本游戲設(shè)定：1、只有偵察機(jī)器人能直接與游戲世界互動(dòng)，用戶(hù)不能直接控制機(jī)器人的行為；2、用戶(hù)將在游戲初始階段選擇自己的價(jià)值目標(biāo)（例如：最小化探索時(shí)間，收集更多的資源，探索更大的區(qū)域等），機(jī)器人團(tuán)隊(duì)必須通過(guò)人機(jī)互動(dòng)來(lái)推斷這個(gè)價(jià)值目標(biāo)。這樣的設(shè)置真實(shí)地模仿了現(xiàn)實(shí)世界中的人機(jī)合作任務(wù)，因?yàn)樵S多AI系統(tǒng)都需要在人類(lèi)用戶(hù)的監(jiān)督下，自主地在危險(xiǎn)的環(huán)境中運(yùn)行（如在核電站有核泄漏的情況下）。

要成功地完成游戲，機(jī)器人需要同時(shí)掌握“聽(tīng)”和“說(shuō)”的能力來(lái)實(shí)現(xiàn)價(jià)值雙向?qū)R。首先，機(jī)器人需要從人類(lèi)的反饋中提取有用的信息，推斷出用戶(hù)的價(jià)值函數(shù)（描述目標(biāo)的函數(shù)）并相應(yīng)地調(diào)整它們的策略。其次，機(jī)器人需要根據(jù)它們當(dāng)前的價(jià)值推斷，有效地解釋它們"已經(jīng)做了什么"和"計(jì)劃做什么"，讓用戶(hù)知道機(jī)器人是否和人類(lèi)有相同的的價(jià)值函數(shù)。同時(shí)，用戶(hù)的任務(wù)是指揮偵查機(jī)器人到達(dá)目的地，并且使團(tuán)隊(duì)的收益最大化。因此，用戶(hù)對(duì)機(jī)器人的評(píng)價(jià)也是一個(gè)雙向的過(guò)程，即用戶(hù)必須即時(shí)推斷偵察機(jī)器人的價(jià)值函數(shù)，檢查其是否與人類(lèi)的價(jià)值函數(shù)相一致。如果不一致，則選擇適當(dāng)?shù)闹噶顏?lái)調(diào)整他們的目標(biāo)。最終，如果系統(tǒng)運(yùn)行良好，偵察機(jī)器人的價(jià)值函數(shù)應(yīng)該與人類(lèi)用戶(hù)的價(jià)值函數(shù)保持一致，并且用戶(hù)應(yīng)該高度信任機(jī)器人系統(tǒng)自主運(yùn)行。

圖1. 人機(jī)價(jià)值對(duì)齊過(guò)程總覽。

圖1介紹了游戲中的雙向價(jià)值調(diào)整過(guò)程。在游戲互動(dòng)過(guò)程中，存在著三個(gè)價(jià)值目標(biāo)，分別是：用戶(hù)的真實(shí)價(jià)值；：機(jī)器人對(duì)用戶(hù)價(jià)值的估計(jì)（在游戲中，偵察機(jī)器人沒(méi)有自己的價(jià)值，所以他們以人類(lèi)用戶(hù)價(jià)值的估計(jì)為依據(jù)采取行動(dòng)）；：用戶(hù)對(duì)機(jī)器人價(jià)值的估計(jì)。基于這三個(gè)價(jià)值目標(biāo)產(chǎn)生了兩種價(jià)值對(duì)齊—— ：機(jī)器人從用戶(hù)給出的反饋中學(xué)習(xí)用戶(hù)的價(jià)值；: 用戶(hù)從機(jī)器人給出的解釋和互動(dòng)中了解機(jī)器人的價(jià)值。最終，三種價(jià)值目標(biāo)將匯聚于，人-機(jī)團(tuán)隊(duì)將形成相互信任和高效的協(xié)作。

本文提出的XAI系統(tǒng)旨在共同解決以下兩個(gè)問(wèn)題：

在即時(shí)互動(dòng)和反饋過(guò)程中，機(jī)器如何準(zhǔn)確估計(jì)人類(lèi)用戶(hù)的意圖？
機(jī)器如何解釋自己，以便人類(lèi)用戶(hù)能夠理解機(jī)器的行為，并提供有用的反饋來(lái)幫助機(jī)器做出價(jià)值調(diào)整？

在本文提出的系統(tǒng)中，機(jī)器人提出任務(wù)計(jì)劃的建議，并要求人類(lèi)用戶(hù)給出反饋（接受或拒絕建議），從人類(lèi)反饋中推斷出任務(wù)目標(biāo)背后人類(lèi)真實(shí)的價(jià)值意圖。在協(xié)作游戲中，如果用戶(hù)知道機(jī)器人正在積極學(xué)習(xí)他的價(jià)值目標(biāo)，那么用戶(hù)就會(huì)傾向于提供更加有用的反饋，以促進(jìn)價(jià)值保持對(duì)齊。特別地，每條信息都傳達(dá)了兩方面的意義，包括（1）基于價(jià)值目標(biāo)的語(yǔ)義信息和（2）基于不同解釋方式之間區(qū)別的語(yǔ)用信息。利用這兩方面的含義，XAI系統(tǒng)以一種多輪的、即時(shí)的方式展示了價(jià)值的一致性，在一個(gè)問(wèn)題搜索空間大的團(tuán)隊(duì)合作任務(wù)中實(shí)現(xiàn)了高效的人機(jī)互動(dòng)交流。為了使機(jī)器人的價(jià)值目標(biāo)與用戶(hù)保持一致，XAI系統(tǒng)生成解釋、揭示機(jī)器人對(duì)人類(lèi)價(jià)值的當(dāng)前估計(jì)、并證明提出規(guī)劃的合理性。在每一步的互動(dòng)中，為了避免解釋內(nèi)容過(guò)于冗長(zhǎng)，機(jī)器人會(huì)提供定制化的解釋?zhuān)热缡÷灾貜?fù)的已知信息并強(qiáng)調(diào)重要的更新。在收到機(jī)器人的解釋并向它們發(fā)送反饋后，用戶(hù)向機(jī)器人提供提示，說(shuō)明他們對(duì)最新建議和解釋的滿(mǎn)意程度。利用這些反饋，機(jī)器人會(huì)不斷地更新解釋的形式和內(nèi)容。

為了評(píng)估本文XAI系統(tǒng)的性能，我們邀請(qǐng)了人類(lèi)用戶(hù)進(jìn)行了一系列實(shí)驗(yàn)，以此考察人類(lèi)-機(jī)器雙向價(jià)值協(xié)調(diào)是否成功。我們采用了三種類(lèi)型的解釋?zhuān)⒂脩?hù)隨機(jī)分配到三組中的一組。實(shí)驗(yàn)結(jié)果表明，我們所提出的XAI系統(tǒng)能夠以有效地實(shí)現(xiàn)即時(shí)雙向的價(jià)值對(duì)齊，并用于協(xié)作任務(wù)；機(jī)器人能夠推斷出人類(lèi)用戶(hù)的價(jià)值，并調(diào)整其價(jià)值估計(jì)被用戶(hù)所理解。此外，有必要進(jìn)行多樣化的解釋?zhuān)蕴岣邫C(jī)器的決策性能和它們的社會(huì)智能。合作式的人工智能的目標(biāo)是減少人類(lèi)的認(rèn)知負(fù)擔(dān)，并協(xié)助完成任務(wù)，我們相信，主動(dòng)即時(shí)推斷人類(lèi)的價(jià)值目標(biāo)，并促進(jìn)人類(lèi)對(duì)系統(tǒng)的理解，將會(huì)為通用智能體的人機(jī)合作鋪平道路。

如圖2所示，在我們?cè)O(shè)計(jì)的合作游戲中，包含一個(gè)人類(lèi)指揮官和三個(gè)偵察機(jī)器人。游戲的目標(biāo)是需要在一張未知的地圖上找到一條從基地（位于地圖的右下角）到目的地（位于地圖的左上角）的安全路徑。該地圖被表示為一個(gè)部分可見(jiàn)的20×20網(wǎng)格圖，每個(gè)格子都可能有一個(gè)不同的裝置，只有在偵察機(jī)器人靠近它之后才可見(jiàn)。

在游戲中，人類(lèi)指揮官和偵察機(jī)器人具有結(jié)構(gòu)性的相互依賴(lài)關(guān)系，一方面人類(lèi)指揮官需要依靠偵察機(jī)器人探索危險(xiǎn)區(qū)域并排除爆炸物，另一方面，偵察機(jī)器人需要依賴(lài)人類(lèi)指揮官提供的反饋更好地理解當(dāng)前任務(wù)的目標(biāo)。

圖 2：偵察探索游戲的用戶(hù)界面。從左到右，圖例面板顯示游戲地圖中的圖例。價(jià)值函數(shù)面板顯示這局游戲的價(jià)值函數(shù)，偵察機(jī)器人不知道這個(gè)函數(shù)，用戶(hù)也不能修改。中心地圖顯示當(dāng)前地圖上的信息。分?jǐn)?shù)面板顯示了用戶(hù)的當(dāng)前分?jǐn)?shù)?？偡值挠?jì)算方法是將各個(gè)目標(biāo)的分?jǐn)?shù)用價(jià)值函數(shù)加權(quán)后的總和。狀態(tài)面板顯示系統(tǒng)的當(dāng)前狀態(tài)。提議面板顯示偵察機(jī)器人當(dāng)前的任務(wù)計(jì)劃提議，用戶(hù)可以接受/拒絕每個(gè)建議。解釋面板顯示偵察機(jī)器人提供的解釋。

我們?yōu)閭刹鞕C(jī)器人制定了在尋找到路徑時(shí)額外的一系列目標(biāo)，包括1）盡快到達(dá)目的地，2）調(diào)查地圖上的可疑裝置，3）探索更大的區(qū)域，以及4）收集資源。游戲的表現(xiàn)是由偵察機(jī)器人完成這些目標(biāo)的情況和它們的相對(duì)重要性（權(quán)重）來(lái)衡量的，其中的權(quán)重就是人類(lèi)用戶(hù)的價(jià)值函數(shù)。例如，如果人類(lèi)指揮官更注重時(shí)效而不是獲取更多的資源，那么偵察機(jī)器人則應(yīng)該忽略沿途上的部分資源以保證盡快到達(dá)目的地。（注，這個(gè)價(jià)值函數(shù)只在游戲開(kāi)始時(shí)向人類(lèi)用戶(hù)透露，而不對(duì)偵察機(jī)器人透露。圖 3總結(jié)了人機(jī)互動(dòng)的流程。）

在不清楚人類(lèi)指揮官價(jià)值取向的情況下，機(jī)器人偵察兵小隊(duì)必須快速推斷出人類(lèi)的價(jià)值判斷，在每一步行動(dòng)中，機(jī)器人偵察小隊(duì)每一個(gè)成員都要給出下一步行動(dòng)方案，由人類(lèi)指揮官選擇。為了幫助指揮官進(jìn)行決策，偵察機(jī)器人小隊(duì)將解釋行動(dòng)方案的依據(jù)。結(jié)合指揮官的反饋，以往的互動(dòng)歷史和當(dāng)前的地圖情況，偵察機(jī)器人小隊(duì)將調(diào)整其對(duì)指揮官當(dāng)前價(jià)值觀的判斷，并采取相應(yīng)的行動(dòng)。

圖3：偵查探索游戲的設(shè)計(jì)。時(shí)間線(xiàn)（A）表示在一輪游戲中發(fā)生的事件，從機(jī)器人收到環(huán)境信號(hào)開(kāi)始，到它們的下一步動(dòng)作結(jié)束。時(shí)間線(xiàn)（B）和（C）分別描述了機(jī)器人和用戶(hù)的心智變化過(guò)程。

為了估計(jì)人類(lèi)指揮官在通信過(guò)程中的價(jià)值函數(shù)，我們將兩個(gè)層次的心智理論整合到我們的計(jì)算模型中。第1層心智理論考慮合作性假設(shè)。也就是說(shuō)，給定一個(gè)合作的人類(lèi)指揮官，被他接受的來(lái)自機(jī)器人的提議，更有可能與正確的價(jià)值函數(shù)相一致。第2層心智理論進(jìn)一步將用戶(hù)的教育方法納入模型，使機(jī)器人更接近人類(lèi)指揮官真實(shí)價(jià)值的反饋比其他反饋更容易被人類(lèi)指揮官選擇。建模人類(lèi)指揮官的教育傾向（pedagogical inclination）需要更高一層的心智理論。結(jié)合這兩個(gè)層次的心智理論，我們將人類(lèi)指揮官的決策函數(shù)寫(xiě)成一個(gè)由價(jià)值函數(shù)參數(shù)化的分布，并開(kāi)發(fā)出一種新的學(xué)習(xí)算法。

值得注意的是，與我們的人機(jī)合作框架有可比性但不同的方法是逆強(qiáng)化學(xué)習(xí)。逆強(qiáng)化學(xué)習(xí)的目的是在一個(gè)被動(dòng)的學(xué)習(xí)環(huán)境中，根據(jù)預(yù)先錄制的、來(lái)自專(zhuān)家的演示（demonstration）來(lái)恢復(fù)底層的獎(jiǎng)勵(lì)函數(shù)（reward function）。與之不同的是，在我們的環(huán)境中，偵察機(jī)器人被設(shè)計(jì)為從人類(lèi)指揮官給出的稀缺監(jiān)督中進(jìn)行交互學(xué)習(xí)。更重要的是，我們的設(shè)計(jì)要求機(jī)器人在任務(wù)進(jìn)行的過(guò)程中即時(shí)地、主動(dòng)地推斷人類(lèi)指揮官的價(jià)值。此外，為了完成合作，偵察機(jī)器人不僅必須迅速理解人類(lèi)指揮官的意圖，還要闡明自己的決策依據(jù)，以確保在整個(gè)游戲過(guò)程中與人類(lèi)指揮官順利溝通?？傮w來(lái)看，機(jī)器人的任務(wù)是通過(guò)推斷人類(lèi)用戶(hù)的心智模型，積極提出建議，并評(píng)估人類(lèi)用戶(hù)的反饋來(lái)進(jìn)行價(jià)值調(diào)整。這些都需要機(jī)器對(duì)人類(lèi)用戶(hù)進(jìn)行復(fù)雜的心智建模，并具有即時(shí)更新模型的能力。

總結(jié)

本文提出的XAI系統(tǒng)成功地證明了雙向人機(jī)價(jià)值對(duì)齊框架的可行性。從傾聽(tīng)者的角度來(lái)看，所有三個(gè)解釋組中的機(jī)器人都可以在游戲進(jìn)度達(dá)到25%時(shí)，通過(guò)對(duì)至少60%的目標(biāo)重要性進(jìn)行正確排序，快速與用戶(hù)的價(jià)值進(jìn)行對(duì)齊。從表達(dá)者的角度來(lái)看，通過(guò)提供適當(dāng)?shù)慕忉專(zhuān)瑱C(jī)器人可以向用戶(hù)說(shuō)明其意圖，并幫助人類(lèi)更好的感知機(jī)器人的價(jià)值，當(dāng)給機(jī)器提供”完整解釋“時(shí)，只需在游戲進(jìn)度達(dá)到50%時(shí)即可實(shí)現(xiàn)人類(lèi)用戶(hù)價(jià)值與機(jī)器人價(jià)值的統(tǒng)一，而當(dāng)只提供”簡(jiǎn)要解釋“時(shí)，游戲進(jìn)度需要達(dá)到75%時(shí)才能完成價(jià)值的統(tǒng)一。

我們從上述兩個(gè)角度得到了令人信服的證據(jù)，實(shí)現(xiàn)了雙向價(jià)值對(duì)齊的過(guò)程，具體來(lái)說(shuō)：

通過(guò)接收人類(lèi)的反饋，機(jī)器人逐漸更新其價(jià)值函數(shù)來(lái)與人類(lèi)的價(jià)值保持一致；
通過(guò)不斷地與機(jī)器人交互，人類(lèi)用戶(hù)逐漸形成對(duì)系統(tǒng)能力和意圖的感知。

雖然機(jī)器人系統(tǒng)的價(jià)值在游戲的上半場(chǎng)沒(méi)有與人類(lèi)用戶(hù)實(shí)現(xiàn)統(tǒng)一，但用戶(hù)對(duì)機(jī)器人價(jià)值評(píng)估能力的感知仍然可以提高。

最終，當(dāng)機(jī)器人的價(jià)值變得穩(wěn)定時(shí)，用戶(hù)對(duì)機(jī)器人的評(píng)估也變得穩(wěn)定。從機(jī)器人對(duì)用戶(hù)價(jià)值的評(píng)估到用戶(hù)價(jià)值的真實(shí)值，以及從用戶(hù)對(duì)機(jī)器人價(jià)值的評(píng)估到機(jī)器人當(dāng)前價(jià)值的收斂配對(duì)，形成了由用戶(hù)真實(shí)價(jià)值錨定的雙向價(jià)值對(duì)齊。

總的來(lái)說(shuō)，我們提出了一個(gè)雙向人機(jī)價(jià)值對(duì)齊框架，并使用XAI系統(tǒng)驗(yàn)證其可行性。我們提出的XAI系統(tǒng)表明，當(dāng)把心智理論集成到機(jī)器的學(xué)習(xí)模塊中，并向用戶(hù)提供適當(dāng)?shù)慕忉寱r(shí)，人類(lèi)和機(jī)器人能夠通過(guò)即時(shí)交互的方式實(shí)現(xiàn)心智模型的對(duì)齊。我們提出的計(jì)算框架通過(guò)促進(jìn)人和機(jī)器之間共享心智模型的形成，為解決本文的核心問(wèn)題"理想的人機(jī)協(xié)作應(yīng)該是什么樣的？"提供了全新的解答。

在這個(gè)游戲任務(wù)中，我們的工作側(cè)重于以?xún)r(jià)值和意圖為核心對(duì)心智進(jìn)行建模，對(duì)齊這些價(jià)值可以極大地幫助人類(lèi)和機(jī)器為面向任務(wù)的協(xié)作建立共同基礎(chǔ)，使其可以勝任更加復(fù)雜的場(chǎng)景何任務(wù)。因此，我們的工作是在人機(jī)協(xié)作中朝著更通用的心智模型對(duì)齊邁出的第一步。在未來(lái)的工作中，我們計(jì)劃探索哪些因素能夠進(jìn)一步增強(qiáng)人類(lèi)用戶(hù)信任（例如，允許對(duì)機(jī)器人進(jìn)行反事實(shí)查詢(xún)），驗(yàn)證"對(duì)齊"對(duì)任務(wù)性能的影響，并將我們的系統(tǒng)應(yīng)用于涉及更復(fù)雜環(huán)境和價(jià)值函數(shù)的任務(wù)。

未來(lái)暢想：打造“AI大白”

在科幻電影《超能陸戰(zhàn)隊(duì)》中，有一個(gè)“大白”智能陪伴機(jī)器人，“大白”可以陪電影男主角一起學(xué)習(xí)、玩耍、做游戲，具有很高的實(shí)時(shí)互動(dòng)性。而當(dāng)電影男主角情緒失落時(shí)，“大白”還能“讀懂”他的情感價(jià)值需求，主動(dòng)安慰，給一個(gè)大大的擁抱。

“大白”其實(shí)是一個(gè)很智能的通用智能體。朱松純團(tuán)隊(duì)所在的北京通用人工智能研究院，聯(lián)合北京大學(xué)人工智能研究院等單位，致力追尋人工智能的統(tǒng)一理論與認(rèn)知架構(gòu)，實(shí)現(xiàn)具有自主的感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行和社會(huì)協(xié)作能力，符合人類(lèi)情感、倫理與道德觀念的通用智能體。本研究從傳統(tǒng)AI的“數(shù)據(jù)驅(qū)動(dòng)”轉(zhuǎn)變?yōu)椤皟r(jià)值驅(qū)動(dòng)”，讓XAI系統(tǒng)理解了人類(lèi)價(jià)值觀，朝著通用人工智能邁出了一大步。

來(lái)源：圖靈人工智能作者：東周

參考：AI智勝未來(lái)

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

蘋(píng)果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計(jì)算 AI 智能計(jì)算深圳 | 2024-07-30

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

萬(wàn)家樂(lè)JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬(wàn)家樂(lè) | 2013-01-17

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統(tǒng)

智能計(jì)算 Meta AI | 2024-07-31

AI+機(jī)器視覺(jué)成趨勢(shì)，圖文詳解N大應(yīng)用場(chǎng)景

智能計(jì)算安森美 AI 機(jī)器視覺(jué) | 2024-07-31

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

海聯(lián)達(dá)（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

國(guó)際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

釋說(shuō)芯語(yǔ)16：硬科技：構(gòu)建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機(jī)器人 | 2021-02-26

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

WTC-AI型太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

如何快速搭建手寫(xiě)體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫(xiě)體識(shí)別 | 2022-07-29

WTC-AI太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

CSR8670CSR8675智能語(yǔ)音Alexa藍(lán)牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺(tái)電腦... 一臺(tái)來(lái)創(chuàng)建AI... 一臺(tái)來(lái)模擬AI... 一臺(tái)來(lái)運(yùn)行AI”

智能計(jì)算 AI | 2024-07-31

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區(qū)

<strong id="1vyqq"><strike id="1vyqq"></strike></strong>

<meter id="1vyqq"><dfn id="1vyqq"><pre id="1vyqq"></pre></dfn></meter>