OpenAI正式發(fā)布AI視頻生成工具Sora,Plus用戶每月可生成50條
12月10日消息,美國時(shí)間周一,OpenAI正式發(fā)布了其備受關(guān)注的人工智能視頻生成工具Sora。
本文引用地址:http://cafeforensic.com/article/202412/465339.htm這款工具的工作原理類似于OpenAI的圖像生成工具DALL-E:用戶只需輸入想要的場景描述,Sora即可生成高質(zhì)量視頻片段。此外,Sora還能夠根據(jù)靜態(tài)圖像生成相關(guān)視頻、擴(kuò)展已有視頻或填補(bǔ)視頻缺失的幀。這一功能讓Sora在視覺生成領(lǐng)域展現(xiàn)了強(qiáng)大的創(chuàng)造力。今年2月,Sora首次亮相,而OpenAI去年憑借ChatGPT的廣泛流行躍入公眾視野。
根據(jù)OpenAI在YouTube上的直播介紹,Sora將于今日正式向美國以及“國際上大多數(shù)國家”的用戶開放。不過,對(duì)于歐洲、英國及其他部分國家的上線時(shí)間,OpenAI尚未給出具體安排。
用戶可以生成分辨率高達(dá)1080p、時(shí)長最長20秒的視頻,并支持寬屏、豎屏和正方形等多種畫幅比例。此外,用戶還可以導(dǎo)入自己的素材,用于擴(kuò)展、重新混合或融合內(nèi)容,甚至直接從文本生成全新的視頻。
Sora將免費(fèi)提供給現(xiàn)有的ChatGPT Plus和Pro訂閱用戶,無需支付額外費(fèi)用;Plus用戶每月最多可生成50個(gè)480p視頻,而Pro用戶最多可生成500個(gè)。在直播中,OpenAI員工以及首席執(zhí)行官薩姆·奧特曼(Sam Altman)展示了Sora的多個(gè)功能亮點(diǎn),例如“混合”功能(可以將兩個(gè)場景按照用戶指令融合為一個(gè)視頻)以及生成可無限循環(huán)播放的視頻選項(xiàng)。
(圖注:ChatGPT Plus每月提供1000積分; ChatGPT Pro提供10000積分)
在正式推出之前,Sora主要供一小部分“紅隊(duì)”安全測試人員使用,這些測試人員幫助檢測模型在信息偏差和誤用方面的潛在風(fēng)險(xiǎn)。
10月時(shí),一些Reddit用戶向OpenAI高管詢問Sora的發(fā)布日期,并猜測延遲的原因是“推理計(jì)算和時(shí)間成本過高”或“出于安全考慮”。對(duì)此,OpenAI產(chǎn)品主管凱文·威爾(Kevin Weil)回應(yīng)稱:“我們需要完善模型,確保其在安全性、模擬能力及其他方面的表現(xiàn),同時(shí)擴(kuò)展計(jì)算能力!”
OpenAI的Sora產(chǎn)品負(fù)責(zé)人羅漢·薩海(Rohan Sahai)在直播中表示:“作為OpenAI,我們顯然承擔(dān)著巨大的責(zé)任?!彼a(bǔ)充道,公司必須防止該技術(shù)被非法使用,“但我們同樣希望實(shí)現(xiàn)創(chuàng)新與創(chuàng)意表達(dá)之間的平衡?!?/p>
今年10月,OpenAI完成了最新一輪融資,估值高達(dá)1570億美元,融資金額達(dá)到66億美元,并獲得了40億美元的循環(huán)信貸額度,使公司可支配流動(dòng)資金總額超過100億美元。
作為微軟支持的人工智能初創(chuàng)企業(yè),OpenAI正與眾多科技巨頭展開激烈競爭,包括亞馬遜及其支持的Anthropic、埃隆·馬斯克創(chuàng)辦的xAI,以及谷歌、Meta和微軟等。據(jù)預(yù)測,在未來十年內(nèi),生成式人工智能市場收入可能突破1萬億美元大關(guān)。
本月早些時(shí)候,OpenAI任命其首位首席營銷官,標(biāo)志著公司計(jì)劃在市場推廣方面增加投入,以進(jìn)一步拓展用戶基礎(chǔ)。此外,今年10月,OpenAI在ChatGPT中新增了搜索功能,使其能夠更好地與谷歌、必應(yīng)和Perplexity等搜索引擎競爭,并吸引更多用戶。
作為ChatGPT的開發(fā)者,OpenAI希望通過Sora在視頻生成領(lǐng)域與Meta和谷歌等公司展開直接競爭。谷歌今年1月推出了Lumiere,而其他初創(chuàng)公司也已發(fā)布了類似的人工智能工具,例如Stability AI的Stable Video Diffusion。此外,亞馬遜也推出了“Create with Alexa”,這是一款專注于生成基于提示的短片兒童動(dòng)畫內(nèi)容的模型。
隨著聊天機(jī)器人和圖像生成工具在消費(fèi)及商業(yè)領(lǐng)域的普及,視頻生成正成為生成式人工智能的下一個(gè)前沿領(lǐng)域。雖然這一技術(shù)為AI愛好者帶來了創(chuàng)造性的新機(jī)會(huì),但也引發(fā)了對(duì)錯(cuò)誤信息和深度偽造的擔(dān)憂。據(jù)機(jī)器學(xué)習(xí)公司Clarity數(shù)據(jù)顯示,AI生成的深度偽造視頻數(shù)量同比增長達(dá)900%。
OpenAI將多模態(tài)(文本、圖像和視頻生成的結(jié)合)作為其戰(zhàn)略目標(biāo)的一部分,以拓展人工智能工具的應(yīng)用場景。
在Sora發(fā)布之前,一些抗議者泄露了Sora的副本,表達(dá)對(duì)OpenAI對(duì)待藝術(shù)家方式的不滿。OpenAI的早期訪問計(jì)劃中包含了約300名藝術(shù)家,這些藝術(shù)家在11月底發(fā)表了一封公開信,批評(píng)OpenAI在透明度和對(duì)藝術(shù)界的支持方面做得不夠。
公開信中提到:“我們?cè)兄Z作為早期測試者、紅隊(duì)成員和創(chuàng)意合作伙伴參與Sora的開發(fā)。然而,我們感到自己被引導(dǎo)參與了一場‘藝術(shù)洗白’,旨在展示Sora是一個(gè)對(duì)藝術(shù)家有用的工具?!?/p>
信中指出,數(shù)百名藝術(shù)家為Sora提供了大量無償勞動(dòng),通過漏洞測試和反饋推動(dòng)了模型開發(fā)?!氨M管如此,只有少數(shù)人能通過競爭脫穎而出,他們的Sora創(chuàng)作作品得以公開放映,但所獲得的回報(bào)與OpenAI的公關(guān)和營銷價(jià)值相比微不足道?!?/p>
公開信指出:“我們并不反對(duì)將人工智能技術(shù)用作藝術(shù)創(chuàng)作的工具(如果反對(duì),我們可能根本不會(huì)被邀請(qǐng)參加這個(gè)項(xiàng)目)。但我們不認(rèn)同該藝術(shù)家項(xiàng)目的推出方式,以及這一工具在可能公開發(fā)布前的發(fā)展方向。我們公開這一情況,是希望OpenAI能變得更加開放,更加友好地對(duì)待藝術(shù)家,并真正支持藝術(shù)的發(fā)展,而不是將其僅作為公關(guān)宣傳的手段。”
對(duì)此,OpenAI在11月下旬發(fā)表聲明回應(yīng)稱:“數(shù)百名藝術(shù)家對(duì)Sora的開發(fā)作出了重要貢獻(xiàn),幫助我們確定了功能開發(fā)的優(yōu)先級(jí),并改進(jìn)了安全措施。參與完全是自愿的,我們也未要求提供反饋或使用工具。我們很高興能夠?yàn)檫@些藝術(shù)家提供免費(fèi)訪問的機(jī)會(huì),并將繼續(xù)通過贈(zèng)款、活動(dòng)及其他項(xiàng)目為他們提供支持。”
以下為OpenAI發(fā)布Sora的官方博客文章全文:
我們的視頻生成模型現(xiàn)已從研究預(yù)覽階段推向市場,并已在sora.com正式上線。
今年早些時(shí)候,我們推出了Sora——一款能夠通過文本生成逼真視頻的人工智能模型,同時(shí)分享了我們?cè)谑澜缒M領(lǐng)域的初步研究成果。Sora是開發(fā)能與物理環(huán)境交互的人工智能模型的重要基礎(chǔ),標(biāo)志著這一領(lǐng)域邁出了關(guān)鍵一步。
我們?nèi)掳l(fā)布的升級(jí)版Sora Turbo,其速度顯著超過了2月份發(fā)布的預(yù)覽版。今天,這款獨(dú)立產(chǎn)品已在sora.com上線,并向ChatGPT Plus和Pro用戶開放使用。
全新設(shè)計(jì)的Sora界面
我們?yōu)镾ora設(shè)計(jì)了一系列新功能,這些功能在此前的技術(shù)報(bào)告中已初步提及。
現(xiàn)在,用戶可以生成分辨率高達(dá)1080p、時(shí)長最長20秒的視頻,并支持寬屏、豎屏和正方形等多種畫幅比例。此外,用戶還可以導(dǎo)入自己的素材,用于擴(kuò)展、重新混合或融合內(nèi)容,甚至直接從文本生成全新的視頻。
全新的界面設(shè)計(jì)讓用戶可以更方便地通過文本、圖像或視頻提示使用Sora。同時(shí),我們的故事板工具允許用戶精確控制每一幀的輸入內(nèi)容。此外,我們還推出了“特色板塊”和“最新動(dòng)態(tài)”,展示社區(qū)創(chuàng)作者的優(yōu)秀作品并持續(xù)更新。
OpenAI Sora官方使用指南 (來源:網(wǎng)易科技報(bào)道)
Sora的訂閱服務(wù)與可用性
Sora已納入ChatGPT Plus訂閱中,用戶無需支付額外費(fèi)用。每月最多可生成50個(gè)視頻,分辨率為480p,或更少數(shù)量的720p視頻。
對(duì)于更高需求的用戶,ChatGPT Pro訂閱提供10倍的使用額度,同時(shí)支持更高的分辨率和更長的視頻時(shí)長。此外,我們正在為不同類型用戶開發(fā)個(gè)性化的定價(jià)方案,預(yù)計(jì)將于明年初推出。
技術(shù)部署與限制
目前推出的Sora版本在一些方面仍存在限制。例如,它可能生成不符合現(xiàn)實(shí)的物理效果,并在處理復(fù)雜動(dòng)作時(shí)表現(xiàn)不足。盡管Sora Turbo相比2月份的預(yù)覽版速度快了很多,但我們?nèi)栽谂档图夹g(shù)成本,讓更多用戶可以負(fù)擔(dān)得起并輕松使用。
我們決定在此階段推出視頻生成技術(shù),是希望社會(huì)各界能有時(shí)間探索其潛力,并共同制定規(guī)范和安全保障措施,以確保技術(shù)在未來能夠被負(fù)責(zé)任地應(yīng)用。
所有通過Sora生成的視頻均嵌入了C2PA元數(shù)據(jù),用于標(biāo)識(shí)內(nèi)容來源并提供透明度。這些元數(shù)據(jù)還可用于驗(yàn)證視頻的真實(shí)性。盡管當(dāng)前技術(shù)尚不完美,我們已默認(rèn)添加了多項(xiàng)保護(hù)措施,例如可見水印。同時(shí),我們開發(fā)了一個(gè)內(nèi)部搜索工具,通過生成內(nèi)容的技術(shù)屬性來輔助驗(yàn)證其是否源自Sora。
目前,我們已屏蔽了一些嚴(yán)重濫用形式,例如兒童性虐待材料和深度偽造內(nèi)容。發(fā)布初期,涉及人物的上傳功能將受到限制,但隨著深度偽造緩解措施的改進(jìn),我們計(jì)劃逐步向更多用戶開放這一功能。
我們希望這個(gè)早期版本的Sora能夠激發(fā)用戶的創(chuàng)造力,讓他們探索新的敘事形式,講述自己的故事,并不斷擴(kuò)展視頻敘事的可能性。我們期待著見證Sora如何塑造全新的創(chuàng)作世界。
評(píng)論