IEEE:識(shí)別深度偽造
僅在2024年上半年,IEEE Xplore數(shù)字圖書館就發(fā)表了300多篇專注于為深度偽造創(chuàng)建檢測(cè)工具的文章。
IEEE高級(jí)會(huì)員Aiyappan Pillai表示:“在人工智能使深度造假算法能夠制造出更難檢測(cè)的贗品的同時(shí),人工智能檢測(cè)技術(shù)也在通過采用不同的技術(shù)和算法來識(shí)別偽造品?!?/span>
什么是深度偽造?
深度偽造一詞是兩個(gè)術(shù)語的混合: 深度學(xué)習(xí)和偽造。深度偽造是人工智能生成的逼真視頻、音頻片段或靜止圖像,描繪了真實(shí)的人做或說他們沒有做過提過的事情。近年來,這種深度偽造出現(xiàn)在了政治領(lǐng)域,同時(shí)也影響了娛樂界。深度偽造可能會(huì)通過模仿流行音樂行為的歌曲來擾亂娛樂經(jīng)濟(jì),而這些歌曲通常未經(jīng)表演者授權(quán)。
新興檢測(cè)方法
目前存在兩大類技術(shù)用于識(shí)別深度偽造,并且已經(jīng)進(jìn)行了大量研究來確定它們的工作效果。
· 機(jī)器學(xué)習(xí): 識(shí)別深度偽造的一種方法是向機(jī)器學(xué)習(xí)模型提供大量深度偽造和真實(shí)內(nèi)容,以便它能夠?qū)W習(xí)發(fā)現(xiàn)它們之間的差異。這些技術(shù)可能根本不涉及機(jī)器視覺。相反,它們將圖像轉(zhuǎn)換為數(shù)據(jù),并從其模式中學(xué)習(xí)。如果一個(gè)新的深度偽造與訓(xùn)練的數(shù)據(jù)有顯著差異,那么這種方法的一個(gè)挑戰(zhàn)可能是難以識(shí)別它。
· 語義分析: 與依賴原始數(shù)據(jù)的機(jī)器學(xué)習(xí)方法相比,語義分析使用與幫助人工智能系統(tǒng)識(shí)別圖片中的蘋果或書籍相同的機(jī)器視覺技術(shù)來查看圖像的內(nèi)容和上下文。這些方法可以分析說話者面部的血流模式、頭部的形狀,或者他們的外表是否隨著時(shí)間的推移而保持一致。語義分析還涵蓋了沒有意義的對(duì)象之間的關(guān)系。例如,想象一個(gè)浴室的建筑渲染。人工智能生成的圖像可能會(huì)將淋浴頭放置在無法正常使用的位置。
數(shù)字水印
識(shí)別深度偽造的需要導(dǎo)致一些生成性人工智能公司為此目的創(chuàng)建標(biāo)記。在某些情況下,用戶可以看到這些標(biāo)記;在其他情況下則相反。
IEEE高級(jí)會(huì)員Rahul Vishwakarma說:“檢測(cè)深度偽造最有效的技術(shù)之一是使用生成式AI平臺(tái)對(duì)生成的圖像進(jìn)行數(shù)字水印?!?/span>
偏見問題
大約有五六個(gè)常用的數(shù)據(jù)集——人的視頻和圖像——被用來訓(xùn)練深度學(xué)習(xí)模型來檢測(cè)深度偽造。一個(gè)數(shù)據(jù)集完全由名人組成。研究人員面臨的一個(gè)挑戰(zhàn)是,這些數(shù)據(jù)集中的人更有可能是白人和男性。這引發(fā)了人們對(duì)深度偽造檢測(cè)工具在面對(duì)來自不同背景的人的數(shù)據(jù)時(shí)是否會(huì)遇到困難的質(zhì)疑。
人類或許表現(xiàn)更好嗎?
雖然深度偽造是真實(shí)的,但人類可以發(fā)現(xiàn)它們。最近發(fā)表在IEEE Privacy & Security上的一項(xiàng)研究將人類與機(jī)器對(duì)立起來。研究人員發(fā)現(xiàn),平均而言,人類能夠識(shí)別大約71%的深度偽造,而尖端的檢測(cè)方法能夠識(shí)別93%。
然而,一些深度偽造圖像欺騙了檢測(cè)算法,但人類能夠發(fā)現(xiàn)騙局。
有些人比其他人更善于發(fā)現(xiàn)深度偽造,但研究人員才剛剛開始研究原因。在另一項(xiàng)研究中,研究人員考察了警察和“超級(jí)識(shí)別者(super-recognizers)”檢測(cè)深度假貨的能力。超級(jí)識(shí)別者的能力得到了實(shí)驗(yàn)室的認(rèn)證,他們是真正擅長(zhǎng)識(shí)別和辨認(rèn)人臉的人。研究表明,超級(jí)識(shí)別者在識(shí)別深度偽造方面并不比普通人好。這表明,能夠判斷某物是否是深度偽造與善于識(shí)別人臉不同。
評(píng)論