程序員注意了!正確率高達(dá)83%,AI技術(shù)可準(zhǔn)確識(shí)別代碼的真實(shí)作者
Engadget最新報(bào)道稱,研究人員開(kāi)發(fā)出的一種新的算法,這種算法可以識(shí)別出一個(gè)程序的作者是誰(shuí)。
本文引用地址:http://cafeforensic.com/article/201808/390493.htm程序員在寫(xiě)程序時(shí)往往有著自己獨(dú)特的風(fēng)格,但是在尋找關(guān)于一個(gè)程序的作者時(shí),查看所有的代碼并不現(xiàn)實(shí)?,F(xiàn)在,也許沒(méi)有那個(gè)必要了。
研究人員已經(jīng)開(kāi)發(fā)出一種機(jī)器學(xué)習(xí)系統(tǒng),可以通過(guò)原始源代碼或編譯的二進(jìn)制文件對(duì)程序員進(jìn)行“去匿名化”。研究人員稱,該方法是訓(xùn)練一個(gè)算法來(lái)識(shí)別程序員的編碼結(jié)構(gòu),并基于它們的工作實(shí)例,使用這些算法來(lái)確定代碼樣本中的共同特征。
在使用Google's Code Jam結(jié)果的測(cè)試中,用這種AI識(shí)別的結(jié)果相對(duì)準(zhǔn)確,但并不是萬(wàn)無(wú)一失的,每個(gè)系統(tǒng)有600名程序員和8個(gè)樣本,該系統(tǒng)的正確率達(dá)到了83%。
這項(xiàng)技術(shù)對(duì)調(diào)查人員來(lái)說(shuō)可能是一個(gè)福音。這對(duì)識(shí)別惡意代碼或軟件的創(chuàng)建者時(shí)很有用,特別是當(dāng)肇事者試圖嫁禍其他人時(shí)。它也可能對(duì)抄襲代碼或者程序的案件有所幫助。
當(dāng)然,這個(gè)系統(tǒng)也可能是一種麻煩。雖然掩蓋代碼的真實(shí)來(lái)源是可行的,但這就可能難以實(shí)現(xiàn)真正的匿名代碼,利用這種AI技術(shù)就可以找到真正寫(xiě)代碼的人。
評(píng)論