AI 幫忙找 Bug ,英特爾開源代碼編程工具 ControlFlag
整理 | 孫勝
出品 | CSDN
近日,英特爾開源了自動(dòng)代碼調(diào)試工具 ControlFlag 源代碼,ControlFlag 源碼現(xiàn)在可通過 GitHub 獲得。
據(jù)了解,ControlFlag 可用來幫助更多開發(fā)者自主檢測代碼錯(cuò)誤,主要利用 AI 自動(dòng)識(shí)別軟件和固件代碼中的錯(cuò)誤,為開發(fā)人員節(jié)省手動(dòng)調(diào)試時(shí)間。
據(jù)悉,英特爾于去年年底首次宣布 ControlFlag,目前該系統(tǒng)只有英特爾內(nèi)部人員使用,用來自動(dòng)檢測軟件開發(fā)過程中的異常情況。
來源于網(wǎng)絡(luò)
減少代碼調(diào)試時(shí)間與成本支出
由于代碼調(diào)試對(duì)于程序開發(fā)至關(guān)重要,幾乎所有的大型軟件都需要調(diào)試,才能最大程度上避免軟件出錯(cuò)。
但是對(duì)于絕大多數(shù)開發(fā)人員來說,這個(gè)過程不僅非常耗時(shí),而且大部分調(diào)試只能手工作業(yè)。因?yàn)樾迯?fù)一個(gè)軟件缺陷可能需要幾天、幾周甚至幾個(gè)月的時(shí)間,據(jù)估計(jì),多達(dá) 50% 的軟件開發(fā)時(shí)間浪費(fèi)在調(diào)試程序上。這是因?yàn)榇蠖鄶?shù)錯(cuò)誤都需要語義分析來識(shí)別、評(píng)估根本原因,即使是最先進(jìn)的調(diào)試系統(tǒng)也無法有效地執(zhí)行這種分析。
英特爾實(shí)驗(yàn)室首席人工智能科學(xué)家 Justin Gottschlich 也表示:“盡管在過去的幾十年里,研究自動(dòng)化調(diào)試方面取得了部分進(jìn)展,但現(xiàn)有工具仍無法完美發(fā)現(xiàn)日益復(fù)雜的軟件錯(cuò)誤。這也是調(diào)試仍然主要由人為驅(qū)動(dòng)的過程的一個(gè)關(guān)鍵原因?!?/p>
除此之外,調(diào)試代碼的預(yù)算支出也很高。據(jù)英特爾官方介紹,2020 年 IT 行業(yè)在與調(diào)試代碼相關(guān)的環(huán)節(jié)上大約花費(fèi)了 2 萬億美元,約占 IT 平均預(yù)算的一半。
“超能的” ControlFlag
據(jù)悉,該系統(tǒng)是英特爾機(jī)器編程研究 (MPR) 項(xiàng)目的一部分,該項(xiàng)目的總體目標(biāo)是通過自動(dòng)化有望將開發(fā)軟件所需的時(shí)間減少 1,000 倍。例如,Gottschlich 的團(tuán)隊(duì)正在研究的領(lǐng)域之一是最終擴(kuò)展 ControlFlag 的能力,以自動(dòng)修復(fù)它檢測到的錯(cuò)誤。
自去年推出以來,英特爾已在各種軟件系統(tǒng)上測試了該機(jī)器學(xué)習(xí)工具,并取得了可喜的成果?!爱?dāng)我們最初設(shè)計(jì)系統(tǒng)時(shí),我們沒有預(yù)料到它能夠發(fā)現(xiàn)高度復(fù)雜的缺陷,”英特爾實(shí)驗(yàn)室首席人工智能科學(xué)家 Justin Gottschlich 表示。“然而,鑒于其自我監(jiān)督的設(shè)計(jì),ControlFlag 能夠發(fā)現(xiàn)高度復(fù)雜、細(xì)微的軟件缺陷,甚至連我們這些構(gòu)建它的人都感到震驚?!?/p>
英特爾的團(tuán)隊(duì)通過使用一種“無監(jiān)督”的學(xué)習(xí)方法,以允許 ControlFlag 檢測更廣泛的存儲(chǔ)庫中的錯(cuò)誤。該系統(tǒng)從超過 10 億行未標(biāo)記的源代碼中學(xué)習(xí)編碼模式,使其能夠達(dá)到很高的準(zhǔn)確性,甚至可以適應(yīng)開發(fā)人員的風(fēng)格,以區(qū)分軟件異常和編程語言的風(fēng)格變化。
ControlFlag 適用于任何包含控制結(jié)構(gòu)的編程語言(如 C/C++),而且ControlFlag 能夠不斷地從未標(biāo)記的源代碼中學(xué)習(xí),隨著新數(shù)據(jù)的引入而 “進(jìn)化”,使自己變得更好。雖然它還不能自動(dòng)解決它所發(fā)現(xiàn)的代碼錯(cuò)誤,但該工具可以為開發(fā)人員提供了潛在的修改建議。
Justin Gottschlich 還表示,目前為止僅在兩個(gè)專有軟件存儲(chǔ)庫上使用 ControlFlag,就發(fā)現(xiàn)了生產(chǎn)質(zhì)量、已部署程序中的 300 多個(gè)缺陷。例如,去年 ControlFlag 在名為 Client URL (cURL) 的計(jì)算機(jī)軟件項(xiàng)目中檢測到代碼異常,該項(xiàng)目每天使用各種網(wǎng)絡(luò)協(xié)議傳輸數(shù)據(jù)超過 10 億次。在向 cURL 團(tuán)隊(duì)報(bào)告異常后,他們同意 ControlFlag 的發(fā)現(xiàn)并重新設(shè)計(jì)代碼以修補(bǔ)問題。
不斷進(jìn)步的 ControlFlag
隨著英特爾團(tuán)隊(duì)致力于開發(fā) ControlFlag,過去的一年也帶來了相當(dāng)多的學(xué)習(xí)點(diǎn)。Gottschlich 認(rèn)為,需要改進(jìn)的兩個(gè)關(guān)鍵領(lǐng)域是減少該工具報(bào)告的誤報(bào)數(shù)量,以及將更先進(jìn)的語義分析器集成到 ControlFlag 的推理中。
然而,作為一個(gè)將成為英特爾機(jī)器編程工具套件之一的系統(tǒng),ControlFlag 將繼續(xù)發(fā)展?!癈ontrolFlag 的進(jìn)步不太可能停止,”Gottschlich 強(qiáng)調(diào)?!斑@主要是因?yàn)殡S著軟件編程語言、硬件描述語言和計(jì)算設(shè)備的發(fā)展,ControlFlag 也需要發(fā)展以跟上它們的步伐。”
與此同時(shí),英特爾的 MPR 團(tuán)隊(duì)正在開展一些專注于簡化軟件開發(fā)的項(xiàng)目。例如,去年該公司還發(fā)布了一款與麻省理工學(xué)院實(shí)驗(yàn)室共同開發(fā)的工具,該工具可以研究代碼片段以了解軟件打算做什么。該系統(tǒng)稱為 MISIM(機(jī)器推斷代碼相似性),它使用預(yù)先存在的代碼目錄來理解新算法背后的意圖,并通過建議其他編程方法或提供使代碼更高效的選項(xiàng)來幫助工程師開發(fā)軟件。
Gottschlich 預(yù)計(jì) MISIM 有一天會(huì)與 ControlFlag 一起工作?!爱?dāng)正確想法融合在一起時(shí),我們設(shè)想了一個(gè)更強(qiáng)大的新系統(tǒng),該系統(tǒng)將能夠檢測 ControlFlag 目前可以檢測到的所有缺陷,以及由于潛在的復(fù)雜性而目前無法檢測到的數(shù)百種缺陷。”Gottschlich表示。
對(duì)此,你怎么看,歡迎留言評(píng)論。
參考鏈接:
https://www.zdnet.com/article/developers-intels-automated-debugging-tool-controlflag-is-now-open-source/
GitHub地址:
https://github.com/IntelLabs/control-flag
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。