IBM聲稱深度學(xué)習(xí)取得重大突破 大幅降低處理時間
IBM一直在努力促使計算機(jī)變得更智能化、更人性化。本周該公司宣布,已經(jīng)開發(fā)出一種技術(shù),可以大幅縮短處理海量數(shù)據(jù)并得出有用結(jié)論的時間。
本文引用地址:http://cafeforensic.com/article/201708/362766.htmIBM使用的“深度學(xué)習(xí)”技術(shù)是人工智能(AI)的一個分支,可模仿人腦的工作原理。它也是微軟、Facebook、亞馬遜和谷歌的重大關(guān)注焦點(diǎn)。
IBM的目標(biāo)是將深度學(xué)習(xí)系統(tǒng)消化數(shù)據(jù)所需要的時間從數(shù)天縮短到數(shù)小時。IBM研究所的IBM研究員和系統(tǒng)加速及記憶主管希拉里·亨特(Hillery Hunter)說,這些改進(jìn)可以幫助放射學(xué)家更快、更準(zhǔn)確地找到病變部位,并讀取大量醫(yī)學(xué)圖像。
到目前為止,深度學(xué)習(xí)主要是在單一服務(wù)器上運(yùn)行的,因?yàn)樵诓煌嬎銠C(jī)之間移動大量數(shù)據(jù)的過程太過復(fù)雜。而且,如何在許多不同服務(wù)器和處理器之間保持?jǐn)?shù)據(jù)同步也是一個問題。
IBM在周二的公告中說,已經(jīng)開發(fā)出了能夠?qū)⑦@些任務(wù)分配到64臺服務(wù)器的軟件,這些服務(wù)器總共有256個處理器,可在速度方面取得巨大飛躍。凡是擁有IBM Power系統(tǒng)服務(wù)器的用戶,以及其他想要測試的技術(shù)人員,均可獲得這項(xiàng)技術(shù)。
IBM使用了64個自主開發(fā)的Power 8服務(wù)器,每一個都將通用的英特爾微處理器和英偉達(dá)圖形處理器連接起來,并使用快速的NVLink連接,以促進(jìn)兩種芯片之間的數(shù)據(jù)流傳輸。
在此之上,IBM采用了技術(shù)人員所說的集群技術(shù)來管理所有這些移動部件。集群技術(shù)可在給定服務(wù)器的多個處理器和其他63個服務(wù)器中的處理器之間充當(dāng)通信警察。
如果流量管理不正確,一些處理器就會閑置,處于“吃不飽”的狀態(tài)。每個處理器都有自己的數(shù)據(jù)集,同時還需要來自其他處理器的數(shù)據(jù),以獲得更大的圖像。亨特解釋說,如果處理器不同步,它們就學(xué)不到任何東西。
亨特告訴《財富》雜志:“我們的想法是改變你訓(xùn)練深度學(xué)習(xí)模式的速度,并真正提高你的工作效率。”
亨特說,將深度學(xué)習(xí)從一個帶有8個處理器的服務(wù)器擴(kuò)展到64個服務(wù)器,每個服務(wù)器有8個處理器,可以將性能提高50-60倍。
Pund-IT公司創(chuàng)始人查爾斯·金(Charles King)對IBM的項(xiàng)目印象深刻,他說后者已經(jīng)找到了一種“擴(kuò)大”系統(tǒng)的方法,額外增加的處理器能提高性能。
例如,在理論上,將處理器擴(kuò)容100%應(yīng)該獲得100%的性能提升。但實(shí)際上,由于復(fù)雜的管理和連接問題,這種效益永遠(yuǎn)不會發(fā)生。
但I(xiàn)BM稱,其系統(tǒng)通過由加州大學(xué)伯克利分校創(chuàng)建的“咖啡因”深度學(xué)習(xí)框架,在256個處理器之間實(shí)現(xiàn)了95%的擴(kuò)展效率。之前的記錄是由Facebook人工智能研究公司創(chuàng)造的,擴(kuò)展效率達(dá)到了89%。
“IBM最新95%的擴(kuò)展效率似乎太好了,不可能是真的,”帕特里克·莫海德(Patrick Moorhead)說,他是德克薩斯州奧斯丁市一家研究公司的總裁和創(chuàng)始人。
IBM表示,在圖像識別方面,IBM系統(tǒng)再次使用了“咖啡因”框架,在7個小時內(nèi)識別了750萬張圖片,準(zhǔn)確率達(dá)到了33.8%。微軟之前的記錄是29.8%,而達(dá)到這一準(zhǔn)確率花了10天時間。
用外行人的話來說,IBM聲稱已經(jīng)開發(fā)出了比現(xiàn)有深度學(xué)習(xí)技術(shù)更快、更精確的技術(shù)。當(dāng)然,它還需要使用IBM的Power系統(tǒng)硬件和集群軟件。
除了“咖啡因”框架,IBM還表示,流行的谷歌TensorFlow框架同樣可以在這種新技術(shù)上運(yùn)行。莫海德說,值得注意的是,IBM在運(yùn)用自己在高性能計算方面的專業(yè)知識,同時,也采納諸如Tensorflow和“咖啡因”之類的外部資源,這種做法有助于該項(xiàng)技術(shù)更廣泛地適用于一系列深度學(xué)習(xí)應(yīng)用。
評論