麻省理工證實:大數(shù)據(jù)時代,閃存和RAM一樣快!
就高速數(shù)據(jù)處理而論,RAM通常用于存儲正在使用的數(shù)據(jù),它比從傳統(tǒng)磁盤提取數(shù)據(jù)的速度要快數(shù)萬倍,比NAND閃存的速度也快很多倍。 而麻省理工學(xué)院(MIT)研究人員構(gòu)建了一個服務(wù)器網(wǎng)絡(luò)證明——對于大數(shù)據(jù)應(yīng)用,閃存和RAM一樣快,而且便宜很多。
本文引用地址:http://cafeforensic.com/article/277454.htm在這個大數(shù)據(jù)時代,海量數(shù)據(jù)集用于揭示千百萬人的購買趨勢或預(yù)測還有基于千萬個數(shù)據(jù)點的金融市場趨勢,單一電腦的RAM是無法負荷的。
例如,處理一個人的基因組的數(shù)據(jù),需要40到100臺標(biāo)準(zhǔn)計算機。而另一個可選項NAND閃存,它的價格大約是RAM的十分之一,消耗功率也是它的十分之一。上個月,在計算機體系結(jié)構(gòu)國際會議(International Symposium on Computer Architecture)上,麻省理工學(xué)院研究人員展示了一個新的系統(tǒng),證實閃存和傳統(tǒng)RAM一樣高效,而且還能降低功率和硬件成本。
“比如,我們需要購買一個系統(tǒng)來處理10TB大的數(shù)據(jù)集。在DRAM中處理它,假設(shè)服務(wù)器有100GB內(nèi)存的DRAM,我們就需要一組大約100臺電腦集群?!?Arvind Mithal,麻省理工學(xué)院計算機科學(xué)與工程約翰遜講座教授在郵件中回復(fù)說,“這樣一個集群創(chuàng)建需要大約400000美元。”
每一臺服務(wù)器連接到一個可模擬不同電路的現(xiàn)場可編程網(wǎng)關(guān)陣列(field-programmable gate array或FPGA),每一個FPGA依次連接到2個500GB的閃存芯片和2個其他距離最近的FPGA。
因為彼此相互連接,F(xiàn)PGA成為了一個快速網(wǎng)絡(luò),允許任何服務(wù)器從每一個閃存驅(qū)動器存取數(shù)據(jù),而這些FPGA也能控制閃存驅(qū)動器。
Arvind還表示,同樣在閃存中處理10TB數(shù)據(jù)集,只需要10臺電腦——每臺需要1TB閃存容量。即便包括基于FPGA加速器硬件成本,這個系統(tǒng)的總成本也不會超過大概70000美元?!叭绻覀兛紤]到基于閃存的系統(tǒng)中,每一臺服務(wù)器上不需要同樣多的DRAM這個事實,價格可能還會進一步降低。” Arvind稱,“如果我們使用配置較少DRAM的低端服務(wù)器,該系統(tǒng)花費大約是40000美元?!?/p>
而維護一個基于閃存的系統(tǒng)費用顯然更便宜,他繼續(xù)說道,因為閃存比DRAM消耗更小的功率并且所需的服務(wù)器也相對較少。就算將閃存和FPGA加速器因素的額外功耗也算在內(nèi),麻省理工學(xué)院的服務(wù)器網(wǎng)絡(luò)標(biāo)準(zhǔn)顯示閃存存儲設(shè)備也僅僅是增加了大約10%的功耗到整個系統(tǒng)。
實際上,即使沒有他們的新網(wǎng)絡(luò)結(jié)構(gòu),研究人員指出如果做分布式計算的服務(wù)器使用磁盤驅(qū)動器來獲取數(shù)據(jù)只需要該時間的5%,和使用閃存時的性能相同。
例如,配置10TB RAM的40臺服務(wù)器處理一個10.5TB的計算,也不比配置20TB閃存的20臺服務(wù)器快。而閃存不但成本較少,也只損耗一小部分功率。
通過將服務(wù)器的一些計算能力移到閃存驅(qū)動器的控制芯片上,研究人員就能制作一個可與基于RAM服務(wù)器媲美的20臺基于閃存的服務(wù)器網(wǎng)絡(luò)。
他們在將數(shù)據(jù)傳遞回服務(wù)器之前,使用閃存驅(qū)動器對其進行預(yù)處理,增大了分布式計算的效率。
“這并非是要取代DRAM之類的東西?!?Arvind表示,他和一組研究生和研究員在廣達電腦公司完成了這項工作。該調(diào)查表明可能有許多應(yīng)用能夠取代RAM,而且使用一個基于閃存的電腦架構(gòu)費用較低。
“每一個人都在實驗閃存的不同方面。我們只是嘗試從另一個角度著手。” Arvind如是說。
評論