RAID內(nèi)存:回寫技術(shù)和熱插拔容量技術(shù)
本內(nèi)容總結(jié)了工作中RAID內(nèi)存的經(jīng)驗教訓(xùn)。下面分別介紹了在HP的熱插拔技術(shù)中應(yīng)用到的兩個小技術(shù),它們就是回寫(Scrubbing)技術(shù)和熱插拔容量(Hot-Plug Capabilities)技術(shù)。
HP熱插拔RAID內(nèi)存提供了一個回寫硬件方式,它可以確認ECC或RAID檢查出來的軟錯誤。HP技術(shù)嘗試定位于在讀內(nèi)存時檢查出來所有軟錯誤,方法是把改正后的正確的數(shù)據(jù)寫回內(nèi)存中去。但此方法不適用于硬錯誤。
回寫技術(shù)可以阻止軟錯誤的累積,避免發(fā)生更嚴重的錯誤。它降低了ECC的工作量,提高了系統(tǒng)的性能。一些傳統(tǒng)的系統(tǒng)采用的是軟件回寫,HP熱插拔RAID內(nèi)存使用硬件完成這個工作。
HP熱插拔RAID內(nèi)存會對錯誤生成錯誤日志,錯誤極限由軟件設(shè)定。當記錄的錯誤值達到錯誤極限的時候,軟件會自動做出反應(yīng)。例如,當超過錯誤極限的時候故障燈會自動亮,這就是由軟件控制的。
熱插拔容量(Hot-Plug Capabilities)技術(shù)
HP熱插拔RAID內(nèi)存還允許用戶在不關(guān)閉服務(wù)器電源的情況下在線更換、在線擴展及在線升級DIMM,這就是HP的熱插拔容量技術(shù)。
在線更換是指在系統(tǒng)運行的情況下更換出現(xiàn)故障的DIMM。HP熱插拔RAID內(nèi)存不需要操作系統(tǒng)的支持,服務(wù)器在購買的時候就具有支持在線更換的能力。在線擴展指用戶在空的插槽上插入DIMM以擴展系統(tǒng)容量。在線升級是指用戶用容量更大的DIMM替代舊的較小容量的DIMM。在線擴展和在線升級都可以使用戶獲得更大的系統(tǒng)內(nèi)存容量。在線擴展和在線升級要求操作系統(tǒng)的支持,系統(tǒng)要認出新增的內(nèi)存。
當在線內(nèi)存操作完成后,如果工作在熱插拔RAID內(nèi)存模式下,那么系統(tǒng)會自動在所有的內(nèi)存盒中重新放置數(shù)據(jù)(rebuild)。雖然這樣做會暫時降低內(nèi)存的工作性能(重新放置4 GB的數(shù)據(jù)花費的時間少于30s),但是只需要花費很少的錢就可以提高容錯能力,并可避免系統(tǒng)檢修期間帶來的經(jīng)濟損失。
評論