SAF-TE技術(shù)在磁盤(pán)陣列背板中的實(shí)現(xiàn)
摘 要:在磁盤(pán)陣列中,一般使用背板方式連接硬盤(pán),這樣服務(wù)器可在不關(guān)機(jī)的情況下直接更換損壞的硬盤(pán)。在背板設(shè)計(jì)中采用SAF-TE監(jiān)控技術(shù)不僅可以隨時(shí)監(jiān)控硬盤(pán)的好壞、對(duì)損壞的硬盤(pán)提供LED指示并報(bào)警,同時(shí)還可以實(shí)現(xiàn)對(duì)系統(tǒng)風(fēng)扇、溫度及電壓的實(shí)時(shí)監(jiān)控。本文將以SAF-TE控制器GEM318為例,介紹其在曙光2U服務(wù)器硬盤(pán)熱插拔背板設(shè)計(jì)中的具體應(yīng)用。
關(guān)鍵詞:SAF-TE;GEM318;I2C;PCB布線(xiàn)
SAF-TE控制技術(shù)
SAF-TE(SCSI Accessed Fault-Tolerant Enclosure) 是Intel公司提出的一種標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)定義了一組命令,這些命令可用于設(shè)置RAID陣列和獲得陣列中磁盤(pán)的狀態(tài)信息,并在實(shí)現(xiàn)對(duì)熱插拔磁盤(pán)進(jìn)行管理的同時(shí),為用戶(hù)提供磁盤(pán)陣列的環(huán)境狀態(tài)信息。這樣就在主機(jī)、RAID控制器、存儲(chǔ)設(shè)備、背板、電源及其它設(shè)備間建立了有效的通信途徑。
與以往的背板相比,采用SAF-TE控制技術(shù)的熱插拔背板,具有以下優(yōu)點(diǎn):可進(jìn)行驅(qū)動(dòng)器狀況監(jiān)控并在熱插拔底板上顯示磁盤(pán)驅(qū)動(dòng)器的狀態(tài)信息。這就允許客戶(hù)快速地確認(rèn)并更換一個(gè)已經(jīng)無(wú)效的或者可能有故障的磁盤(pán)驅(qū)動(dòng)器。在更換了損壞的硬盤(pán)后,RAID的重建可自動(dòng)進(jìn)行,而無(wú)須再經(jīng)手動(dòng)操作RAID控制器來(lái)完成。在硬盤(pán)的恢復(fù)過(guò)程中,不影響系統(tǒng)的服務(wù)。如果沒(méi)有SAF-TE,自動(dòng)重建工作只能是在有備用磁盤(pán)存在的情況下方可完成。由于不需在陣列中放置備用磁盤(pán),使用SAF-TE可實(shí)現(xiàn)磁盤(pán)陣列中適用磁盤(pán)數(shù)量的最大化。
電路設(shè)計(jì)
GEM318 是一款低成本、自完備的熱插拔硬盤(pán)背板管理控制器,只需簡(jiǎn)單的外圍器件就可實(shí)現(xiàn)SAF-TE管理功能。由于其低成本和小封裝的特點(diǎn),使其成為1U和2U服務(wù)器節(jié)點(diǎn)背板設(shè)計(jì)中首選的解決方案。
硬件電路設(shè)計(jì)
GEM318具有LVDS接口,作為SCSI的一個(gè)目標(biāo)設(shè)備存在,并占一個(gè)ID號(hào),支持SAF-TE 1.0規(guī)范。具有一個(gè)I2C接口,當(dāng)工作在主方式下,可以讀取外部的溫度傳感器LM75和NVRAM AT24C01里面的組態(tài)數(shù)據(jù)。最多支持8個(gè)SCSI設(shè)備,具有8個(gè)LED控制引腳。支持兩個(gè)LM75溫度傳感器,具體設(shè)計(jì)電路如圖1所示。
硬盤(pán)插拔檢測(cè)
該背板支持6塊SCSI硬盤(pán),所以只需將GEM318的DEV_INS5~0這6個(gè)引腳分別連接到背板上6個(gè)SCSI插槽的MATED引腳即可。該引腳正常為高電平,當(dāng)某個(gè)槽中有硬盤(pán)插入時(shí),硬盤(pán)的MATED引腳會(huì)將相應(yīng)的DEV_INS引腳電平拉低。這樣,GEM318就依此來(lái)判斷每個(gè)SCSI插槽上硬盤(pán)的插拔狀態(tài)。
當(dāng)GEM318檢測(cè)到某個(gè)DEV_INS引腳出現(xiàn)由高到低的電平跳變后,會(huì)立即使能SCSI總線(xiàn)上的復(fù)位信號(hào),使得SCSI設(shè)備處于復(fù)位狀態(tài)(如圖2所示)。這樣就有效的“屏蔽”了硬盤(pán)插入瞬間對(duì)SCSI總線(xiàn)信號(hào)的干擾,從而保證了SCSI總線(xiàn)信號(hào)的可靠性傳輸。
故障報(bào)警及LED指示
GEM318可以把SAF-TE命令寄存器記錄的錯(cuò)誤信息及時(shí)傳遞給報(bào)警輸出引腳FAULT_IN。這樣,GEM318就可隨時(shí)把出錯(cuò)信息以聲光報(bào)警的方式通知給用戶(hù)。
設(shè)計(jì)中將溫度、風(fēng)扇和電壓檢測(cè)電路的邏輯輸出,通過(guò)7411三輸入與門(mén)芯片輸出給GEM318的外部故障輸入引腳G_ALARM(低電平有效),以實(shí)現(xiàn)監(jiān)控盤(pán)陣工作環(huán)境的目的。
LED7~0輸出引腳用來(lái)驅(qū)動(dòng)外部的LED,分別顯示相對(duì)應(yīng)的硬盤(pán)狀態(tài)信息。
LVDS信號(hào)接口與ID設(shè)置
GEM318支持LVDS信號(hào)接口方式,LVDS是電流驅(qū)動(dòng)模式,350mV的低電壓擺幅可以提供幾百兆比特的信號(hào)傳輸率。使用差分傳輸?shù)姆绞娇梢允闺姶鸥蓴_互相抵消,消除共模噪聲,減少EMI。
GEM318有兩個(gè)ID可選:ID6或ID8。目的是為了當(dāng)盤(pán)陣中一個(gè)SCSI通道的硬盤(pán)數(shù)超過(guò)8時(shí),可采用兩個(gè)GEM318。設(shè)計(jì)時(shí)將GEM318的ID_ON1+/ID_ON1- 連到SCSI總線(xiàn)上的DB6+/DB6-,將GEM318的ID號(hào)設(shè)為6。
通過(guò)硬件電路跳線(xiàn)和NVRAM組態(tài)GEM318
GEM318具有很大的設(shè)計(jì)靈活性,可以在上電時(shí)通過(guò)讀取輸出引腳的電平狀態(tài)和NVRAM中的數(shù)據(jù)來(lái)配置GEM318的特性。
LED7~0引腳在系統(tǒng)上電時(shí),在GEM318的RESET信號(hào)有效期間作為輸入引腳使用。要求RESET信號(hào)至少要保持5個(gè)時(shí)鐘周期。
LED7~0上電初期的引腳電平設(shè)計(jì)時(shí)由上拉或下拉電阻決定,此期間要求驅(qū)動(dòng)LED顯示的供電電源LED_VDD暫停供電,以便GEM318能讀到準(zhǔn)確的低電平信息。LED_VDD延遲上電的時(shí)間t可通過(guò)調(diào)整C31和R22的值來(lái)決定。設(shè)計(jì)電路如圖3所示,電源時(shí)序如圖4所示。
設(shè)計(jì)時(shí)NVRAM選用的是AT24C01,上電時(shí)GEM318將從AT24C01的40H存儲(chǔ)單元讀取信息。通過(guò)對(duì)AT24C01編程可設(shè)置以下選項(xiàng):Slot的數(shù)目,每個(gè)Slot的SCSI ID號(hào),設(shè)置溫度傳感器的數(shù)目及溫度報(bào)警上下限值等。
串行通信設(shè)計(jì)
GEM318的串行通信接口兼容I2C規(guī)范,即可工作在主方式下也可工作在從方式下。工作在主方式下時(shí)可支持多主競(jìng)爭(zhēng),在背板設(shè)計(jì)上預(yù)留了I2C插針,這就為外部的控制設(shè)備訪(fǎng)問(wèn)盤(pán)陣信息提供了可能。當(dāng)工作在從方式下時(shí),GEM318有兩個(gè)從地址可選。設(shè)計(jì)時(shí)將ID_ON1接到SCSI總線(xiàn)上,把GEM318的從地址設(shè)為E1H。如果將ID_ON0接到總線(xiàn)則從地址為E3H。
PCB設(shè)計(jì)
背板要求支持320Mbps的SCSI總線(xiàn)傳輸速率,SCSI總線(xiàn)采用LVDS信號(hào)傳輸技術(shù),為保證信號(hào)的可靠傳輸,PCB布線(xiàn)至關(guān)重要。印制板的主要技術(shù)參數(shù)如下:
1. 尺寸是270mm X 84mm,板厚為2mm。
2. 采用六層板設(shè)計(jì),信號(hào)從頂層到底層的布局依次為T(mén)OP層,GND層,信號(hào)1層,信號(hào)2層,信號(hào)3層和BOTTOM層。其中信號(hào)2層布12V電源,信號(hào)3層鋪5V電源。
在布線(xiàn)中應(yīng)注意以下幾點(diǎn):
1. 優(yōu)先考慮電源和地在系統(tǒng)中的分布。
2. 使TTL信號(hào)和LVDS信號(hào)相互隔離,最好分布在不同的層。
3. 盡量多使用去耦電容。
4. 大電流回路布線(xiàn)盡量加粗,保持PCB地線(xiàn)層返回路徑盡量寬而短。
5. 對(duì)于差分布線(xiàn)采用手動(dòng)布線(xiàn)功能,使差分線(xiàn)對(duì)離開(kāi)集成芯片后盡可能地相互靠近。每對(duì)差分線(xiàn)的間隔要盡量小,差分對(duì)間的長(zhǎng)度要匹配。這樣能減少反射并能確保耦合到的噪聲為共模噪聲。
6. 進(jìn)行阻抗控制,通過(guò)阻抗設(shè)計(jì)軟件計(jì)算阻抗以確定差分線(xiàn)寬及線(xiàn)間距。
7. 背板上設(shè)計(jì)終結(jié)器電路,以吸收反射信號(hào)。
8. 走線(xiàn)時(shí)避免90洌ㄒ苑澇斐勺榪共渙?,記](méi)∠呋?5畢嘰妗?
結(jié)語(yǔ)
采用SAF-TE控制技術(shù)設(shè)計(jì)的SCSI背板,已廣泛應(yīng)用在曙光的系列產(chǎn)品中。經(jīng)兩年多的實(shí)際運(yùn)行,證明系統(tǒng)工作可靠,性能穩(wěn)定,保證了熱插拔硬盤(pán)的安全穩(wěn)定運(yùn)行。該控制技術(shù)在產(chǎn)品中的采用,改變了傳統(tǒng)的熱插拔背板只能監(jiān)控溫度和風(fēng)扇信息,而不能與主機(jī),硬盤(pán)控制器通信的缺陷。為服務(wù)器存儲(chǔ)系統(tǒng)的安全穩(wěn)定運(yùn)行提供了有效的保障?!?/p>
參考文獻(xiàn)
1 SCSI Accessed Fault-Tolerant Enclosures Interface and Specification
2 GEM318 Guardian Enclosure Management Controller Data Sheet
3 GEM318 Guardian Management Controller Technical Manual
評(píng)論