用實例分析硬件可靠性測試設(shè)計
以行業(yè)標(biāo)準(zhǔn)或者國家標(biāo)準(zhǔn)為基礎(chǔ)的可靠性測試。比如電磁兼容試驗、氣候類環(huán)境試驗、機械類環(huán)境試驗和安規(guī)試驗等。
企業(yè)自身根據(jù)其產(chǎn)品特點和對質(zhì)量的認識所開發(fā)的測試項目。比如一些故障模擬測試、電壓拉偏測試、快速上下電測試等。
下面分別介紹這兩類可靠性測試。
1 基于行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)的可靠性測試方法
產(chǎn)品在生命周期內(nèi)必然承受很多外界應(yīng)力,常見的應(yīng)力有業(yè)務(wù)負荷、溫度、濕度、粉塵、氣壓、機械應(yīng)力等。各種行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)制定者給出了某類產(chǎn)品在何種應(yīng)用環(huán)境下會存在多大的應(yīng)力等級,而標(biāo)準(zhǔn)使用者要根據(jù)產(chǎn)品的應(yīng)用環(huán)境和對質(zhì)量的要求選定相應(yīng)的測試條件即應(yīng)力等級,這個選定的應(yīng)力等級實質(zhì)上就是產(chǎn)品測試規(guī)格。
在產(chǎn)品的測試階段,我們必須在實驗室環(huán)境下對足夠的測試樣本一一施加相應(yīng)的應(yīng)力類型和應(yīng)力等級,考察產(chǎn)品的工作穩(wěn)定性。對于通信設(shè)備而言,常見的測試項目至少包括電磁兼容試驗、安規(guī)試驗、氣候類環(huán)境試驗和機械環(huán)境試驗,而上述四類測試項目還包含很多測試子項,比如氣候類環(huán)境試驗還包括高溫工作試驗、低溫工作試驗、濕熱試驗、溫度循環(huán)試驗等。此類測試項目還有很多,這里就不做詳細介紹??偟亩?,所有的測試項目都屬于規(guī)格符合性測試(即PASS或者FAIL測試),試驗的目的都是模擬產(chǎn)品在生命周期內(nèi)承受應(yīng)力類型和應(yīng)力等級,考察其工作穩(wěn)定性。
2 企業(yè)設(shè)計的可靠性測試方法
由于網(wǎng)絡(luò)產(chǎn)品的功能千差萬別,應(yīng)用場合可能是各種各樣的,而與可靠性測試相關(guān)的行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn),一般情況下只給出了某類產(chǎn)品的測試應(yīng)力條件,并沒有指明被測設(shè)備在何種工作狀態(tài)或配置組合下接受測試,因此在測試設(shè)計時可能會遺漏某些測試組合。比如機框式產(chǎn)品,線卡種類、線卡安裝位置、報文類型、系統(tǒng)電源配置均可靈活搭配,這涉及到的測試組合會較多,這測試組合中必然會存在比較極端的測試組合。再如驗證該機框的系統(tǒng)散熱性能,最差的測試組合是在散熱條件機框上滿配最大功率的線卡板;如果考慮其某線卡板低溫工作性能,比較極端的組合時是在散熱條件最好的機框上配置最少的單板且配置的單板功耗最小,并且把單板放置在散熱最好的槽位上。
總之,在做測試設(shè)計時,需要跳出傳統(tǒng)測試規(guī)格和測試標(biāo)準(zhǔn)的限制,以產(chǎn)品應(yīng)用的角度進行測試設(shè)計,保證產(chǎn)品的典型應(yīng)用組合、滿配置組合或者極端測試組合下的每一個硬件特性、硬件功能都充分暴露在各種測試應(yīng)力下,這個環(huán)節(jié)的測試保證了,產(chǎn)品的可靠性才得到保證。
以下舉兩個例子來說明如何根據(jù)產(chǎn)品特點設(shè)計出可靠性測試方法。
2.1 實例一:包處理器外掛緩存(Buffer)的并行總線測試
為了應(yīng)對網(wǎng)絡(luò)的突發(fā)流量和進行流量管理,網(wǎng)絡(luò)設(shè)備內(nèi)部的包處理器通常都外掛了各種隨機訪問存儲器(即RAM)用來緩存包。由于包處理和RAM之間通過高速并行總線互連,一般該并行總線的工作時鐘頻率可能高達800Mhz,并且信號數(shù)量眾多,拓撲結(jié)構(gòu)復(fù)雜,在產(chǎn)品器件密度越來越高的情況下,產(chǎn)品很可能遇到串?dāng)_、開關(guān)同步噪音(SSN)等嚴(yán)重的信號質(zhì)量問題,針對上述可能遇到的問題,我們需進行仔細的業(yè)務(wù)設(shè)計,讓相應(yīng)硬件電路的充分暴露在不利的物理條件下,看其工作是否穩(wěn)定。
串?dāng)_,簡單的來說是一種干擾,由于ASIC內(nèi)部、外部走線的原因,一根信號線上的跳動會對其他信號產(chǎn)生不期望的電壓噪聲干擾。為了提高電路工作速率和減少低功耗,信號的幅度往往很低,一個很小的信號干擾可能導(dǎo)致數(shù)字0或者1電平識別錯誤,這會對系統(tǒng)的可靠性帶來很大影響。在測試設(shè)計時,需要對被測設(shè)備施加一種特殊的業(yè)務(wù)負荷,讓被測試總線出現(xiàn)大量的特定的信號跳變,即讓總線暴露在盡可能大的串?dāng)_條件下,并用示波器觀察個總線信號質(zhì)量是否可接受、監(jiān)控業(yè)務(wù)是否正常。以16位并行總線為例,為了將這種串?dāng)_影響極端化,設(shè)計測試報文時將16根信號中有15根線(即攻擊信號線Agressor)的跳變方向一致,即15根信號線都同時從0跳變到1,同時讓另一根被干擾的信號線(即Victim)從1下跳到0,讓16根線都要遍歷這個情況。
開關(guān)同步噪音也是RAM高速并行接口可能出現(xiàn)的我們所不期望的一種物理現(xiàn)象。當(dāng)IC的驅(qū)動器同時開關(guān)時,會產(chǎn)生瞬間變化的大電流,在經(jīng)過回流途徑上存在的電感時,形成交流壓降,從而產(chǎn)生噪音噪聲(稱為SSN),它可能影響信號接收端的信號電平判決。這是并行總線非常惡劣的一種工作狀態(tài),對信號驅(qū)動器的高速信號轉(zhuǎn)變能力、驅(qū)動能力、電源的動態(tài)響應(yīng)、電源的濾波設(shè)計構(gòu)成了嚴(yán)峻的考驗。為了驗證產(chǎn)品在這種的工作條件下工作是否可靠,必須被測設(shè)備(DUT)加上一種特殊的測試負荷,即特殊的測試報文。
舉例:
如果被測總線為16位寬,要使所有16跟信號線同步翻轉(zhuǎn),報文內(nèi)容應(yīng)該為:
FFFF 0000 FFFF 0000
如果被測總線為32位寬,要使所有32跟信號線同步翻轉(zhuǎn),測試報文內(nèi)容應(yīng)該為:
FFFF FFFF 0000 0000 FFFF FFFF 0000 0000
如果被測總線為64位寬,要使所有64根信號線同步翻轉(zhuǎn),測試報文內(nèi)容應(yīng)該為:
FFFF FFFF FFFF FFFF 0000 0000 0000 0000 FFFF FFFF FFFF FFFF 0000 0000 0000 0000
如果報文在DUT內(nèi)部的業(yè)務(wù)通道同時存在上述位寬的總線,業(yè)務(wù)測試必須加載上述的報文,看DUT UUT在每種報文下工作是否正常,同時在相應(yīng)總線上進行信號測試,看信號是否正常。
2.2 實例二:熱測試
熱測試通過使用多通道點溫計測量產(chǎn)品內(nèi)部關(guān)鍵點或關(guān)鍵器件的溫度分布狀況,測試結(jié)果是計算器件壽命(如E-Cap)、以及產(chǎn)品可靠性指標(biāo)預(yù)測的輸入條件,它是產(chǎn)品開發(fā)過程中的一個重要的可靠性活動。
一般而言,熱測試主要是為了驗證產(chǎn)品的熱設(shè)計是否滿足產(chǎn)品的工作溫度范圍規(guī)格,是實驗室基準(zhǔn)測試,這意味著為了保證測試結(jié)果的一致性,必然對測試環(huán)境進行嚴(yán)格要求,比如要求被測設(shè)備在一定范圍內(nèi)無熱源和強制風(fēng)冷設(shè)備運行、表面不能覆蓋任何異物。但實際上很多產(chǎn)品的工作環(huán)境跟上述測試環(huán)境是有差異的:
有些產(chǎn)品使用時可能放在桌子上,也可能掛在墻上,而這些設(shè)備基本上靠自然散熱,安裝方法不同會直接影響到設(shè)備的熱對流,進而影響到設(shè)備內(nèi)部的溫度分布。因此,測試此類設(shè)備時必須考慮不同的安裝位置,在實驗室條件把設(shè)備擺放在桌子熱測試通過,并不代表設(shè)備掛在墻上熱測試也能通過。
有些網(wǎng)絡(luò)設(shè)備在網(wǎng)吧行業(yè)用得比較多,幾臺設(shè)備疊在一起使用比較常見,做類似產(chǎn)品的熱測試時,必須考慮到產(chǎn)品在此情況下熱測試是否符合要求。
一些機框式設(shè)備,由于槽位比較多,風(fēng)道設(shè)計可能存在一定的死角。如果被測對象是一塊業(yè)務(wù)板,而這塊可以隨便插在多個業(yè)務(wù)卡槽位,熱測試時必須將被測板放在散熱最差的槽位,并且在其旁邊槽位插入規(guī)格所能支持的大功耗業(yè)務(wù)板,后讓被測單板輔助單板和滿負荷工作,在這種業(yè)務(wù)配置條件下進行熱測試。
3 總結(jié)
針對不同的產(chǎn)品形態(tài),硬件可靠性測試項目可能有所差異,但是其測試的基本思想是一致的,其基本的思路都是完備分析測試對象可能的應(yīng)用環(huán)境,在可能的應(yīng)用環(huán)境下會承受可能工作狀態(tài)包括極限工作狀態(tài),在實驗室環(huán)境下制造各種應(yīng)力條件、改變設(shè)備工作狀態(tài),設(shè)法讓產(chǎn)品的每一個硬件特性、硬件功能都一一暴露在各種極限應(yīng)力下,遺漏任何一種測試組合必然會影響到對產(chǎn)品的可靠性。
評論