神經網(wǎng)絡預測編碼器的設計及應用
對Bayer圖像當前像素的預測可用下面兩式表示:
其中:(k,l)∈{(一3,O),(一2,一1),(一2,O),(一1,一2),(一l,一1),(一1,O),(O,一3),(O,一2),(O,一1)},x(i,j)為當前像素的真實值;互(i,j)是當前像素的預測值,e(i,j)是預測誤差。預測函數(shù)f用神經網(wǎng)絡實現(xiàn)。因此,輸入層有9個神經元。而網(wǎng)絡的輸出即是神經網(wǎng)絡預測器對當前像素的預測值,因此輸出層有1個神經元。
實際上,隱含層神經元數(shù)取決于訓練樣本數(shù)的多少、噪聲量的大小及網(wǎng)絡學習的輸入一輸出函數(shù)關系或分類關系的復雜程度。對許多應用場合均適用的一條有關確定隱結點數(shù)的規(guī)則即所謂的幾何金字塔規(guī)則(geometric pyramidrule):從輸入層到輸出層,結點數(shù)不斷減少,其形好似金字塔,如圖4所示。
本文通過大量實驗,最終確定神經網(wǎng)絡預測器的第一隱含層具有9個神經元,第二隱含層具有6個神經元。至此,神經網(wǎng)絡預測器結構已經確定,如圖5所示。
2.3 傳輸函數(shù)
在神經網(wǎng)絡圖像處理中,常使用的傳輸函數(shù)有兩大類:
(1)線性傳輸函數(shù);
(2)非線性傳輸函數(shù)。
線性傳輸函數(shù)的變換較簡單,其輸出相對于輸入呈線性增長,因而函數(shù)輸入范圍較小,且它不具有可微分性,這對于具有非線性特性的圖像信息來說并不適用。經典的BP算法采用sigmoid函數(shù),其輸出的動態(tài)范圍為[O,1],sigmoid和其導數(shù)為式1和式2:
評論