基于Alpha-NMF的AD樣本分類及特異性基因選擇方法
由于NMF算法受初值和維數r的影響,因此對每組實驗分別取r=2,3,4,5時運行NMF算法20次。為了衡量由于r值選取不同導致的聚類的穩(wěn)定性問題,定義了一個共表型相關系數(圖3分類穩(wěn)定性比較),共表型相關系數越接近于1,分類越穩(wěn)定。本文引用地址:http://cafeforensic.com/article/193834.htm
觀察圖3和圖4的結果,通過比較可以發(fā)現(xiàn),隨著r的增加,其相關系數和分類正確率普遍降低,當r=2時,其分類穩(wěn)定性和識別正確率明顯高于r=3,4,5時的情況。此時,Alpha-NMF算法相比標準NMF算法具有較高的分類準確性和穩(wěn)定性。尤其當α=0.5時,效果最佳。因此,選擇Alpha-NMF算法α=0.5,r=2處理后的集合基因,如圖2所示,選擇某一閾值(此處閾值為50),可以分別提煉出268個(HIP)、172(EC)個探針表達變化具有顯著差異。
4 討論
4.1 特異性基因及其功能分類
將上節(jié)提煉出的探針號與AD基因組進行比對,共確定有320個基因為特異性基因。這些基因主要于細胞信號傳導、物質代謝、物質傳輸等生物過程有關。
MiMI(Michigan Molecular Interactions)是國家衛(wèi)生研究所疾病預防控制綜合生物情報中心中的一部分。它可以提供蛋白質間的相互作用,并且利用這些數據進行融合,集合成一個復雜的網絡;還能檢索大量基因的生物功能。
使用MiMI對上上述特異性基因進行功能分類,其中有88基爵在GO(Gene Ontology)上沒有注釋,因此沒有對其分類,僅對其余的232個基因進行分類,根據分類結果,主要分為以下幾類:1)物質代謝過程;包括蛋白質代謝、細胞氮化合物代謝、核苷酸代謝;2)細胞周期過程,包括細胞形態(tài)發(fā)生和發(fā)展、細胞自動調節(jié)機能、生殖細胞形成;3)定位過程,包括蛋白質定位、細胞定位、大分子定位;4)細胞成分組織,包括細胞內大分子聚集、細胞膜組織以及細胞內各器官組織;5)生物合成過程,包括核苷酸合成、小分子合成;6)基因表達、轉錄、翻譯;7)神經系統(tǒng)調節(jié),包括神經元的形成、神經突觸傳導、神經元變異、神經傳導素生成及傳輸;8)細胞凋亡;9)物質運輸,包括ATP水解耦合質子運輸、陽離子運輸、胞內蛋白質運輸、離子跨膜運輸。上述基因功能分類如表1所示。
評論