資料倉儲(chǔ)首度應(yīng)用要癌癥防治研究
專門致力於研究基因、蛋白質(zhì)和疾病之間的關(guān)系的WRI綜合性生物醫(yī)學(xué)研究機(jī)構(gòu),日前采用中央資料倉儲(chǔ),將分子和臨床資訊匯總和整合到單一資料倉儲(chǔ)中,幫助尋找乳癌和其他類型癌癥的成因。該組織選擇了Teradata技術(shù)方案。
本文引用地址:http://cafeforensic.com/article/182906.htm由於WRI采納了多個(gè)來源提供的資料,例如GenBank (供深入分析的 DNA 序列 )、PubMed (科學(xué)文獻(xiàn))、SWISS-PROT(供深入分析的蛋白質(zhì)資訊)、KEGG (新陳代謝途徑)、DIP (蛋白質(zhì)相互作用),然後將這些資料庫連結(jié)到 WRI 自已的分子(DNA、RNA、蛋白質(zhì))和臨床資料。這所有資料庫必須加以整合,以加速醫(yī)學(xué)研究,了解基因和蛋白質(zhì)與人體再生癌和心血管疾病的相關(guān)性。
WRI的營運(yùn)長暨首席科學(xué)家 Somiari 博士補(bǔ)充說:「人體共有 30,000 到 35,000 個(gè)基因,尋找與疾病的發(fā)作、發(fā)展和惡化相關(guān)的基因子集是一項(xiàng)極富挑戰(zhàn)性的工作。我們在 DNA、RNA、蛋白質(zhì)和細(xì)胞層次上對生物樣品進(jìn)行了大量分析。每個(gè)樣本通常會(huì)生產(chǎn) 166 MB 資訊,正因如此,我們需要 Teradata 提供的企業(yè)級(jí)資料倉儲(chǔ)解決方案。WRI還擁有一個(gè)能夠容納 240,000 個(gè)組織樣本的組織庫。我們將在 9 個(gè)月時(shí)間內(nèi)產(chǎn)成大約 50 TB 的資料量,包括圖像和文字,資訊必須唾手可得。由於我們繼續(xù)尋找合作夥伴加入,簽訂更多協(xié)定,因而我們需要能隨者我們的需求成長的資料倉儲(chǔ)解決方案?!?/p>
藉由 Teradata 資料倉儲(chǔ)技術(shù), WRI 將能儲(chǔ)存、提取、分析和管理透過大型生物技術(shù)所產(chǎn)生的大量 DNA、RNA 和蛋白質(zhì)資料。實(shí)質(zhì)上,WRI 的方法將加速醫(yī)學(xué)探索和知識(shí)庫的產(chǎn)生,并且在分子級(jí)別找出疾病的特定成因,為病人提供個(gè)別化藥物。
本文由 CTIMES 同意轉(zhuǎn)載,原文鏈接:http://www.ctimes.com.tw/DispCols/cn/Data-Mining/Teradata/NCR/%E7%BD%91%E9%99%85%E7%AE%A1%E7%90%86%E7%B3%BB%E7%BB%9F/0311101900M8.shtmll
評(píng)論