全球性疫情要被終結(jié)了?AI在其爆發(fā)之前就能阻止它
去年冬天,隨著流感季節(jié)的到來,全球各地的醫(yī)療機構(gòu)都在加班加點地工作。美國疾病控制與預防中心(CDC)公布的數(shù)據(jù)現(xiàn)實,近幾個月來,已有超過18萬美國人住院,另有1萬人死亡,而新型冠狀病毒(現(xiàn)已正式命名為COVID-19)也以驚人的速度在全球蔓延。
本文引用地址:http://cafeforensic.com/article/202003/410697.htm對全球范圍內(nèi)流感疫情爆發(fā)的擔憂,甚至促使2020年移動世界大會(MWC 2020)這樣的盛會,在距離開幕僅剩7天時間宣布取消。但在不久的將來,人工智能(AI)增強的藥物開發(fā)過程可以幫助以足夠快的速度生產(chǎn)疫苗,并找到治療方法,在致命病毒變異成全球性疫情之前阻止它們的傳播。
傳統(tǒng)的藥物和疫苗開發(fā)方法效率極低。研究人員可以花費近十年的時間,通過密集的試驗和糾錯技術(shù),對每個候選分子進行詳細審查。塔夫茨藥物開發(fā)研究中心2019年的一項研究現(xiàn)實,開發(fā)一種藥物的平均成本為26億美元,這是2003年成本的兩倍多。而且,只有大約12%進入臨床開發(fā)階段的藥物獲得了FDA批準。
美國佐治亞大學藥學和生物醫(yī)學科學助理教授伊娃-瑪麗亞·斯特拉克博士(Eva-Maria Strauch)指出:“你繞不過FDA,后者真的需要5到10年的時間才能批準某種藥物?!比欢?,在機器學習系統(tǒng)的幫助下,生物醫(yī)學研究人員基本上可以顛覆試錯方法。研究人員可以使用AI來對大量候選化合物數(shù)據(jù)庫進行排序,并推薦最有可能有效的治療方法,而不是手動嘗試每種潛在的治療方法。
華盛頓大學計算生物學家S·約書亞·斯瓦米達斯(S.Joshua Swamidass)在2019年接受采訪時稱:“藥物開發(fā)團隊真正面臨的許多問題,不再是人們認為他們只需在腦海中整理數(shù)據(jù)就能處理的那種問題,而是必須有某種系統(tǒng)方式來處理大量數(shù)據(jù)、回答問題并洞察如何做事?!?/p>
例如,口服抗真菌藥物terbinafine于1996年上市,名稱為拉米非,被用于治療鵝口瘡。然而,在三年內(nèi),有多人報告了服用該藥物的不良反應。到2008年,已有3人死于肝中毒,另有70人患病。醫(yī)生發(fā)現(xiàn)terbinafine的一種代謝物(TBF-A)是造成肝臟損傷的原因,但當時無法弄清楚它是如何在體內(nèi)產(chǎn)生的。
這種代謝途徑十年來始終是醫(yī)學界的一個謎,直到2018年,華盛頓大學研究生Na Le Dang訓練了一臺關(guān)于代謝途徑的AI,并讓機器找出了肝臟將terbinafine分解為TBF-A的潛在途徑。事實證明,創(chuàng)建有毒代謝物是個兩步過程,而且這是個很難通過實驗識別的過程,但用AI強大的模式識別能力卻非常簡單。
事實上,在過去的50年里,已經(jīng)有450多種藥物被從市場上撤下,其中許多藥物像拉米菲爾一樣導致肝中毒。這促使FDA推出Tox21.gov網(wǎng)站,這是個關(guān)于分子及其對各種重要人類蛋白質(zhì)相對毒性的在線數(shù)據(jù)庫。通過在這個數(shù)據(jù)集上訓練AI,研究人員希望更快地確定潛在的治療是否會導致嚴重的副作用。
美國先進翻譯科學中心的首席信息官山姆·邁克爾(Sam Michael)幫助創(chuàng)建了這個數(shù)據(jù)庫,他解釋稱:“我們過去遇到過一個挑戰(zhàn),本質(zhì)上是,‘你能提前預測這些化合物的毒性嗎?’這與我們對藥物進行小分子篩查的做法正好相反。我們不想找到匹配的藥物,我們只是想說‘嘿,這種(化合物)有可能是有毒的。’”
當AI不忙于解開十年來的醫(yī)學謎團時,他們正在幫助設計一種更好的流感疫苗。2019年,澳大利亞弗林德斯大學的研究人員使用AI為開發(fā)一種普通流感疫苗提供增強效應,這樣當人體接觸到它時,就會產(chǎn)生更高濃度的抗體。從技術(shù)上講,研究人員并沒有“使用”AI,而是啟動它,讓它自己尋找用例路徑,因為它完全是自己在設計疫苗。
該團隊由弗林德斯大學醫(yī)學教授尼古拉·彼得羅夫斯基(Nikolai Petrovsky)領導,首先建立了AI Sam(配體搜索算法)。AI Sam接受的訓練是區(qū)分那些對流感有效和無效的分子。然后,研究小組訓練了第二個程序,以生成數(shù)萬億個潛在的化合物結(jié)構(gòu),并將這些結(jié)構(gòu)反饋給AI Sam,后者開始決定它們是否有效。
然后,研究小組挑選出排名靠前的候選化合物結(jié)構(gòu),并對他們進行了物理合成。隨后的動物試驗證實,增強后的疫苗比未改進的前身更有效。最初的人體試驗于今年年初在美國開始,預計將持續(xù)12個月。如果審批過程順利,增強版疫苗可能在幾年內(nèi)公開上市。對于只需要兩年(而不是正常的5-10年)就研發(fā)出來疫苗來說,這絕非壞事。
雖然機器學習系統(tǒng)可以比生物研究人員更快地篩選巨大的數(shù)據(jù)集,并通過更脆弱的聯(lián)系做出準確的知情估計,但在可預見的未來,人類仍將留在藥物開發(fā)循環(huán)中。畢竟,人類需要生成、整理、索引、組織和標記所有的訓練數(shù)據(jù),并教授AI他們應該尋找的東西。
即使機器學習系統(tǒng)變得更有能力,當使用有缺陷或有偏見的數(shù)據(jù)時,它們?nèi)匀缓苋菀桩a(chǎn)生次優(yōu)結(jié)果,就像其他所有AI一樣。Unlearn.AI創(chuàng)始人兼首席執(zhí)行官查爾斯·費舍爾博士(Dr.Charles Fisher)在去年11月寫道:“醫(yī)學上使用的許多數(shù)據(jù)集大多來自白人、北美和歐洲人群。如果研究人員在機器學習中只是用這樣的數(shù)據(jù)集,并發(fā)現(xiàn)某個生物標記物來預測對治療的反應,就不能保證該生物標記物在更多樣化的人群中發(fā)揮作用。”為了對抗數(shù)據(jù)偏見帶來的扭曲效應,費舍爾主張使用“更大的數(shù)據(jù)集、更復雜的軟件和更強大的計算機”。
另一個重要組成部分將是干凈的數(shù)據(jù),正如Kebotix首席執(zhí)行官吉爾·貝克爾博士(Jill Becker)解釋的那樣。Kebotix是2018年成立的初創(chuàng)公司,它將AI與機器人技術(shù)結(jié)合起來,設計和開發(fā)奇異的材料和化學品。
貝克爾博士解釋說:“我們有三個數(shù)據(jù)來源,并有能力生成我們自己的數(shù)據(jù)。我們也有自己的合成實驗室來生成數(shù)據(jù),然后使用外部數(shù)據(jù)。”這些外部數(shù)據(jù)可以來自開放期刊或訂閱期刊,也可以來自專利和公司的研究伙伴。但貝克爾指出,無論來源如何,“我們都花了很多時間清理它?!?/p>
美國先進翻譯科學中心的首席信息官山姆·邁克爾(Sam Michael)也稱:“確保數(shù)據(jù)具有與這些模型相關(guān)聯(lián)的適當元數(shù)據(jù)是絕對關(guān)鍵的。而且這不是隨隨便便就能發(fā)生的,你必須付出真正的努力。這很難,因為這個過程既昂貴又耗時。”
評論