講堂 | 劉鐵巖:跨界共創(chuàng)AI的產(chǎn)業(yè)價(jià)值和科學(xué)價(jià)值
編者按:第四屆微軟亞洲研究院創(chuàng)新論壇近日成功舉辦,大會(huì)以“跨界共創(chuàng)”為主題,就跨領(lǐng)域融合創(chuàng)新、共創(chuàng)精神推進(jìn)數(shù)字化轉(zhuǎn)型、如何讓技術(shù)創(chuàng)新成果成功落地等話題進(jìn)行了探討。
在論壇上,微軟亞洲研究院副院長(zhǎng)劉鐵巖從技術(shù)的角度分享了 AI 跨界共創(chuàng)的產(chǎn)業(yè)價(jià)值與科學(xué)價(jià)值。他認(rèn)為雖然 AI 已經(jīng)取得了突飛猛進(jìn)的發(fā)展,但仍然有非常長(zhǎng)的路要走,尤其是在產(chǎn)業(yè)價(jià)值和科學(xué)價(jià)值方面。究其原因,今天的 AI 只是在一些相對(duì)淺層次的領(lǐng)域發(fā)揮著作用。如果想真正實(shí)現(xiàn)人工智能的價(jià)值,就需要各領(lǐng)域的合作伙伴一起頂天立地、跨界共創(chuàng)。
微軟亞洲研究院副院長(zhǎng)劉鐵巖
人工智能方興未艾,世界上幾乎所有的頭部企業(yè)如今都在人工智能方面有巨大的投入。展望全球人工智能市場(chǎng),未來(lái)5年還會(huì)有非常高速的發(fā)展。人們不禁會(huì)問(wèn):人工智能技術(shù)是否已經(jīng)足夠成熟?是否有一些方向和領(lǐng)域需要我們特別重視?作為人工智能的學(xué)者,我們認(rèn)為人工智能仍然有非常長(zhǎng)的路要走,尤其是在它的產(chǎn)業(yè)價(jià)值和科學(xué)價(jià)值方面。
人工智能的價(jià)值現(xiàn)狀
從某種意義上講,目前,人工智能還是在一些相對(duì)淺層次的領(lǐng)域發(fā)揮著作用。例如人工智能中的深度學(xué)習(xí)在人臉識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理這些人機(jī)交互界面上應(yīng)用非常廣泛;強(qiáng)化學(xué)習(xí)在虛擬的或者封閉的問(wèn)題上表現(xiàn)良好,比如游戲、機(jī)器臂控制等相對(duì)環(huán)境簡(jiǎn)單、規(guī)則清晰的問(wèn)題。雖然人工智能在工業(yè)界核心的決策問(wèn)題上應(yīng)用前景廣泛,但其今天的作用仍然十分有限。在很多重要的環(huán)節(jié)中,人工智能與人的能力相比還是有所差異,傳統(tǒng)運(yùn)籌學(xué)仍是很多行業(yè)的標(biāo)準(zhǔn)解決方案。
人工智能在科學(xué)領(lǐng)域有何價(jià)值?目前人工智能主要在一些輔助問(wèn)題上發(fā)揮作用,例如對(duì)噪聲數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)光譜數(shù)據(jù)、天文圖片進(jìn)行模式識(shí)別,或者是對(duì)一些已有的數(shù)值仿真算法進(jìn)行加速和拓展。盡管近期出現(xiàn)了一些利用人工智能和大規(guī)模算力改變科學(xué)發(fā)展現(xiàn)狀的工作,如 AlphaFold2 破解蛋白質(zhì)折疊、Deep Potential 進(jìn)行分子動(dòng)力學(xué)模擬等,但是所有這些工作目前還只是星星之火,尚未形成燎原之勢(shì)。
在這樣的大背景下,作為人工智能學(xué)者,我們認(rèn)為,要讓人工智能對(duì)滾滾的歷史車輪產(chǎn)生更大的推動(dòng)作用,除了在“自我的世界”里關(guān)注算法和理論的研究以外,還需要能夠“頂天”、“立地”,跨界共創(chuàng),真正讓人工智能創(chuàng)造更多的產(chǎn)業(yè)價(jià)值和科學(xué)價(jià)值。
人工智能的產(chǎn)業(yè)價(jià)值生成路徑
如何才能讓人工智能實(shí)現(xiàn)更多的產(chǎn)業(yè)價(jià)值呢?為了尋求這個(gè)問(wèn)題的答案,微軟亞洲研究院于2017年成立了“創(chuàng)新匯”,與近50家各領(lǐng)域企業(yè)開(kāi)展合作,進(jìn)行了數(shù)百次的交流,完成了十余個(gè)聯(lián)合研究項(xiàng)目。這些項(xiàng)目橫跨金融、物流、醫(yī)****、電信、教育、政務(wù)等多個(gè)行業(yè)。在開(kāi)展這些聯(lián)合研究的過(guò)程中,我們秉承著初心,不僅要幫助各個(gè)企業(yè)解決現(xiàn)實(shí)中的技術(shù)挑戰(zhàn),實(shí)現(xiàn)數(shù)字化、智能化轉(zhuǎn)型;更重要的是從這些項(xiàng)目中抽象出行業(yè)的核心痛點(diǎn),設(shè)計(jì)解決這些痛點(diǎn)的人工智能共性技術(shù),為人工智能真正創(chuàng)造產(chǎn)業(yè)價(jià)值奠定基礎(chǔ)。
以金融投資為例,微軟亞洲研究院已經(jīng)和資管行業(yè)的領(lǐng)頭企業(yè)華夏基金合作超過(guò)四年的時(shí)間了,我們共同耕耘、共同分享、共同探討,形成了一系列對(duì)于金融資管和智能投資領(lǐng)域核心痛點(diǎn)的認(rèn)知。首先,我們發(fā)現(xiàn)盡管金融數(shù)據(jù)很豐富,但信噪比非常低,所以很難挖掘出有效的信號(hào)。其次,金融市場(chǎng)動(dòng)態(tài)變化,異常迭起,這對(duì)基于統(tǒng)計(jì)學(xué)習(xí)的方法提出了巨大的挑戰(zhàn),因?yàn)槊鎸?duì)復(fù)雜的金融市場(chǎng),我們很難假設(shè)數(shù)據(jù)是獨(dú)立同分布的。第三,金融領(lǐng)域中,風(fēng)險(xiǎn)和收益是一對(duì)雙生子,“投資有風(fēng)險(xiǎn),入市需謹(jǐn)慎”,一個(gè)高手之所以成為高手,不僅在于他能夠發(fā)現(xiàn)一般人所不知的投資信號(hào),更在于他善于管理風(fēng)險(xiǎn),能夠避免收益的“曇花一現(xiàn)”,成為一個(gè)常勝將軍。最后,從識(shí)別出有效的信號(hào),到構(gòu)建投資組合,再到真正執(zhí)行訂單,投資鏈條非常長(zhǎng),而且只有有效實(shí)現(xiàn)預(yù)期訂單的買賣,才真正完善整個(gè)投資鏈條,也才能得到想要的投資回報(bào)。
針對(duì)這些痛點(diǎn),在過(guò)去一段時(shí)間里,微軟亞洲研究院和合作伙伴一起研發(fā)了大量的人工智能技術(shù)。在數(shù)據(jù)端,高頻交易數(shù)據(jù)蘊(yùn)含豐富的信息,但又含有大量的噪聲,所以很多做中低頻投資的機(jī)構(gòu)或個(gè)人很少利用高頻交易數(shù)據(jù),而對(duì)高頻數(shù)據(jù)非常感興趣的人則在研究日內(nèi)的算法交易。于是,我們想問(wèn):高頻的交易數(shù)據(jù)是否可以對(duì)中低頻的投資,例如日頻、周頻、月頻的投資產(chǎn)生本質(zhì)的影響?
人工智能的優(yōu)勢(shì)在于能夠以人所不能及的細(xì)粒度和高通量分析數(shù)據(jù)。當(dāng)我們面臨的數(shù)據(jù)是高頻數(shù)據(jù)時(shí),需要處理的就是抑制噪聲,并從海量數(shù)據(jù)里抽取有用信息。以此為目的,我們研發(fā)了一套自監(jiān)督對(duì)比學(xué)習(xí)技術(shù),它將時(shí)空的依賴關(guān)系作為約束,去其糟粕,取其精華,希望能夠從高頻數(shù)據(jù)中抽取有效信號(hào)。當(dāng)我們使用這種自監(jiān)督對(duì)比學(xué)習(xí)的方法后,與只使用日頻數(shù)據(jù)或者使用高頻和日頻結(jié)合的數(shù)據(jù)相比,新方法都有更好的表現(xiàn),能夠獲得穩(wěn)定的信號(hào)。
針對(duì)市場(chǎng)動(dòng)態(tài)性方面的挑戰(zhàn),微軟亞洲研究院開(kāi)發(fā)了一套基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò),它可以自動(dòng)判斷當(dāng)前市場(chǎng)是否處于異常狀態(tài)。如果異常,我們就會(huì)建議投資機(jī)構(gòu)采取一些被動(dòng)的投資手段。如果這個(gè)市場(chǎng)在歷史上似曾相識(shí),我們就會(huì)利用注意力機(jī)制,從歷史數(shù)據(jù)里尋找到最適用于當(dāng)前市場(chǎng)的信息,通過(guò)數(shù)據(jù)或規(guī)律,讓投資機(jī)構(gòu)能夠在金融市場(chǎng)的風(fēng)云變幻之下,總是立于風(fēng)口浪尖上,獲得穩(wěn)定的投資回報(bào)。
同樣,關(guān)于風(fēng)險(xiǎn)控制,這是一個(gè)非常持久且重要的話題,只有我們對(duì)風(fēng)險(xiǎn)有了非常好的控制,才能實(shí)現(xiàn)穩(wěn)定的投資。雖然這個(gè)話題很重要,但是在歷史上人們對(duì)風(fēng)險(xiǎn)因子的研究道路崎嶇、發(fā)展緩慢。歷史的做法通常是,由專家定義出少量用來(lái)解釋當(dāng)前市場(chǎng)的因子,然后考察特定投資組合在這些因子上的暴露情況。從經(jīng)典的 CAPM 模型發(fā)展到 Fama TFM 模型歷時(shí)31年,僅增加了 Value、Size 幾個(gè)少量的因子。而從 Fama 模型進(jìn)化到當(dāng)前大多數(shù)投資機(jī)構(gòu)都在使用的 BARRA 模型,又經(jīng)歷了20年,也不過(guò)只增加了成長(zhǎng)、動(dòng)量等少數(shù)因子。而人工智能則可以通過(guò)優(yōu)化的手段,自動(dòng)找到對(duì)市場(chǎng)有最佳解釋能力并且彼此相互獨(dú)立的非線性風(fēng)險(xiǎn)因子,同時(shí)還可以對(duì)預(yù)測(cè)模型自身帶來(lái)的風(fēng)險(xiǎn)進(jìn)行刻畫(huà)和消減。這樣一來(lái),我們用人工智能的手段去做風(fēng)控,就可以比人類專家更周全、更系統(tǒng)、更及時(shí)。
最后,訂單的執(zhí)行同樣非常重要,但非常困難,因?yàn)樵谌諆?nèi)的整個(gè)市場(chǎng)波動(dòng)更加劇烈,基于簡(jiǎn)單的規(guī)則去做訂單交易,通常很難實(shí)現(xiàn)非常理想的平均交易價(jià)格。我們和合作伙伴一起探索了用強(qiáng)化學(xué)習(xí)的方法來(lái)做自動(dòng)訂單交易,這種方法可以在非常細(xì)的粒度下明察秋毫,找到執(zhí)行訂單的最佳時(shí)機(jī)和最佳執(zhí)行速率,從而大幅度降低交易成本,獲得良好的預(yù)期平均交易價(jià)格。一旦投資機(jī)構(gòu)可以非常好地控制交易成本,那么久可以為尋找最佳投資組合創(chuàng)造更大空間,從而有更加亮眼的表現(xiàn)。
上述研究不是紙上談兵,我們和合作伙伴一起在實(shí)盤上進(jìn)行了大規(guī)模的測(cè)試。測(cè)試結(jié)果與中證500指數(shù)相比,獲得了非常明顯的超額收益。尤其在今年年初,市場(chǎng)有些動(dòng)蕩,很多基金“崩盤”的情況下,我們的技術(shù)更是表現(xiàn)非常穩(wěn)健。
基于這些研究和探索,我們希望把我們的所思所得和技術(shù)積累與更多企業(yè)、客戶進(jìn)行分享,所以我們構(gòu)建了一個(gè)智能量化投資的共性技術(shù)平臺(tái),希望通過(guò)這個(gè)平臺(tái)能夠打通智能投資的研究和實(shí)戰(zhàn),降低技術(shù)投資的門檻,規(guī)避潛在的技術(shù)陷阱,為從業(yè)者和研究者提供一個(gè)非常接近實(shí)盤的回測(cè)環(huán)境。2020年下半年,我們將這樣一個(gè)平臺(tái)進(jìn)行了開(kāi)源——AI 量化投資開(kāi)源平臺(tái) Qlib。目前 Qlib 獲得了業(yè)界廣泛的關(guān)注,在 GitHub 上收獲了超過(guò)5000顆星,并且也正是因?yàn)殚_(kāi)源項(xiàng)目 Qlib,有很多國(guó)際知名的投資機(jī)構(gòu)正在和我們進(jìn)行交流與合作。
除了金融投資以外,微軟亞洲研究院也與其他行業(yè)的合作伙伴進(jìn)行了非常深入的互動(dòng),獲得了很多有價(jià)值的洞見(jiàn)。舉個(gè)例子,資源優(yōu)化、時(shí)空預(yù)測(cè)是非常多的領(lǐng)域所共同面臨的問(wèn)題,絕大部分資源優(yōu)化的場(chǎng)景都會(huì)有如下痛點(diǎn):優(yōu)化鏈路長(zhǎng),無(wú)法及時(shí)獲得反饋信號(hào);優(yōu)化鏈路上的多個(gè)目標(biāo)可能彼此之間互相矛盾;全局優(yōu)化問(wèn)題太復(fù)雜,幾乎是一個(gè)不可能完成的任務(wù)。
同樣,時(shí)空預(yù)測(cè)也有一些共性的特點(diǎn),例如數(shù)據(jù)噪聲大,信息缺失嚴(yán)重;時(shí)序的模式非常多樣,有趨勢(shì)、周期、突發(fā)信號(hào);空間結(jié)構(gòu)很復(fù)雜,經(jīng)常會(huì)出現(xiàn)一些層次化的結(jié)構(gòu),使得我們不能夠單一地在單點(diǎn)上進(jìn)行預(yù)測(cè)。
認(rèn)識(shí)了這些挑戰(zhàn)之后,我們和合作伙伴共同開(kāi)發(fā)了一套多智能體資源優(yōu)化的共性技術(shù)框架。該框架只需要經(jīng)過(guò)非常輕量級(jí)的定制就可以幫助客戶搭建起屬于自己的模擬器,并且還可以用強(qiáng)化學(xué)習(xí)的手段訓(xùn)練一個(gè)高效的智能體,幫客戶實(shí)現(xiàn)資源優(yōu)化。而且我們可以很輕易地幫助客戶把這個(gè)模型部署在一個(gè)分布式集群上,實(shí)現(xiàn)他們的日常運(yùn)營(yíng)。目前,這個(gè)框架已幫助包括東方海外航運(yùn)在內(nèi)的多個(gè)客戶實(shí)現(xiàn)了更加高效的日常運(yùn)營(yíng),提高了效率,降低了成本,獲得了更好的資源利用率。
沒(méi)有止步于此,我們希望這些合作的結(jié)果能夠被更多的用戶所使用、體驗(yàn),幫助他們實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,所以我們開(kāi)源了多智能體資源優(yōu)化平臺(tái)“群策 MARO”,目前已經(jīng)有很多客戶都在試用 MARO。
為了處理時(shí)空預(yù)測(cè)的核心挑戰(zhàn)問(wèn)題,我們開(kāi)發(fā)了一套時(shí)空預(yù)測(cè)的共性技術(shù),包括多路深度時(shí)序編碼集成的模塊、可解釋的正則通路、可以自動(dòng)學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的圖神經(jīng)網(wǎng)絡(luò)、可根據(jù)外部突發(fā)事件調(diào)整預(yù)測(cè)結(jié)果的門電路模塊等。正是因?yàn)檫@些復(fù)雜的設(shè)計(jì),我們的模塊和整個(gè)框架可以在一些非常困難的問(wèn)題上取得亮眼的效果。目前,我們已經(jīng)與合作伙伴在醫(yī)療、物流、電信領(lǐng)域做了非常多實(shí)際數(shù)據(jù)的測(cè)試,例如我們利用該技術(shù)幫助一些企業(yè)實(shí)現(xiàn)了物流訂單的精準(zhǔn)預(yù)測(cè),幫助糖尿病病人實(shí)現(xiàn)了血糖波動(dòng)的精準(zhǔn)預(yù)測(cè),也幫助電信企業(yè)實(shí)現(xiàn)了未來(lái)一段時(shí)間內(nèi)在某些域名下流量波動(dòng)的預(yù)測(cè)。
除了與這些企業(yè)共同推進(jìn)技術(shù)的應(yīng)用以外,我們也把這個(gè)技術(shù)框架應(yīng)用到了新冠疫情的管控和抗擊方面。在新冠疫情肆虐全球的大背景下,美國(guó)疾控中心公布了大量關(guān)于疫情的數(shù)據(jù),同時(shí)向全世界最頂級(jí)的科學(xué)機(jī)構(gòu)發(fā)出求救,希望各大科研機(jī)構(gòu)可以通過(guò)技術(shù)手段幫助疾控中心預(yù)測(cè)未來(lái)一周到四周內(nèi)疫情的****,并且?guī)椭部刂行囊约罢跀?shù)據(jù)結(jié)果進(jìn)行相關(guān)政策的制定。因?yàn)槲覀冇蟹浅3墒斓臅r(shí)空預(yù)測(cè)技術(shù),所以我們基于新冠疫情的數(shù)據(jù)訓(xùn)練了一個(gè)可以進(jìn)行未來(lái)一周到四周的疫情****預(yù)測(cè)模型,并且在2020年下半年,代表微軟公司向美國(guó)疾控中心提交了這個(gè)模型。在超過(guò)半年的時(shí)間里,該模型表現(xiàn)非常亮眼,在絕大部分時(shí)間里,它的表現(xiàn)和性能都力壓其他四十幾個(gè)全球頂級(jí)科研機(jī)構(gòu)的模型,排名第一,為全球抗擊新冠疫情、制定合適的防疫政策做出了重要的貢獻(xiàn)。
人工智能的科學(xué)價(jià)值生成路徑
通過(guò)“創(chuàng)新匯”,微軟亞洲研究院和各行各業(yè)的合作伙伴進(jìn)行了非常深入的交流與合作,也對(duì)各行各業(yè)有了更深入的認(rèn)識(shí)。這個(gè)跨界的體驗(yàn)讓我們這些人工智能學(xué)者收獲良多。展望未來(lái),我們相信有更多行業(yè)可以被我們的人工智能技術(shù)激活。做有用的人工智能,我們一直在路上。
但是另一方面,作為人工智能學(xué)者,我們從來(lái)沒(méi)有忘記,“抬頭仰望星空”的使命。所以我們也在一直思考如何用人工智能技術(shù)、機(jī)器學(xué)習(xí)技術(shù)去推動(dòng)基礎(chǔ)科學(xué)的進(jìn)展。
《科學(xué)》雜志在其成立125年周年的時(shí)候,發(fā)表了當(dāng)前世界上最重要的125個(gè)現(xiàn)代科學(xué)問(wèn)題,這些問(wèn)題里絕大部分是關(guān)于生物學(xué)、物理學(xué)和環(huán)境科學(xué)的,這些問(wèn)題關(guān)乎宇宙的奧秘、生命的起源以及人類的生存和可持續(xù)發(fā)展。我們相信,如果能夠用機(jī)器學(xué)習(xí)、人工智能的手段推進(jìn)這些問(wèn)題,我們將有望打開(kāi)通向未來(lái)的大門。
所以在過(guò)去的兩三年間,微軟亞洲研究院在智能科學(xué)領(lǐng)域有了非常周全的布局和有益的嘗試,我們關(guān)注的主要是智能生物學(xué)、智能物理學(xué)和智能環(huán)境科學(xué)。這個(gè)過(guò)程是一個(gè)非常美好的跨界體驗(yàn),微軟亞洲研究院與清華大學(xué)、復(fù)旦大學(xué)、麻省理工學(xué)院、東京大學(xué)在內(nèi)的高等院校,Baker Lab、Broad Institute 和中科院在內(nèi)的科研院所,以及像 Adaptive Biotechnology 這樣全世界生物科技領(lǐng)域領(lǐng)先的創(chuàng)業(yè)企業(yè),都進(jìn)行了非常密切的合作,產(chǎn)生了大量的研究成果,并且最近在《Nature Communications》、《Bioinformatics》、《Environmental Science and Technology》等科學(xué)領(lǐng)域的頂級(jí)期刊上發(fā)表了大量論文。
那么我們是如何與合作伙伴一起共同發(fā)現(xiàn)核心痛點(diǎn)問(wèn)題,并且提供人工智能解決方案的呢?以生物學(xué)為例,我們和合作伙伴們共同發(fā)現(xiàn),在生物學(xué)領(lǐng)域結(jié)構(gòu)數(shù)據(jù)的缺失是一個(gè)非常大的痛點(diǎn)。近年來(lái)隨著高通量測(cè)序技術(shù)的成熟,每日每夜都在生成海量的無(wú)標(biāo)注組學(xué)數(shù)據(jù),可是通過(guò)像冷凍電鏡這樣的手段去獲得高質(zhì)量的結(jié)構(gòu)數(shù)據(jù),成本仍然非常高,所以導(dǎo)致此類結(jié)構(gòu)數(shù)據(jù)相對(duì)稀少。在生物領(lǐng)域,結(jié)構(gòu)決定功能,如果我們沒(méi)有高質(zhì)量的結(jié)構(gòu)數(shù)據(jù),就很難真正推動(dòng)生物問(wèn)題的求解。
而在生命科學(xué)領(lǐng)域,個(gè)性化的需求同樣非常強(qiáng)烈,因?yàn)槊恳粋€(gè)生物個(gè)體都有所不同,就像人類一樣,千人千面,只有真正去理解每個(gè)人的不同,才能避免基于共有特征的數(shù)據(jù)模型遷移性差的事實(shí)。正是因?yàn)榻Y(jié)構(gòu)數(shù)據(jù)的缺失,結(jié)構(gòu)預(yù)測(cè)和分子動(dòng)力學(xué)模擬變得非常重要。結(jié)構(gòu)預(yù)測(cè)可以幫我們從序列化的組學(xué)數(shù)據(jù)出發(fā),生成一個(gè)靜態(tài)的結(jié)構(gòu),而分子動(dòng)力學(xué)模擬則可以在此基礎(chǔ)上提供一些動(dòng)態(tài)的細(xì)節(jié),包括不同構(gòu)向之間的轉(zhuǎn)化。由此可見(jiàn),人工智能確實(shí)可以幫助我們理解生物的功能以及功能的演化。
過(guò)去一年,微軟亞洲研究院使用人工智能技術(shù),建立了一個(gè)大規(guī)模的分子動(dòng)力學(xué)模擬系統(tǒng),并且使用這個(gè)系統(tǒng)對(duì)新冠病毒 S 蛋白的動(dòng)態(tài)變化進(jìn)行了深入分析,我們發(fā)現(xiàn)了一些非常有價(jià)值的科學(xué)結(jié)論。例如,我們發(fā)現(xiàn)新冠病毒 S 蛋白一直在具有高傳染性的開(kāi)構(gòu)象和低傳染性的閉構(gòu)象之間做著構(gòu)象的轉(zhuǎn)化,而在這個(gè)轉(zhuǎn)化過(guò)程中,S 蛋白的 NTD 部分起到了非常關(guān)鍵的作用,它就像一個(gè)楔子,可以促進(jìn)或者阻止這種構(gòu)象的變化。
如果我們能找到可以和 NTD 進(jìn)行結(jié)合的某種****物,那么就有機(jī)會(huì)降低新冠病毒感染人體細(xì)胞的能力,從而有可能會(huì)緩解它所造成的癥狀,或者是降低它的傳染率。抱著這樣一個(gè)愿望,我們使用了高通量的****物篩選技術(shù),從2億3千多萬(wàn)種化合物中,找到了超過(guò)1千種與 NTD 有很強(qiáng)綁定關(guān)系的化合物。另外,我們還分析了在中國(guó)抗擊新冠病毒中常用的一個(gè)中****:清肺排毒湯。在它已知的成分里,我們發(fā)現(xiàn)了至少有18種化合物與新冠病毒的 NTD 蛋白有非常強(qiáng)的綁定關(guān)系,這也從某種意義上解釋了為什么清肺排毒湯在處理和緩解新冠癥狀上有非常好的表現(xiàn)。
此外,個(gè)體差異方面同樣非常重要。我們每個(gè)人都有不同、大量的私有免疫細(xì)胞,體內(nèi)的微生物菌群也大相徑庭。所有這些私有的生物屬性很大程度上影響了人類的健康,以及個(gè)體對(duì)于不同疾病抗原的反應(yīng)和****物的耐受程度。只有對(duì)它們進(jìn)行精準(zhǔn)的刻畫(huà),才能實(shí)現(xiàn)真正意義上的個(gè)性化醫(yī)療。
因此,我們和美國(guó)的 Adaptive Biotechnology 公司一起,利用人工智能的手段,建立起了世界上第一個(gè)人類私有免疫細(xì)胞和各種疾病抗原之間的對(duì)應(yīng)關(guān)系圖—Antigen Map?;谶@張對(duì)應(yīng)圖,我們就可以在很多疾病上做出精準(zhǔn)的預(yù)測(cè)和治療。也正是因?yàn)檫@項(xiàng)技術(shù),我們和 Adaptive 共同創(chuàng)造了世界上首款 FDA(美國(guó)食品****品監(jiān)督管理局)批準(zhǔn)的基于人體免疫細(xì)胞的新冠檢測(cè)手段 T-Detect COVID。該檢測(cè)手段比我們常常聽(tīng)到的核酸檢測(cè)和抗體檢測(cè)更精準(zhǔn)、更及時(shí)。因?yàn)榘?T-Detect 在內(nèi)的創(chuàng)新技術(shù),微軟最近被 Fast Company 快公司評(píng)選為 “World Changing Company of the Year(年度改變世界的公司)”。
除了生物學(xué)以外,微軟亞洲研究院在其他行業(yè)、其他科學(xué)門類里也做了很多探索。例如,我們發(fā)現(xiàn)高效的數(shù)值仿真是物理學(xué)、環(huán)境學(xué)等多個(gè)科學(xué)門類的痛點(diǎn)之一,這是因?yàn)檎鎸?shí)世界的實(shí)驗(yàn)代價(jià)高昂,而實(shí)驗(yàn)前的仿真是推動(dòng)這些科學(xué)發(fā)展的重要手段。但是多尺度、高維度、高精度的仿真需要巨大的運(yùn)算量,這在很多情況下都是不可能完成的任務(wù)。而人工智能在解決這一挑戰(zhàn)方面有著巨大的潛力,比如,深度學(xué)習(xí)憑借它卓越的逼近能力,有可能可以替代耗時(shí)的數(shù)值計(jì)算模塊,而強(qiáng)化學(xué)習(xí)則可以高效地探索狀態(tài)空間和構(gòu)象空間,加速數(shù)值仿真的進(jìn)程。
我們提出了一個(gè)基于神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)求解多尺度偏微分方程的算子,它不需要大量的訓(xùn)練數(shù)據(jù),可以直接從物理規(guī)律中學(xué)習(xí),同時(shí)還可以通過(guò) GPU 加速,使解題速度比傳統(tǒng)的數(shù)值解法提高幾個(gè)數(shù)量級(jí)。利用這樣的新技術(shù),在精度與傳統(tǒng)數(shù)值解法相當(dāng)?shù)那闆r下,我們以10倍的速度成功求解了描述大氣湍流的大規(guī)模納維-斯托克斯方程,這對(duì)于環(huán)境建模、氣候預(yù)測(cè)都可能產(chǎn)生革命性的影響。
除此之外,我們還對(duì)大氣里的物理化學(xué)反應(yīng)有了更加深入的洞察。我們發(fā)現(xiàn),大氣物理化學(xué)反應(yīng)中存在一些深刻規(guī)律,通過(guò)拆解化學(xué)平衡常數(shù)和反映關(guān)系函數(shù),在常數(shù)復(fù)雜度下就可以實(shí)現(xiàn)高效的大氣反映曲面估計(jì),這與傳統(tǒng)方法相比是成千上萬(wàn)倍的加速?;谶@個(gè)技術(shù),我們可以對(duì)大氣污染物的擴(kuò)散進(jìn)行非常精準(zhǔn)的預(yù)測(cè)和仿真,而該技術(shù)目前已經(jīng)在多個(gè)國(guó)家的大氣污染治理中扮演著重要的角色。并且所有這些努力也都在踐行著微軟公司在負(fù)碳計(jì)劃方面的承諾。我們相信以智能科學(xué)之矛,攻環(huán)境污染之盾,是我們每個(gè)人的使命,雖然任重道遠(yuǎn),但是我們責(zé)無(wú)旁貸。
展望未來(lái),除了生物學(xué)、物理學(xué)、環(huán)境科學(xué)以外,其實(shí)還有太多的空間值得我們用人工智能去探索,無(wú)論是用人工智能助力電池材料的設(shè)計(jì),助力碳捕捉和碳存儲(chǔ),還是去探索行星的前世今生,甚至發(fā)現(xiàn)全新的基于數(shù)據(jù)驅(qū)動(dòng)的物理定律,我們都有著無(wú)限的想象空間。
我們相信,未來(lái)這種產(chǎn)業(yè)和科學(xué)的智能化進(jìn)程還會(huì)有非常廣闊的空間,人工智能在其中也會(huì)扮演越來(lái)越重要的角色。微軟也將繼續(xù)秉承自身優(yōu)勢(shì)和平臺(tái)公司的定位,推出更多的開(kāi)源項(xiàng)目、共性技術(shù),助力產(chǎn)業(yè)界和學(xué)術(shù)界的長(zhǎng)足發(fā)展。我們堅(jiān)信,只有借助整個(gè)社會(huì)的力量,借助整個(gè)學(xué)術(shù)界的力量和產(chǎn)業(yè)界的共同努力,我們才能真正推動(dòng)整個(gè)世界智能化的進(jìn)程。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。