德州農(nóng)工大學(xué)團隊結(jié)合AI釋放「破紀錄」藍藻生產(chǎn)潛力,可再生燃料原料成本或可媲美玉米,商業(yè)化在即丨專訪袁戎華
早在 20 世紀 80 年代,美國國立生物技術(shù)信息中心(NCBI)數(shù)據(jù)庫、歐洲生物信息學(xué)研究所(EBI)數(shù)據(jù)庫和日本 DNA 數(shù)據(jù)庫(DDBJ)的相繼成立,就明示了生物信息學(xué)已經(jīng)成為了生命科學(xué)研究的重要工具。
《中國科學(xué)院院刊》的 “融合科學(xué)與開放數(shù)據(jù)” 專題中指出,信息技術(shù)的深度融入,使得現(xiàn)代生命科學(xué)研究范式發(fā)展成為集人工智能驅(qū)動的生物設(shè)計和生物模擬(“干實驗”)、自動化驅(qū)使的實驗研究(“濕實驗”)于一體的計算機輔助生物學(xué)范式。
在產(chǎn)業(yè)界,美國麻省理工學(xué)院已與安進、巴斯夫、拜耳、禮來、Sunovion 制****等醫(yī)****公司開展機器學(xué)習(xí)方法的合作;半導(dǎo)體設(shè)備龍頭企業(yè)泛林(Lam Research)公司已成立投資機構(gòu)加速半導(dǎo)體合成生物學(xué)研究……
在學(xué)術(shù)界,人工智能在合成生物學(xué)領(lǐng)域的應(yīng)用,正在讓它朝著可定量、可計算、可調(diào)控和可預(yù)測的方向躍升。
今年 1 月,德州農(nóng)工大學(xué)合成系統(tǒng)生物學(xué)創(chuàng)研中心袁戎華團隊公布了一項新成果,相關(guān)文章以題為 “Machine learning-informed and synthetic biology-enabled semi-continuous algal cultivation to unleash renewable fuel productivity” 發(fā)表在 Nature Communications 期刊上。據(jù)文章介紹,該團隊基于機器學(xué)習(xí)的培養(yǎng)設(shè)計和合成生物學(xué)的平臺,突破了藻類生產(chǎn)中 “相互遮蔭” 和 “高收獲成本” 的限制,實現(xiàn) 43.3 克 / 平方米 / 天的生物質(zhì)產(chǎn)量,使最低生物質(zhì)銷售價格降至每噸約 281 美元。
本次,生輝 SynBio 邀請到了袁戎華博士來與我們分享其所在的合成系統(tǒng)生物學(xué)創(chuàng)研中心的研究進展。
圖丨袁戎華 (來源:受訪者提供)
1997 年,袁戎華從復(fù)旦大學(xué)生物系畢業(yè)后,就前往美國亞利桑那大學(xué)繼續(xù)學(xué)習(xí)。在大家云集的植物學(xué)系,師從 David William Galbraith 教授(現(xiàn)任河南大學(xué)生命科學(xué)學(xué)院名譽院長),并接觸到彼時剛剛出現(xiàn)的基因芯片技術(shù)。
碩士畢業(yè)后,他曾在巴斯夫公司植物分部任職,心向往之,最后還是回歸學(xué)術(shù)界發(fā)展,并加盟知名的加州大學(xué)舊金山分校從事基因芯片和系統(tǒng)生物學(xué)的研究。2004~2007 年,他在田納西大學(xué)一邊工作一邊讀博士,畢業(yè)后進入德州農(nóng)工大學(xué)工作,恰逢合成生物學(xué)開始興起。
袁戎華說,“基于對生物系統(tǒng)的了解,自然想要再進一步去設(shè)計,所以從系統(tǒng)生物學(xué)轉(zhuǎn)向合成生物學(xué)研究,幾乎是順理成章的事?!?/span>
2016 年,在袁戎華聯(lián)合多位教授的推動下,德州農(nóng)工大學(xué)的合成系統(tǒng)生物學(xué)創(chuàng)研中心正式成立。兩年后,袁戎華被任命為合成生物學(xué)和可再生產(chǎn)品首席教授,開始領(lǐng)導(dǎo)團隊的研究。
“自發(fā)聚集沉降” 大幅度降低藻類生產(chǎn)成本
據(jù)袁戎華介紹,目前,團隊的研究方向主要有四個,分別是可再生材料、生物煉制、合成生物學(xué)以及碳捕捉和利用。
其中,碳捕捉和利用是在 “碳中和” 和 “碳達峰” 的大背景下,衍生出來的新方向。團隊致力于將高度頑固的木質(zhì)纖維素廢物轉(zhuǎn)化為可替代的生物產(chǎn)品,例如用于生物柴油的脂質(zhì)或用于生物塑料的 PHA(聚羥基鏈烷酸酯),同時還集中于第二代的和第三代生物燃料的生物煉制,并利用合成生物學(xué)打造平臺,不斷地優(yōu)化可再生材料的生產(chǎn)和生物煉制。目前,已有相應(yīng)的技術(shù)轉(zhuǎn)化公司—— SynShark LLC ,正在進行 “用煙草生產(chǎn)角鯊烯” 的產(chǎn)業(yè)化工作。
1 月份發(fā)布的這項新研究,正是基于合成生物學(xué)平臺,結(jié)合機器學(xué)習(xí),釋放了可再生燃料的生產(chǎn)力。“該項研究達到的生物質(zhì)產(chǎn)量,不僅是美國能源部 2022 年目標(25 克 / 平方米 / 天)的 1.7 倍,也是目前世界上最高的戶外藍藻和藻類單位平方米生產(chǎn)產(chǎn)量。” 袁戎華說道。
而這項研究的開始,可以追溯到 2016 年。
2016 年時,袁戎華曾和中國科學(xué)院上海生命科學(xué)研究院計算生物學(xué)研究所的朱新廣教授(同時任職于上海植生所)合作,相關(guān)論文 “Enhanced limonene production in cyanobacteria reveals photosynthesis limitations” 發(fā)表在《美國國家科學(xué)院院刊》上。在這項研究中,通過建模指導(dǎo),對藍藻細長聚球藻 PCC 7942 進行設(shè)計,獲得高產(chǎn)菌株,實現(xiàn)了超過 100 倍的檸檬烯產(chǎn)量增長。其中所做的菌株改造,是將從植物中獲得的人工啟動子轉(zhuǎn)入藍藻細長聚球藻 PCC 7942 菌株。
而在這項工作,袁戎華等人選中的菌株是聚球藻 UTEX2973,他們認為這種藻類高度活躍,具有高產(chǎn)檸檬烯的潛力。將人工啟動子和檸檬烯合成基因轉(zhuǎn)入 UTEX2973 后,發(fā)生了一個有趣的現(xiàn)象,那就是在一些特定的條件下,出現(xiàn)了自動沉降的現(xiàn)象,而且速度很快,絕大多數(shù)的細胞沉降至底部,上清液中剩余很少。
這是一個讓袁戎華激動的發(fā)現(xiàn)。眾所周知,藻類從水中的分離采收過程是一個大量耗能、成本增加的階段,甚至達到總成本的 30% 和總能耗的 50% 占比,這也意味著,若能實現(xiàn)藻類從水中自動沉降,則可以極大程度上降低成本。
今年 1 月發(fā)布的文章,正是基于工程化的 UTEX 2973 所進行的研究,改造后的菌株被命名為 L524,它能產(chǎn)生檸檬烯,可從藍藻細胞中排出,從而產(chǎn)生疏水表面相互作用并觸發(fā)細胞聚集以實現(xiàn)沉淀。檸檬烯是作為一種增值產(chǎn)品,此外,該菌株能夠同時生產(chǎn)生物質(zhì),作為潛在的航空燃料前體。
“機器學(xué)習(xí)算法” 精準預(yù)測光可用性和生長速率
除了簡化收集降低成本外,藻類生產(chǎn)中另一個有待解決的難題是 “相互遮蔭” 的限制。在培養(yǎng)過程中,當藻類細胞增殖至一定高密度時,光通路受到影響,細胞生長開始受到相互遮蔽的抑制,因此無法獲得高生物質(zhì)產(chǎn)量。
對此,文章第一作者龍彬想到了結(jié)合機器學(xué)習(xí)算法打造預(yù)測模型的好辦法。他們建立了兩套機器學(xué)習(xí)算法,首先,將機器學(xué)習(xí)作為一種有效的 LDP (光路預(yù)測模型) 預(yù)測工具來評估藻類培養(yǎng)物中的光可用性;其次,這種光可用性用于通過第二種機器學(xué)習(xí)模型 GRM(生長速率預(yù)測模型)來預(yù)測藍藻的生長速率。
據(jù)文章介紹,預(yù)測的 LDP(光路) 和實際測量的 LDP 之間 R^2 分數(shù)高達 0.993,足以證明機器學(xué)習(xí)模型的準確性,此外,與只能預(yù)測一維光路的傳統(tǒng)數(shù)學(xué)模型不同,機器學(xué)習(xí)預(yù)測的 LDP 可以是二維甚至是三維的。
“目前,我們團隊做到了二維的水平,更重要的是,這種 LDP 預(yù)測方法可以轉(zhuǎn)移到任何現(xiàn)有的藻類培養(yǎng)系統(tǒng),例如室內(nèi) / 室外 PBR(光生物反應(yīng)器) 或池塘系統(tǒng)?!?袁戎華說道。
圖丨數(shù)據(jù)處理和機器學(xué)習(xí)(來源:論文)
通過 LDP 預(yù)測工具獲得有效數(shù)據(jù)后,輸入第二個模型 GRM 來預(yù)測藍藻的生長速率。文章中指出,這種整合在以前的研究中尚未實現(xiàn)。預(yù)測值和實際測量值之間的 R^2 值為 0.992。
袁戎華等人利用兩個預(yù)測模型,模擬藍藻生產(chǎn)的動態(tài),得到最佳生長光密度(OD730)——2.3,并基于這一數(shù)據(jù)打造了半連續(xù)培養(yǎng)的模式(SAC)。具體來說,當光密度值超過 2.3 時,會開始收集藍藻,然后使藍藻生長再逐漸升至 2.3,始終保持在最佳光生長條件。在這樣的培養(yǎng)模式下,檸檬烯和生物質(zhì)的產(chǎn)量均得到了顯著提升,在光生物反應(yīng)器中,生物質(zhì)生產(chǎn)率為 0.1 克 / 升 / 小時,檸檬烯生產(chǎn)率為 0.2 毫克 / 升 / 小時;通過室外池塘系統(tǒng)擴大 SAC 的規(guī)模,實現(xiàn)了 43.3 克 / 平方米 / 天的生物質(zhì)產(chǎn)量,使最低生物質(zhì)銷售價格下降到約 281 美元 / 噸。
“僅比玉米貴一點,通常用于生產(chǎn)乙醇的低成本生物質(zhì)原料是玉米,大約為 260 美元 / 噸。” 袁戎華說道。
圖丨生長速率預(yù)測、生長模擬和半連續(xù)藻類培養(yǎng) (SAC)(來源:論文)
人工智能與合成生物學(xué)結(jié)合具有巨大商業(yè)價值
針對這項研究,袁戎華表示還將有進一步的工作。
“基于機器學(xué)習(xí)的生長模擬非常靈活,可以擴展以整合其他生長影響因素,如溫度和營養(yǎng),這也是傳統(tǒng)的數(shù)學(xué)模型無法做到的。目前,團隊已經(jīng)在開展相關(guān)工作?!?/span>
袁戎華還透露,這項研究的商業(yè)價值也受到了極大的關(guān)注。文章發(fā)布以后,學(xué)校負責(zé)商業(yè)轉(zhuǎn)化的機構(gòu)決定立刻申請專利,一些公司也表達了合作的意愿?!安贿^目前商業(yè)轉(zhuǎn)化還處于一個早期階段,預(yù)計這項技術(shù)將在藻類生產(chǎn)以及碳捕捉和利用方面有很大的市場應(yīng)用前景?!?/span>
最近,袁戎華團隊主要集中于運用這套體系來做碳捕捉和利用,并且已經(jīng)得到了美國能源部的支持,目前已經(jīng)與知名的圣路易斯華盛頓大學(xué),南方公司,和清潔碳利用聯(lián)盟建立了合作。
作為德州農(nóng)工大學(xué)合成系統(tǒng)生物學(xué)創(chuàng)研中心的領(lǐng)導(dǎo)人,對于中心的發(fā)展布局,袁戎華早有規(guī)劃。大體分為四個部分。
“第一部分是生物設(shè)計,主要是基于計算機科學(xué)進行設(shè)計,包括人工智能和其他方面;第二部分是高通量的工程發(fā)酵;第三部分是擴大規(guī)模;第四部分是系統(tǒng)生物學(xué),利用液相色譜 - 質(zhì)譜聯(lián)用儀(LC-MS)、液相色譜與串聯(lián)質(zhì)譜(LC-MS-MS)等,進行蛋白組學(xué)、代謝組學(xué)的相關(guān)研究?!?袁戎華介紹道。
“這樣一來,合成系統(tǒng)生物學(xué)創(chuàng)研中心能夠?qū)崿F(xiàn) “設(shè)計 — 構(gòu)建 — 驗證 — 學(xué)習(xí) — 設(shè)計” 的反饋循環(huán),比如,當我們發(fā)現(xiàn)一個好的菌株,能夠深入探究其機理,從而實現(xiàn)再設(shè)計升級。這種布局也將推動信息架構(gòu)設(shè)計、信息科學(xué)理論、信息技術(shù)開發(fā)的躍遷?!?/span>
采訪最后,袁戎華表示,人工智能與合成生物學(xué)的結(jié)合會有非常好的前景?!皩嶋H上,若干年前,人工智能就已經(jīng)廣泛地應(yīng)用于生物學(xué)領(lǐng)域,很多平臺已經(jīng)完全商業(yè)化了。從我們實驗室來說,除了通過人工智能進行過程控制外,也用它進行蛋白的預(yù)測?!?/span>
未來人工智能將更好地服務(wù)于合成生物學(xué)的發(fā)展?!昂铣缮飳W(xué)的設(shè)計部分本身就具有很大的挑戰(zhàn)性,我本身是系統(tǒng)生物學(xué)出身,對于數(shù)據(jù)量和數(shù)據(jù)的能力更是有非常深刻的理解”,他說,“我們現(xiàn)在已經(jīng)積累了數(shù)目非常龐大的生物學(xué)數(shù)據(jù),如果能夠?qū)@些數(shù)據(jù)進行有效的挖掘,就能夠提高我們科研的效率,讓整個合成生物學(xué)有更快的進展?!?/span>
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。
pwm相關(guān)文章:pwm是什么
霍爾傳感器相關(guān)文章:霍爾傳感器工作原理
霍爾傳感器相關(guān)文章:霍爾傳感器原理