碳硅智慧 CEO 鄧亞峰:用 AI 解開生命的密碼
離開 360 集團創(chuàng)辦碳硅智慧,是因為鄧亞峰相信,創(chuàng)新****研發(fā)的范式,將從專家+實驗驅(qū)動,變?yōu)橹悄苡嬎悖詣踊瘜嶒灒珜<因?qū)動,在未來十年甚至更久遠的時間里,AI 和計算將成為整個生命科學(xué)領(lǐng)域發(fā)展的核心驅(qū)動力。在這里他將更好地挑戰(zhàn)自我并創(chuàng)造價值。
21 世紀是生命科學(xué)的世紀。
要是你認識本科學(xué)生物的人,尤其是在本世紀之交那幾年參加高考的,他們會告訴你這句話有多么諷刺。與同期學(xué)計算機或通信的人相比,無論是搞科研還是找工作,別問,問就是沒前(錢)途。
但情況正在發(fā)生改變。
碳硅智慧創(chuàng)始人兼 CEO 鄧亞峰告訴機器之心,生命科學(xué)正處在新一輪爆發(fā)的前期,人工智能技術(shù)與這個領(lǐng)域開始深度融合,展現(xiàn)出巨大的可能,對于一直渴望成就一番事業(yè)的他來說,眼下正是最好的時機。
兩個月前,鄧亞峰結(jié)束了他在 360 作為集團副總裁、人工智能研究院院長兼搜索事業(yè)部總經(jīng)理的任職,為期不到三年,網(wǎng)絡(luò)上關(guān)于他的搜索結(jié)果還有不少停留在格靈深瞳 CTO 時期,而鄧亞峰自己則似乎更樂意從 2013 年加入百度 IDL(注:百度深度學(xué)習(xí)研究院,現(xiàn)百度研究院的前身)說起,強調(diào)他是最早一批投身深度學(xué)習(xí)的人。
從求學(xué)清華入門計算機視覺,到加入百度 IDL 再到格靈深瞳力挽狂瀾,鄧亞峰憑借著對人工智能尤其是深度學(xué)習(xí)的強大信念,在不斷挑戰(zhàn)自我的同時,敏銳地把握住了每一次技術(shù)和行業(yè)的發(fā)展,讓自己站得更高,想得更遠。如今吸引著他并且他也深信不疑的,是不遠的前方一個由 AI 驅(qū)動的生命科學(xué)時代。
第十一屆國際圖象圖形學(xué)學(xué)術(shù)會議(ICIG 2021),鄧亞峰代表 360 集團發(fā)表報告
****物發(fā)現(xiàn)即將迎來范式的轉(zhuǎn)變,鄧亞峰相信,AI 和計算將成為新的核心驅(qū)動力,在這種技術(shù)的代際更替進程中,新勢力完全有可能與行業(yè)巨擘并駕齊驅(qū),共同推動領(lǐng)域發(fā)展。
碳硅智慧將作為 AI 基礎(chǔ)設(shè)施和服務(wù)提供商,提供針對新****發(fā)現(xiàn)的一站式全流程設(shè)計平臺及相關(guān)服務(wù)。「我們希望與合作伙伴一起探索 AI 賦能新****發(fā)現(xiàn)的邊界,共享新****發(fā)現(xiàn)新范式,期待在人工智能、物理計算和自動化技術(shù)的驅(qū)動下,新****發(fā)現(xiàn)領(lǐng)域取得十倍速的效率提升?!?/span>
預(yù)判、選擇與時機
回望職業(yè)生涯 20 年,幾段經(jīng)歷,鄧亞峰每一步都踩在了對的點上。
2002 年考入清華電子工程系讀研究生,并憑興趣選擇了模式識別方向,尚不知曉十多年后這個方向會熱得發(fā)燙。在 2012 年以前,大家都是用傳統(tǒng)的機器學(xué)習(xí)技術(shù)解決領(lǐng)域問題,當(dāng)時的他,總感覺前面有堵看不見的墻。鄧亞峰回憶說,那時候團隊經(jīng)過一年的努力,大概能讓識別率提升 3~5 個百分點,而且是在 70% 的水平上,距離落地仍有很大的距離。「你會發(fā)現(xiàn)努力一年,依然看不到真正落地的希望?!?/span>
2012 年,深度學(xué)習(xí)算法在學(xué)術(shù)界展露了實力。但那時并非所有人都看好深度學(xué)習(xí),這不難理解,試想現(xiàn)在有人告訴你科學(xué)家在小鼠——不,在與人類親緣關(guān)系最近的倭黑猩猩身上發(fā)現(xiàn)了某種基因,可以延緩衰老,你會依此對即將到來的人類抗衰老****物抱有多大期待?
鄧亞峰調(diào)研后認為,深度學(xué)習(xí)擁有巨大的潛力,于是毅然加入當(dāng)時剛成立的百度 IDL,國內(nèi)最早專注于研究深度學(xué)習(xí)并將其定位為核心技術(shù)創(chuàng)新的機構(gòu),那時候的院長還是余凱——沒錯,地平線的那個余凱。在百度 IDL 的三年里,鄧亞峰參與提出了第一個基于深度學(xué)習(xí)的端到端的一階段物體檢測框架 DenseBox,和團隊一起將那時候的「學(xué)術(shù)界人臉識別世界杯」——LFW 評測的準確率做到了第一,成績是接近極限的 99.77%,隨著圖像分類、語義分割、人臉識別、物體檢測……很多以前覺得不太可能的任務(wù)被逐漸突破,他也度過了一段快樂而充實的技術(shù)時光。那時候刷榜很容易,但落地卻有些難。
2016 年 8 月,鄧亞峰加入格靈深瞳。這家 2013 年成立的公司今年 3 月在上??苿?chuàng)板作為第一家 AI 公司掛牌上市,但彼時正因前期戰(zhàn)略性的誤判在市場表現(xiàn)上陷入低谷。鄧亞峰加入后主要做了兩件事,完善技術(shù)團隊的組織架構(gòu),以及建立技術(shù)體系框架并攻堅深度學(xué)習(xí)技術(shù)。例如,為算法團隊建立數(shù)據(jù)智能和數(shù)據(jù)標(biāo)注等支撐團隊,啟動深瞳大腦項目,讓數(shù)據(jù)的獲取、標(biāo)注和管理,以及模型的訓(xùn)練與部署自動化;成立基礎(chǔ)引擎團隊,優(yōu)化人工智能算法在各種分布式異構(gòu)平臺上的性能、部署和調(diào)度,更好地連通應(yīng)用和算法;對軟件團隊做了垂直領(lǐng)域劃分,使得各團隊能更專注于智慧安防、智慧****、智慧零售等業(yè)務(wù)。
經(jīng)過調(diào)整以及團隊的努力,格靈深瞳的技術(shù)和產(chǎn)品有了顯著的提升。鄧亞峰本人也實現(xiàn)了從 CV 技術(shù)專家到技術(shù)管理者的蛻變,作為 CTO 帶領(lǐng)團隊將包括人臉識別、車輛結(jié)構(gòu)化以及人體再識別等核心算法,后來居上做到行業(yè)一流水平,不僅僅贏得了客戶,也贏得了生態(tài)合作伙伴華為、英特爾的尊敬。特別是在 2019 年,格靈深瞳在「工業(yè)界人臉識別世界杯」——美國標(biāo)準化局舉辦的 FRVT 競賽中,取得了四項任務(wù)綜合成績排名世界第一的殊榮。而這背后,整個團隊的研發(fā)投入,特別是研發(fā)團隊人數(shù),僅是行業(yè)頭部公司的十分之一。
2020 年 4 月,鄧亞峰加入 360 集團,一手接過顏水成離開后的 360 人工智能研究院,另一手擔(dān)起 360 搜索事業(yè)部的大梁。選擇加入 360 集團的原因與加入格靈深瞳一樣,鄧亞峰坦言,都是為了更好地提升自己,都是最需要他同時也是他最能有所施展的平臺。
此時的鄧亞峰管理著 400 人左右的團隊,一方面帶領(lǐng)人工智能研究院在支撐公司內(nèi)部業(yè)務(wù)AI 需求的同時進行 AI 前沿探索,另一方面管理著搜索事業(yè)部,保障集團最重要的業(yè)績來源。360 有著非常廣闊的 AI 落地場景,從互聯(lián)網(wǎng)軟件到智能硬件,有海量用戶和數(shù)據(jù),近期大熱的多模態(tài)預(yù)訓(xùn)練大模型,在 360 有最好的應(yīng)用場景。他和團隊一起,提出一種新的中文圖文跨模態(tài)預(yù)訓(xùn)練框架 R2D2 ,結(jié)合雙塔模型和單塔模型的優(yōu)點,在 8 個評測數(shù)據(jù)集上都取得了最好成績,且顯著超越之前最好成績。這些模型與 2000 多萬優(yōu)質(zhì)訓(xùn)練測試數(shù)據(jù)一起都已經(jīng)開源,為中文大模型的研究及社區(qū)發(fā)展貢獻了一點力量。此外,在知識圖譜的權(quán)威競賽 OGB-WIKI 上,他的團隊曾兩次登頂。
在 360 的這幾年,鄧亞峰從計算機視覺領(lǐng)域成功拓展到了自然語言理解、機器人等領(lǐng)域,深度學(xué)習(xí)技術(shù)的發(fā)展,讓他越來越意識到 AI 的底層技術(shù)方法及在各個領(lǐng)域的演進是相通的。同時,在軟硬件協(xié)同及 SaaS 服務(wù)方面的經(jīng)驗,以及在產(chǎn)業(yè)數(shù)字化等方向的探索和思考,進一步歷練了他業(yè)務(wù)規(guī)劃和判斷能力,也讓他習(xí)慣站在行業(yè)的高度洞悉技術(shù)趨勢和市場動向。這個時間點,他已經(jīng)由一個技術(shù)管理者蛻變?yōu)橐粋€創(chuàng)新業(yè)務(wù)負責(zé)人。
在外人看來,在 360,他一方面負責(zé)AI 研究院,一方面負責(zé)搜索,既管最前沿的創(chuàng)新部門,又管非常核心的業(yè)務(wù)部門,一切都很完美。
然而,他心底總覺得缺了一點什么。
我希望自己能做一件更有成就感,而且能對我個人的成長更有價值的一件事情。如果最初選擇留在百度,我可以不斷提升技術(shù),不斷晉升,原來我所帶領(lǐng)團隊的小伙伴已經(jīng)升到 T9、T10 了。做了 20 年人工智能,我一直在追求把 AI 技術(shù)大規(guī)模落地,而且希望真正能給大家的生活帶來價值和改變。
此外,我內(nèi)心也一直期待自己能創(chuàng)立一家我認同的公司,一個能發(fā)揮出每個人潛質(zhì)和優(yōu)勢,而且真正為社會創(chuàng)造價值的一個平臺。
發(fā)現(xiàn) AI for Science 新機遇
做過智慧城市、智慧商業(yè)、智慧****這些計算機視覺相關(guān)的軟硬件產(chǎn)品,又做過互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的搜索、移動應(yīng)用、視頻推薦等產(chǎn)品,從商業(yè)角度看,鄧亞峰發(fā)現(xiàn)這個時間點新機會相對來說比較少。更重要的,對他個人來講,「價值感上會感覺沒有特別強」。
比較偶然的機會接觸到生命科學(xué),尤其是新****發(fā)現(xiàn)這個領(lǐng)域后,鄧亞峰說他天然地被吸引,覺得非常有興趣,這是一個提起來就非常有使命感的行業(yè)。看好 AI 賦能****物研發(fā)有很多原因,最核心的還是他認為****物研發(fā)領(lǐng)域迎來了研發(fā)范式變革的機會點,在這樣的機會點躬身入局,對他而言是非常順理成章的事情。
鄧亞峰相信,創(chuàng)新****研發(fā)的范式,將從專家+實驗驅(qū)動的模式,變革為 AI 計算+自動化實驗+專家驅(qū)動的模式,在未來十年甚至更久的時間里,AI 計算將成為生命科學(xué)領(lǐng)域發(fā)展的核心驅(qū)動力。作為 AI 從業(yè)者,最讓人激動的當(dāng)然是找到一個對社會非常有價值,且以 AI 為核心驅(qū)動力的行業(yè)。
****物研發(fā)當(dāng)然需要領(lǐng)域知識,不僅僅涉及到****學(xué),還包括物理、化學(xué)、生物、醫(yī)學(xué)等,這絕對是一個非??鐚W(xué)科的交叉領(lǐng)域,鄧亞峰總結(jié)說。但是,當(dāng)運用領(lǐng)域知識把一些問題抽象之后,會發(fā)現(xiàn)和其他領(lǐng)域遇到的人工智能任務(wù)并沒有本質(zhì)不同。
與其他領(lǐng)域不同的是,這個領(lǐng)域的 AI 技術(shù)能力還處于較為初級的階段,還沒有被解決,這背后的原因,一方面是因為****物研發(fā)領(lǐng)域的問題有獨特挑戰(zhàn),另外一方面是因為太少真正具有 AI 建模能力的人進入這個領(lǐng)域。從最早期就親身經(jīng)歷了深度學(xué)習(xí)技術(shù)的興起,并見證了深度學(xué)習(xí)在計算機視覺和自然語言理解領(lǐng)域的顛覆式發(fā)展之后,鄧亞峰對人工智能于生命科學(xué)的改變堅信不已。
鄧亞峰回憶道「這只是時間問題。2013 年時,除了親身見證的人外,很少有人相信深度學(xué)習(xí),甚至包括一些行業(yè)大佬,人總是見到才會相信?!?/span>
對于****物研發(fā)而言,確實需要有領(lǐng)域知識,除了計算之外,也包括非常多的復(fù)雜環(huán)節(jié)。但過去****物研發(fā)領(lǐng)域失敗率高的重要原因,是人類專家難以完全掌握****物研發(fā)過程中的所有知識,也難以完全消化利用所有的試驗數(shù)據(jù),使得****物研發(fā)充滿了偶然性。而人工智能,有望理解和建模****物研發(fā)領(lǐng)域的所有數(shù)據(jù),融入人類知識,并與專家人機協(xié)作,顯著提高****物研發(fā)的確定性。這里面涉及到的大量模型,就如同量化交易領(lǐng)域一樣,最終會被既懂領(lǐng)域知識,更懂建模的團隊解決。
碳硅智慧的另一位創(chuàng)始人兼首席科學(xué)家是浙江大學(xué)****學(xué)院的侯廷軍教授,擁有 20 多年****物設(shè)計方法學(xué)和應(yīng)用研究經(jīng)驗。這是一只擁有 20 年以上經(jīng)驗的****學(xué)專家和人工智能專家領(lǐng)銜的團隊,他們希望將最先進的生命科學(xué)技術(shù)與人工智能等信息科學(xué)技術(shù)深度融合,利用人工智能、物理計算,以及軟硬件自動化技術(shù),三輪驅(qū)動,通過提高新****研發(fā)領(lǐng)域生產(chǎn)數(shù)據(jù)、管理數(shù)據(jù)以及對數(shù)據(jù)進行 AI 建模的能力,將新****研發(fā)的各個環(huán)節(jié)數(shù)字化和智能化,形成干濕試驗數(shù)據(jù)閉環(huán),解決新****研發(fā)難題。這個團隊過去在深度學(xué)習(xí)、多模態(tài)預(yù)訓(xùn)練、知識圖譜、軟硬件自動化、高性能計算、物理計算、計算化學(xué)和****學(xué)上的經(jīng)驗,將會讓他們區(qū)別于其他團隊,為行業(yè)帶來不同價值。
碳硅智慧目前已建立了業(yè)內(nèi)領(lǐng)先且完全擁有自主知識產(chǎn)權(quán)的一站式新****發(fā)現(xiàn)平臺 DrugFlow,包括靶標(biāo)發(fā)現(xiàn)、虛擬篩選、先導(dǎo)化合物優(yōu)化、成****性預(yù)測等模塊,可以幫助****化專家更高效、便捷地找到潛在成****分子。
碳硅智慧為創(chuàng)新****研發(fā)量身定做,涵蓋****物發(fā)現(xiàn)全流程的一站式 SaaS 平臺 DrugFlow
從市場的角度,中國的制****行業(yè)與國外相比差距懸殊,新的政策導(dǎo)向下 Me-too ****和仿制****發(fā)展受限,****企和生物制****公司有更強的訴求去做差異化和創(chuàng)新****物研發(fā)。
鄧亞峰強調(diào)說,作為新****研發(fā)領(lǐng)域的 AI 基礎(chǔ)設(shè)施和服務(wù)提供商,碳硅智慧的戰(zhàn)略目標(biāo)是與****廠和生物醫(yī)****公司合作,而非競爭?!赶鄬鹘y(tǒng)的CRO 模式,我們會在提供軟硬件基礎(chǔ)設(shè)施之上,與戰(zhàn)略合作伙伴一起針對重點管線進行合作研發(fā),提供包括新靶點發(fā)現(xiàn)、成****分子發(fā)現(xiàn)及優(yōu)化等服務(wù)。我們也希望用更開放的姿態(tài),與行業(yè)伙伴一起推動生命科學(xué)領(lǐng)域人工智能技術(shù)的發(fā)展?!?/span>
范式改變的力量
1944 年,物理學(xué)家薛定諤出版了生物學(xué)著作《生命是什么?》(What Is Life? The Physical Aspect of the Living Cell),從物理學(xué)家的視角探討生物學(xué)問題。盡管當(dāng)時的物理和化學(xué)無法回答「生命是什么」這個問題,但薛定諤指出,這種無法回答是經(jīng)過充分論證的,正是說明了需要用新的科學(xué)理論和科學(xué)工具去解釋生物系統(tǒng)。
如今,一個類似的機遇擺在我們面前。生命或許本質(zhì)上是一種信息系統(tǒng),從計算的角度能夠被更好地理解。如果說數(shù)學(xué)是科學(xué)的語言,那么 AI 則最適合用來描述生命。
****物發(fā)現(xiàn)需要領(lǐng)域知識,但 AI 人在這里擁有得天獨厚的優(yōu)勢。在****物發(fā)現(xiàn)領(lǐng)域,人工智能的力量還沒有真正發(fā)揮出來,想想過去幾年計算機視覺、自然語言理解、自動駕駛等領(lǐng)域的巨變,一切都不過才剛要開始。
鄧亞峰說:「新****研發(fā)領(lǐng)域踏實做人工智能的團隊其實非常少,真正懂****又懂 AI 的團隊屈指可數(shù)。我們團隊希望能夠通過自己的努力,與整個行業(yè)生態(tài)一起,把中國新****研發(fā)的能力向前推進一大步。也期待更多志同道合的朋友加入這個領(lǐng)域,無論從產(chǎn)業(yè)角度還是技術(shù)角度,這里都是一片全新的藍海?!?/span>
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)測速儀相關(guān)文章:測速儀原理