阿里云賈揚(yáng)清:用4S標(biāo)準(zhǔn)帶領(lǐng)團(tuán)隊(duì)鍛造大數(shù)據(jù)+AI產(chǎn)品體系「阿里靈杰」
10 月 20 日,在 2021 云棲大會(huì)上,阿里巴巴集團(tuán)副總裁、阿里云計(jì)算平臺(tái)事業(yè)部負(fù)責(zé)人、達(dá)摩院 AI 平臺(tái)負(fù)責(zé)人賈揚(yáng)清發(fā)布大數(shù)據(jù) + AI 產(chǎn)品體系“阿里靈杰”。
“時(shí)至今日,我們可以越來越清晰的看到算力、算法、數(shù)據(jù)和場景的融合,尤其是 AI 和數(shù)據(jù)。沒有數(shù)據(jù),AI 是留在實(shí)驗(yàn)室里的火花;而沒有 AI,數(shù)據(jù)就是堆在那里的一堆成本”,賈揚(yáng)清提到,“阿里靈杰是我們?cè)谶^去幾年思考實(shí)踐的過程中所沉淀下來的基于 Scale、Speed、Simplicity 和 Scenario 這樣的 4S 標(biāo)準(zhǔn)的產(chǎn)品的體系。它不是一個(gè)為了創(chuàng)新而創(chuàng)新的過程,而是在我們希望 AI 能更加簡易落地的時(shí)候不斷生根的一個(gè)結(jié)果。我們希望阿里靈杰幫助我們和各行各業(yè)開發(fā)者一起,能夠在云上畫出人工智能增長的第二曲線?!?/p>
據(jù)悉,“阿里靈杰”是中國最大的大數(shù)據(jù)+AI 一體化平臺(tái)?!鞍⒗镬`杰”包含機(jī)器學(xué)習(xí)平臺(tái) PAI、云原生大數(shù)據(jù)計(jì)算服務(wù) MaxCompute、實(shí)時(shí)計(jì)算 Flink 版、大數(shù)據(jù)開發(fā)治理平臺(tái) DataWorks、實(shí)時(shí)數(shù)倉 Hologres 等產(chǎn)品,可調(diào)動(dòng)規(guī)模高達(dá) 10 萬臺(tái)以上計(jì)算集群,擁有云邊端一體的高性能訓(xùn)練和推理引擎,能提供毫秒級(jí)延遲的實(shí)時(shí)數(shù)據(jù)分析能力等,也提供開箱即用的視覺、語音、決策、NLP、業(yè)務(wù)增長引擎等開放服務(wù)。
在過去一年,賈揚(yáng)清介紹,他帶領(lǐng)的團(tuán)隊(duì)在 4S 標(biāo)準(zhǔn)下也在不斷提升產(chǎn)品能力,主要體現(xiàn)在四點(diǎn):
Scale:靈活擴(kuò)縮的大數(shù)據(jù)、大模型、大應(yīng)用
賈揚(yáng)清向大家分享了幾個(gè)數(shù)字:1. 云原生大數(shù)據(jù)平臺(tái) Max?Compute 已經(jīng)以 10 萬臺(tái)集群,支持 2000 萬表和千萬級(jí)的調(diào)度。但同時(shí)也可以從一張表,一個(gè) GB,一個(gè)任務(wù)開始,用零啟動(dòng)成本來使用近乎無限的彈性。2. 在 AI 領(lǐng)域,阿里云發(fā)布了大規(guī)模分布式訓(xùn)練框架 Whale,提供分布式 comp graph 建模和自動(dòng)優(yōu)化,達(dá)摩院的科學(xué)家們用 Whale 訓(xùn)練了全球首個(gè)十萬億級(jí)參數(shù)的預(yù)訓(xùn)練模型M6, 以及AliceMind等模型。
Speed:極致的運(yùn)行、開發(fā)、運(yùn)維效率
今天性能已經(jīng)不是刀耕火種的手工優(yōu)化?;?AI for Systems 的邏輯,通過自動(dòng)優(yōu)化,阿里云的成熟產(chǎn)品 MaxCompute 和實(shí)時(shí)計(jì)算 Flink 版持續(xù)提升自己性能,MaxCompute 已經(jīng)是第五年拿到 TPCx-BB 的性能第一名。
賈揚(yáng)清介紹,“人力成本是最大的成本,開發(fā)效率越來越重要。我們的 AI 平臺(tái)在前面一年完全實(shí)現(xiàn)云原生化,使我們可以一鍵式地完成從建模 / 訓(xùn)練 / 服務(wù)全鏈路的搭建過程?!?/p>
Simplicity:標(biāo)準(zhǔn)、像調(diào)用函數(shù)般易用
AI 先驅(qū) Richard Sutton 說過一句話:70 年研究得出的最大經(jīng)驗(yàn),最有效也最顯著的技術(shù),就是找到通用的方法來利用大量計(jì)算。
今年,阿里云 MaxCompute 和 DataWorks 提供了豐富的生態(tài)和數(shù)據(jù)建模治理工具。阿里云 AI 工程團(tuán)隊(duì)與達(dá)摩院算法的合作,在十多個(gè) AI 場景下提供了上百個(gè)標(biāo)準(zhǔn)化的算法模型服務(wù),解決 AI 落地應(yīng)用最后一公里的問題。使用 OCR、NLP 等,應(yīng)該像下一個(gè) App 那么簡單。
Scenario:向場景而生
沒有場景化的 AI 能力是沒有用處的。誰都需要算力,但是不一定管得好算力。阿里的云原生化的 PAI 軟件層和 Eflops 高性能集群的結(jié)合,提供開箱即用的算力解決方案,支持從學(xué)術(shù)研究、工業(yè)制造場景的落地。
在金融領(lǐng)域,阿里云湖倉一體架構(gòu)、離線實(shí)時(shí)一體化數(shù)倉,將各種形態(tài)的數(shù)據(jù)匯聚在一起,從傳統(tǒng)的反欺詐到創(chuàng)新的用戶營銷,提升多個(gè)場景的應(yīng)用效果。
和之前基于運(yùn)營的增長黑客相比,今天的增長引擎很多都是基于數(shù)據(jù)和算法的。PAI 將這些場景算法標(biāo)準(zhǔn)化,可以實(shí)現(xiàn) RTA、用戶觸達(dá)、智能搜索等多個(gè)客戶應(yīng)用中的明顯的業(yè)務(wù)提升。
在過去一年,阿里靈杰也跟犀牛制造、北京大學(xué)化學(xué)與分子工程學(xué)院來魯華教授組(靶向****物研究)、老視頻修復(fù) B 站 Up 主 AI 開發(fā)者大谷 Spitzer,在一起探索各種業(yè)務(wù)場景,為企業(yè)和開發(fā)者提供 “開箱即用” 的大數(shù)據(jù) + AI 一體化能力。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。