AWS在中國:拆掉機(jī)器學(xué)習(xí)成本“高墻”
近日在2020 AWS技術(shù)峰會與合作伙伴峰會上,關(guān)于中國市場,AWS宣布了一個(gè)重要?jiǎng)幼鳎喊l(fā)布百家APN(AWS合作伙伴網(wǎng)絡(luò))合作伙伴聯(lián)合解決方案。
具體來講,AWS在中國將從四個(gè)方面推動APN的構(gòu)建:一是加快AWS云服務(wù)和功能落地中國;二是推動跨區(qū)域業(yè)務(wù)擴(kuò)展,包括伙伴出海、ISV落地中國、和區(qū)域伙伴合作服務(wù)客戶;三是與伙伴著力傳統(tǒng)企業(yè)上云遷移;四是打造垂直行業(yè)解決方案。
AWS大中華區(qū)專業(yè)服務(wù)事業(yè)部總經(jīng)理王承華表示,AWS僅在今年在中國區(qū)就一共落地了150多項(xiàng)服務(wù)和功能,主要原因有三點(diǎn):
一是大數(shù)據(jù)分析,通過大數(shù)據(jù)分析挖掘商機(jī),是數(shù)字原生企業(yè)的成功之處。這也是如今大量傳統(tǒng)企業(yè)在思考的事情,他們希望通過大數(shù)據(jù)運(yùn)營解決日常運(yùn)營中的問題,同時(shí)進(jìn)行創(chuàng)新。比如很多快消企業(yè)在嘗試如何直達(dá)消費(fèi)者(B2C),涉及到大量數(shù)據(jù)與運(yùn)算。
二是AWS在中國區(qū)引入了Amazon Athena、AWS Glue、Amazon MSK,與此前的Amazon S3、Amazon Elasticsearch、Amazon Redshift、Amazon EMR等組成一套數(shù)據(jù)湖解決方案,為向行業(yè)推進(jìn)奠定了技術(shù)基礎(chǔ)。
三是機(jī)器學(xué)習(xí)方面,目前各行業(yè)也在探索如何從海量數(shù)據(jù)集過往經(jīng)驗(yàn)中總結(jié)出適合于自身行業(yè)突破的機(jī)器學(xué)習(xí)解決方案。今年4月,AWS中國區(qū)引入了一項(xiàng)重要服務(wù)SageMaker,以減少對傳統(tǒng)科學(xué)家和工程算法的依賴,有效節(jié)省科學(xué)家和數(shù)據(jù)工程師的時(shí)間。
顯然,受國內(nèi)疫情帶來的數(shù)字化需求浪潮推動,借助光環(huán)新網(wǎng)(北京)、西云數(shù)據(jù)(寧夏)的運(yùn)營,AWS正在加快在中國市場的落地與布局。
企業(yè)數(shù)字化的增長引擎
提起SageMaker,對于中國的企業(yè)可能還是個(gè)新鮮事物。
SageMaker于2017年公布,2020年4月正式上線中國區(qū)。據(jù)介紹,SageMaker是一項(xiàng)完全托管的服務(wù),可以幫助開發(fā)者和數(shù)據(jù)科學(xué)家快速構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。SageMaker為開發(fā)者提供了彈性筆記本、實(shí)驗(yàn)管理、自動模型創(chuàng)建、模型調(diào)試分析,以及模型概念漂移檢測等功能,并將這些功能封裝在首個(gè)面向機(jī)器學(xué)習(xí)的集成開發(fā)環(huán)境SageMaker Studio中。
這種類似于“中央廚房”的模式,消除了機(jī)器學(xué)習(xí)過程中的繁重工作,讓開發(fā)高質(zhì)量模型變得更加輕松。
此次活動上,AWS中國區(qū)生態(tài)系統(tǒng)級合作伙伴總經(jīng)理汪勇進(jìn)一步說明了企業(yè)選擇SageMaker的理由:“數(shù)字化已經(jīng)成為新常態(tài),為加強(qiáng)在垂直行業(yè)的深耕,AWS已經(jīng)通過與中科創(chuàng)達(dá)、行者AI、東軟、德勤等技術(shù)/咨詢合作伙伴的合作,幫助客戶定制開發(fā)人工智能、機(jī)器學(xué)習(xí)解決方案,加大創(chuàng)新速度和在本地服務(wù)落地的速度?!?br/> 談及這一點(diǎn),作為與AWS合作近10年的客戶伙伴之一的德比軟件,其最佳實(shí)踐或許比AWS的闡釋更具有借鑒性。
基于SageMaker的實(shí)踐創(chuàng)新:酒店庫存智能緩存
德比軟件是一家為酒店、OTA提供訂單分銷技術(shù)的企業(yè),其客戶遍布全球,包括希爾頓、洲際、萬豪等國際著名連鎖酒店。分銷技術(shù),簡而言之,就是當(dāng)消費(fèi)者通過攜程或谷歌搜索預(yù)定酒店時(shí),需要保證對酒店庫存、價(jià)格等實(shí)時(shí)信息的更新,德比軟件相當(dāng)于這樣一個(gè)信息的對接平臺。
據(jù)德比軟件副總裁夏衛(wèi)介紹,“德比軟件平臺上,每分鐘有一百多份訂單,至少需要2000臺服務(wù)器來處理業(yè)務(wù)。除了在中國市場,在亞洲、歐洲、美洲等地都需要部署服務(wù)器,每天處理的數(shù)據(jù)量也達(dá)到了近200TB以上。如果使用傳統(tǒng)服務(wù)器進(jìn)行部署,那么系統(tǒng)架構(gòu)將變得非常復(fù)雜,且企業(yè)運(yùn)營成本也居高不下?!?br/> 為此,德比軟件從2011年開始就使用AWS,如今其業(yè)務(wù)幾乎100%都跑在AWS云上,對德比軟件全球的擴(kuò)張起到很大的支撐作用。隨著2020年SageMaker在中國市場的落地,AWS上海人工智能研究院機(jī)器學(xué)習(xí)解決方案實(shí)驗(yàn)室基于SageMaker,為德比軟件開發(fā)了一款酒店庫存智能緩存系統(tǒng)。
夏衛(wèi)告訴雷鋒網(wǎng),在使用SageMaker之前,德比軟件也曾嘗試引入機(jī)器學(xué)習(xí)應(yīng)用在某些項(xiàng)目中,如智能運(yùn)維、容量預(yù)測、異常檢測等?!捌鸪?,我們還做了一個(gè)庫存預(yù)測和異常檢測的神經(jīng)網(wǎng)絡(luò)模型,運(yùn)行在AWS EC2上。如果是小規(guī)模運(yùn)算,針對某個(gè)產(chǎn)品、項(xiàng)目沒什么問題,計(jì)算資源也耗費(fèi)不多,但如果需要在整個(gè)公司內(nèi)部運(yùn)作起來,調(diào)度幾千臺服務(wù)器,這種方法肯定就不行了,首先成本就非常高。此外,數(shù)據(jù)調(diào)用、數(shù)據(jù)量、安全合規(guī)等問題都是需要考慮的問題?!?br/> 夏衛(wèi)表示,酒店庫存的變化有很多要素影響,包括不同的入住日期、入住天數(shù)、成人數(shù)量、兒童數(shù)量甚至兒童的年齡段、不同房型、不同價(jià)格計(jì)劃,以及針對不同的渠道等等,這些要素組合起來,當(dāng)對接一家有6000家連鎖酒店的集團(tuán)集團(tuán)酒店時(shí),差不多有一萬多億的變化。
考慮一番后,德比軟件遷移到SageMaker 的Pipeline上實(shí)現(xiàn)。
通過酒店庫存智能緩存系統(tǒng),可以實(shí)現(xiàn)分析實(shí)時(shí)查詢價(jià)格的請求數(shù)據(jù),以及十多年來的歷史訂單數(shù)據(jù),從而自動找到酒店庫存變化的規(guī)律;然后通過周期性訓(xùn)練,最終得到能夠預(yù)測除熱門以及易變化酒店的酒店產(chǎn)品模式,實(shí)現(xiàn)及時(shí)更新緩存,并根據(jù)預(yù)測的產(chǎn)品狀態(tài)過期時(shí)間,快速推送給渠道。
接下來,德比軟件還規(guī)劃通過SageMaker構(gòu)建以下幾方面核心能力:一是酒店內(nèi)容上,包括圖片、文字描述,如房型名稱可以通過NLP進(jìn)行訓(xùn)練生成;二是如何將原先需要手工錄入的信息實(shí)現(xiàn)自動化;三是在智能客服方面,通過技術(shù)推廣到更多中小酒店。
據(jù)初步測試,這套算法可以幫助德比軟件提高準(zhǔn)確率20%以上。盡管還是初步的嘗試,完全成效還未體現(xiàn)出來,但按照德比軟件目前在全球的訂單量,在全面部署后,哪怕僅提高1%,也可能為客戶帶來上億美元的額外收入。
這次峰會上AWS還宣布與畢馬威、神州數(shù)碼簽署戰(zhàn)略合作關(guān)系,在更多領(lǐng)域深化合作。例如,東軟集團(tuán)基于AWS構(gòu)建了云原生的汽車在線導(dǎo)航業(yè)務(wù)(NOS),速石科技構(gòu)建的基于AWS云上資源和用戶本地算力的一站式交付平臺,外研在線在AWS上構(gòu)建的Unipus智慧教學(xué)解決方案等等……
不難發(fā)現(xiàn),包括AWS這樣的云巨頭服務(wù)商在內(nèi),當(dāng)下云市場已經(jīng)從單純云技術(shù)的輸出,真正轉(zhuǎn)變?yōu)樵粕鷳B(tài)之間的競爭。
評論