大模型的下一步:要高精尖,更要接地氣
大模型落地,如何以終為始緊跟業(yè)務(wù)需求?
當(dāng)下,AI 領(lǐng)域最熱門的技術(shù)非大模型莫屬。提到大模型,你也許會(huì)想到高參數(shù)、強(qiáng)算力、各種國(guó)際級(jí)的技術(shù)獎(jiǎng)項(xiàng)和競(jìng)賽佳績(jī)…… 讓大家認(rèn)為數(shù)據(jù)上的「大」和「強(qiáng)」,就是衡量大模型好壞的標(biāo)準(zhǔn)。
誠(chéng)然,大模型的競(jìng)爭(zhēng)力建立在「大」和「強(qiáng)」的基礎(chǔ)上,但對(duì)于應(yīng)用端來(lái)說(shuō),需要將大數(shù)據(jù)的能力真正落實(shí)到需求上,實(shí)現(xiàn)實(shí)實(shí)在在的轉(zhuǎn)化,才是展現(xiàn)大模型真正實(shí)力的關(guān)鍵一環(huán)。因此,如何將大模型與產(chǎn)業(yè)化應(yīng)用無(wú)縫連接,研發(fā)出適合具體業(yè)務(wù)場(chǎng)景的行業(yè)化大模型,已成為業(yè)界紛紛發(fā)力的方向。可是,要實(shí)現(xiàn)這個(gè)目標(biāo),卻并不簡(jiǎn)單。
大模型應(yīng)用落地,難點(diǎn)在何處?
作為當(dāng)前 AI 領(lǐng)域的前沿技術(shù),各類大模型在促進(jìn)產(chǎn)業(yè)智能化升級(jí)、提升業(yè)務(wù)流程效率與水平等方面都具有領(lǐng)先性;但到了實(shí)際應(yīng)用環(huán)節(jié),依然面臨很多難題,如技術(shù)能力與業(yè)務(wù)目標(biāo)不適配、技術(shù)無(wú)法及時(shí)響應(yīng)業(yè)務(wù)需求、基建承載能力弱等。
以往,前沿技術(shù)都是先做好應(yīng)用模塊,再在具體場(chǎng)景下做 “本地化適配”。而今時(shí)今日,技術(shù)要想在業(yè)務(wù)中得以落地,無(wú)論是數(shù)據(jù)收集,還是算法架構(gòu),都需要更加前置地考慮如何貼合真實(shí)業(yè)務(wù)需求、如何達(dá)成廣告主目標(biāo),才能將這些思考進(jìn)行充分表達(dá)。因此,為了讓大模型更好地落地,技術(shù)團(tuán)隊(duì)首先要充分了解業(yè)務(wù)特性或目標(biāo),從而結(jié)合實(shí)際業(yè)務(wù)強(qiáng)化技術(shù)能力持續(xù)磨合與進(jìn)化,做到一切以為業(yè)務(wù)服務(wù)為目標(biāo)。
此外,談到業(yè)務(wù)場(chǎng)景,尤其是廣告業(yè)務(wù)的場(chǎng)景,基于不同行業(yè)、不同業(yè)務(wù)類型,他們的訴求也存在不小的差異。大模型需要實(shí)時(shí)掌握這些需求,并對(duì)此作出快速的響應(yīng)。這個(gè)道理固然簡(jiǎn)單,但要落實(shí)到技術(shù)層面,卻需要一個(gè)相當(dāng)漫長(zhǎng)、復(fù)雜的調(diào)試和部署周期,往往導(dǎo)致技術(shù)迭代落后于業(yè)務(wù)變化。因此,如何提升大模型的靈活性與敏捷性,能夠適配業(yè)務(wù)需求的調(diào)整和變化,成為了建模的重要抓手之一。
總的來(lái)說(shuō),解決大模型落地難題的關(guān)鍵在于跨越大模型能力與真實(shí)業(yè)務(wù)場(chǎng)景之間的「鴻溝」。如果能以業(yè)務(wù)目標(biāo)及動(dòng)態(tài)需求為導(dǎo)向,并滿足具體業(yè)務(wù)運(yùn)行所需的各項(xiàng)能力,大模型才有可能真正實(shí)現(xiàn)落地。
要真正滿足以上的要求,大模型就需要擁有強(qiáng)大的學(xué)習(xí)能力,能夠通過(guò)超大規(guī)模的樣本訓(xùn)練,鍛煉出快速的理解和良好的推理能力。這意味著,大模型的穩(wěn)定運(yùn)行需要強(qiáng)大基建支持。然而現(xiàn)實(shí)往往是大模型技術(shù)到位了,基建沒(méi)有跟上,多數(shù)系統(tǒng)承載不下,大模型只能停留在實(shí)驗(yàn)室層面。因此,建設(shè)支撐大模型在線訓(xùn)練、推理與部署的計(jì)算平臺(tái)至關(guān)重要。
抓住廣告業(yè)務(wù)痛點(diǎn),騰訊實(shí)現(xiàn)大模型又好又快落地
在各家紛紛推廣自家大模型的時(shí)候,我們注意到了騰訊廣告的獨(dú)特身影。此前,我們就曾在《大廠的廣告系統(tǒng)升級(jí),怎能少了大模型的身影》一文中介紹過(guò)騰訊廣告的混元 AI 大模型與廣告大模型,見(jiàn)證了它們強(qiáng)大的技術(shù)能力。而我們最近了解到,這兩個(gè)模型已在具體廣告場(chǎng)景得到了應(yīng)用,真實(shí)服務(wù)廣告主們。
大模型落地困難重重,騰訊廣告如何克服以上難點(diǎn),將前沿技術(shù)融入廣告業(yè)務(wù)?今天我們將從業(yè)務(wù)痛點(diǎn)出發(fā),逐步拆解騰訊廣告以終為始的 “技術(shù)提效” 思路。
買化妝品的一定是女性?大模型向 “交易” 進(jìn)化,找到真正對(duì)的人!
互聯(lián)網(wǎng)廣告業(yè)務(wù)場(chǎng)景本來(lái)就具有復(fù)雜多變的特點(diǎn),可謂是大模型應(yīng)用價(jià)值的最佳試金石。隨著企業(yè)產(chǎn)品的推廣競(jìng)爭(zhēng)越來(lái)越激烈,內(nèi)容營(yíng)銷早已經(jīng)不止于簡(jiǎn)單的性能介紹,而需要從人群、地域、話題、商品特性等等層面找到相互融合之處,才能有效吸引消費(fèi)者的關(guān)注及達(dá)成轉(zhuǎn)化,從而真正幫助廣告主實(shí)現(xiàn)生意增長(zhǎng)。然而,當(dāng)下互聯(lián)網(wǎng)廣告場(chǎng)景的參數(shù)體量已經(jīng)非常大,廣告業(yè)務(wù)也正在往短平快、多觸點(diǎn)、全域鏈接的方向迅速發(fā)展,這都對(duì)廣告系統(tǒng)的快速挖掘、靈活匹配提出了更高的要求。此時(shí),廣告系統(tǒng)的運(yùn)算能力就發(fā)揮不可或缺的作用。
針對(duì)這些業(yè)務(wù)痛點(diǎn),騰訊廣告打造混元 AI 大模型與廣告大模型,全面提升廣告系統(tǒng)的理解能力與運(yùn)算能力,從而幫助廣告主實(shí)現(xiàn)生意的高效增長(zhǎng)。
作為在中文語(yǔ)言理解測(cè)評(píng)基準(zhǔn) CLUE、多模態(tài)理解領(lǐng)域國(guó)際權(quán)威榜單 VCR 以及 5 大國(guó)際跨模態(tài)檢索數(shù)據(jù)集榜單(如 MSR-VTT 等)上登頂?shù)臉I(yè)界領(lǐng)先大模型,混元 AI 大模型具備強(qiáng)大的多模態(tài)理解能力,可將文字、圖像和視頻作為一個(gè)整體來(lái)理解,將廣告更精準(zhǔn)地推薦給合適的人群,在廣告投放過(guò)程中實(shí)現(xiàn)更快速的起量。
對(duì)于廣告主而言,在投放中 “起量” 非常重要。當(dāng)點(diǎn)擊率、轉(zhuǎn)化率在短時(shí)間內(nèi)達(dá)成了廣告主預(yù)設(shè)的目標(biāo),就意味著起量了。混元 AI 大模型的多模態(tài)理解能夠快速解析出廣告素材中的商品名稱、規(guī)格等豐富的信息,并據(jù)此推薦給更可能對(duì)此廣告感興趣的人群。
我們以潤(rùn)百顏為例,以往這類美妝護(hù)膚類廣告,都是由優(yōu)化師們基于品牌對(duì)于目標(biāo)受眾的理解,主動(dòng)選擇人群標(biāo)簽進(jìn)行廣告投放。以這個(gè)流程進(jìn)行投放,廣告系統(tǒng)并不需要理解廣告主真實(shí)的營(yíng)銷訴求。然而,如果假定潤(rùn)百顏的主要目標(biāo)受眾為 20-40 歲的女性,那么會(huì)購(gòu)買此產(chǎn)品送給女性朋友的男性就會(huì)在投放過(guò)程中被排除在外。
為此,騰訊廣告通過(guò)與廣告主合作引入行業(yè)專業(yè)知識(shí),進(jìn)一步細(xì)化商品特征,構(gòu)建全面的美妝行業(yè)知識(shí)圖譜,收集并綁定相同產(chǎn)品的不同素材進(jìn)行投放。結(jié)果顯示,當(dāng)新素材出現(xiàn)時(shí),同產(chǎn)品其他廣告積累的數(shù)據(jù)幫助系統(tǒng)更快更穩(wěn)健地完成起量。同時(shí),通過(guò)打通單一廣告主賬戶下的所有賬號(hào)實(shí)現(xiàn)一體化商品管理,從統(tǒng)一視角聚合商品投放及投后數(shù)據(jù)的管理,降低整體空耗率。
從更好地理解商品開(kāi)始,幫商品更快地匹配到對(duì)應(yīng)的消費(fèi)者,廣告大模型強(qiáng)大的運(yùn)算能力就是提升推薦效率的關(guān)鍵。從參數(shù)來(lái)看,廣告精排大模型的單模型推理參數(shù)達(dá)到千億級(jí)別,序列化后大小可達(dá)數(shù)百 GB,浮點(diǎn)數(shù)計(jì)算量最高每秒超過(guò) 10 億次,在行業(yè)位于先進(jìn)水平。
在廣告大模型運(yùn)算能力的支持下,騰訊廣告實(shí)現(xiàn)了以系統(tǒng)為主導(dǎo)的全域搜索,能夠更快地搜索并挖掘用戶與商品的潛在關(guān)系,大大提升人貨匹配效率,找到更多高成交人群。
可以說(shuō),兩大模型的加持讓廣告系統(tǒng)更懂貨、更懂廣告主生意邏輯、更快找到潛在受眾。事實(shí)也證明,這套方法行之有效,潤(rùn)百顏的轉(zhuǎn)化起量率提升了 25.43%,空耗率降低了 43.68%,高信息度商品下單 ROI 提升了 5%。
大模型 + 強(qiáng)算力,支持定制模型 7 天上線,快速響應(yīng)廣告主訴求
通過(guò)混元 AI 大模型獲得了更豐富的特征以后,就可以聯(lián)動(dòng)廣告大模型進(jìn)行更準(zhǔn)確、更高效的建模了。不僅如此,廣告大模型本身也可作為一個(gè)通用底座,構(gòu)建更多靈活的定制模型,適配各種應(yīng)用場(chǎng)景。這就為滿足不同廣告主的差異化、精細(xì)化需求打下了基礎(chǔ)。
在處理廣告主實(shí)際廣告業(yè)務(wù)過(guò)程中,騰訊廣告采用了大模型 + 定制模型的技術(shù)思路,一方面充分發(fā)揮廣告大模型的強(qiáng)運(yùn)算能力,提升數(shù)據(jù)運(yùn)算的精度、維度與速度;另一方面依托廣告大模型快速搭建業(yè)務(wù)相關(guān)的定制化模型,滿足多樣化需求,做到有的放矢,幫助廣告主更快地完成投放目標(biāo)。
對(duì)于游戲、網(wǎng)服等線上服務(wù)類廣告主而言,傳統(tǒng)投放平臺(tái)上能夠提供的推廣目標(biāo)往往無(wú)法滿足他們非常精細(xì)的投放訴求。以某個(gè)網(wǎng)服廣告主為例,他們對(duì)出價(jià)的差異化要求精細(xì)到了「通關(guān) 3 次」和「通關(guān) 5 次」。此外,流量規(guī)則與轉(zhuǎn)化路徑的區(qū)別也使得每個(gè)行業(yè)、每個(gè)廣告主要求用戶完成不同的轉(zhuǎn)化行為。以游戲行業(yè)為例,超休閑和中重度游戲?qū)τ脩粜袨橐蟛煌罢咭笥脩艨赐暌淮渭?lì)視頻即完成轉(zhuǎn)化,后者則需要用戶成功下載、上手玩甚至付費(fèi)才算完成轉(zhuǎn)化。
為了更快更靈活地響應(yīng)廣告主的差異化訴求,跟上業(yè)務(wù)變化腳步,騰訊廣告選擇在大模型上建定制模型,與該網(wǎng)服廣告主共同定義促成生意增長(zhǎng)的用戶關(guān)鍵行為和關(guān)鍵目標(biāo),并以「關(guān)鍵行為」為優(yōu)化目標(biāo)進(jìn)行獨(dú)立建模。
但是,從溝通建模到跑通行業(yè)定制模型,難度很高,所需時(shí)間也頗長(zhǎng)。在廣告大模型運(yùn)算能力的加持下,騰訊廣告得以實(shí)現(xiàn)快速建模,將模型上線時(shí)間從業(yè)內(nèi)普遍的兩個(gè)月縮短至了 7 天,并在 30 天內(nèi)完成優(yōu)化迭代,同時(shí)做到及時(shí)、準(zhǔn)確響應(yīng)廣告主的具體業(yè)務(wù)需求。
有了大模型助力,網(wǎng)服廣告主搶占了流量先機(jī),最終買量 ROI 提升了 20%,平均出價(jià)和 eCPM 提升了 50%。
修煉內(nèi)功 —— 太極機(jī)器學(xué)習(xí)平臺(tái)提供強(qiáng)大基建
億級(jí)用戶、海量廣告內(nèi)容對(duì)廣告平臺(tái)的承載和計(jì)算能力提出了更高要求,騰訊自研的太極機(jī)器學(xué)習(xí)平臺(tái)支持 10TB 級(jí)模型訓(xùn)練、TB 級(jí)模型推理和分鐘級(jí)模型發(fā)布上線,為兩大模型在業(yè)務(wù)場(chǎng)景實(shí)現(xiàn) 7×24 小時(shí)順利運(yùn)行提供了強(qiáng)大基建,保障了混元 AI 大模型、廣告大模型的快速、穩(wěn)定運(yùn)行。
目前,騰訊廣告系統(tǒng)已完成了全面升級(jí)(如下圖)。底層數(shù)據(jù)生態(tài)(營(yíng)銷數(shù)據(jù)和經(jīng)營(yíng)數(shù)據(jù))提供了系統(tǒng)持續(xù)運(yùn)行所需的「源動(dòng)力」,而一大平臺(tái)、兩大模型強(qiáng)化了系統(tǒng)的理解與運(yùn)算能力,從而高效達(dá)成廣告主最關(guān)心的三大效果指標(biāo) “起量、成本和穩(wěn)定性”。
升級(jí)后的騰訊廣告系統(tǒng)為更好地滿足廣告主訴求、持續(xù)優(yōu)化用戶體驗(yàn)構(gòu)建了堅(jiān)實(shí)可靠的技術(shù)底座,在廣告業(yè)務(wù)場(chǎng)景中真正實(shí)現(xiàn)了技術(shù)提效。
結(jié)語(yǔ)
無(wú)論是利用混元 AI 大模型強(qiáng)化理解能力,還是通過(guò)廣告大模型提升運(yùn)算能力,騰訊廣告讀懂了如何將大模型落地到業(yè)務(wù)場(chǎng)景的關(guān)鍵,并摸索出了一套獨(dú)特的打法。這為業(yè)界其他大模型玩家提供了應(yīng)用參考范式,即始終圍繞業(yè)務(wù)痛點(diǎn)做深文章,充分釋放已有能力,并通過(guò)積極變招滿足廣告主變化的真實(shí)訴求。
兩大模型的落地踐行了騰訊廣告 “技術(shù)提效” 理念。未來(lái),騰訊廣告將繼續(xù)強(qiáng)調(diào)技術(shù)落地的重要性,從技術(shù)的角度理解業(yè)務(wù),從業(yè)務(wù)的角度審視技術(shù),讓技術(shù)演進(jìn)推動(dòng)業(yè)務(wù)增長(zhǎng),為廣告主創(chuàng)造更多的價(jià)值。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。