快手APP上了大模型對(duì)話,這是機(jī)器之心一手體驗(yàn)
短視頻平臺(tái)的大模型之戰(zhàn)已經(jīng)打響?
快手的 AI 大模型落地應(yīng)用,就這樣悄然開始了。
8 月 18 日晚,快手公布了基于自研大語言模型應(yīng)用的最新進(jìn)展 ——「快手 AI 對(duì)話」 功能已經(jīng)在快手 APP 安卓版開放了內(nèi)測。
不需要 demo 網(wǎng)站,也不用獨(dú)立的分類,快手這項(xiàng)新功能直接放在了安卓的正式版 APP 上。這個(gè)搜索框旁邊的 AI 對(duì)話按鈕,獲得測試資格的用戶點(diǎn)擊即可進(jìn)入。
「快手 AI 對(duì)話」是短視頻直播行業(yè)首個(gè)基于大語言模型的類 ChatGPT 落地產(chǎn)品。我們期待已久了,它體驗(yàn)如何呢?
第一時(shí)間評(píng)測
機(jī)器之心第一時(shí)間獲得了內(nèi)測資格,讓我們看看快手的大模型產(chǎn)品處于什么水平。
每家的大模型都各有特點(diǎn),先讓它介紹下自己的能力,好判斷一下該從哪開始聊起。
它說自己能回答「任何問題」,也可以提供建議,進(jìn)行說明,當(dāng)然也可以和你閑聊,看起來是有點(diǎn)革新搜索引擎的意思。那就先問它一個(gè)讓人頭疼的問題:
不僅有回答,令人驚喜加意外的是,它還能推薦快手上相關(guān)的視頻,看起來用 AI 找資源會(huì)很方便。
搜索更多的概念,我們發(fā)現(xiàn)它不僅可以和人持續(xù)聊天對(duì)話,也可以在給出回答時(shí)附帶引用內(nèi)容的鏈接,做到有理有據(jù)。如果查詢個(gè)天氣什么的,就會(huì)直接顯示個(gè)天氣預(yù)報(bào)的卡片。
從快手那邊得到的消息是,這種卡片形式的工具還會(huì)越來越多。
從這里,我們也能看出快手對(duì)大模型技術(shù)落地應(yīng)用的思考:充分發(fā)揮自身優(yōu)勢。聰明的智能可以依靠站內(nèi)豐富的內(nèi)容生態(tài),通過互動(dòng)對(duì)話的形式幫你快速查找短視頻、達(dá)人、百科等內(nèi)容。這是一種全新的信息獲取形態(tài)。
同時(shí),快手 AI 對(duì)話也為快手搜索打破了站內(nèi)內(nèi)容的壁壘,可為用戶提供全網(wǎng)內(nèi)容的檢索服務(wù)。你的下一個(gè)搜索引擎,又何必是搜索引擎。
值得一提的是,在我們測試時(shí),快手 AI 回答每個(gè)問題的響應(yīng)速度都是很快的。已知單 A100 在高度量化(用 llama.cpp)的條件下推理 Llama 的速度是每秒 30 個(gè)詞,難道我現(xiàn)在正在用的是一塊英偉達(dá) A100?可以未經(jīng)預(yù)告直接在應(yīng)用里上線,想必工程師們已經(jīng)做了不少優(yōu)化。
接下來,國內(nèi)的大模型都說自己的中文語義理解水平有優(yōu)勢,我們讓它來做一道今年的高考語文題:
回答無誤,再試試物理題:
理科題目也能做對(duì),可見快手 AI 是讀過不少書的。
作為一款大語言模型,文案創(chuàng)作水平必須要高。大多數(shù)公司發(fā)布的大模型都可以快速生成內(nèi)容豐富的文章、建議和回復(fù),但很多生成的文字只是看似可以用,實(shí)則經(jīng)不起推敲。對(duì)于一些特定的任務(wù),或是需要深入理解語境,符合人類情感的問題來說,有時(shí)候 AI 會(huì)輸出一些奇怪的結(jié)果。
在快手上我們總會(huì)遇見各路高人,但大多數(shù)人都是新手,能不能利用 AI 的幫助快速漲粉呢?值得嘗試一下。最近大熱的話題是電腦裝機(jī),我想干翻奸商,開個(gè)裝機(jī)店:
快手大模型給出了長長的建議,從確立定位、了解行情到培訓(xùn)員工、制定營銷策略…… 數(shù)了數(shù)一共有八條。從前人實(shí)踐來看,在做這種大事時(shí)很有可能忽略某些細(xì)節(jié),AI 助手的思維是更加縝密的,給人一種靠得住的感覺。
我們繼續(xù)和它聊,在看完快手建議選好店鋪名字之后,如何拍攝一個(gè)視頻宣傳我的店鋪呢?
看上去內(nèi)容中規(guī)中矩,似乎并沒有快手老鐵別具一格的思路,不過要給哪些鏡頭都說得很清楚。
既然你說話這么嚴(yán)謹(jǐn),那考考你邏輯問題吧:
弱智吧里出現(xiàn)的問題,在這里根本難不倒它,不過是否精彩是回答的藝術(shù)。
那崩鐵里用來對(duì)付民科的教育部難題又該如何呢?
雖然沒有做對(duì),但我們知道這題的答案并不是三個(gè)選項(xiàng)里的任何一個(gè)(在游戲里后續(xù)對(duì)話會(huì)出現(xiàn)正確選項(xiàng) 162),AI 給出的答案算比較接近了。
最近,開源的 Llama 2 正在改變大模型領(lǐng)域的格局,有了一個(gè)堪比早期 GPT 的開源產(chǎn)品,眾多公司會(huì)朝哪些方面進(jìn)一步探索?
在技術(shù)和落地上都還有很多要做的事,卷是一定的,機(jī)會(huì)當(dāng)然也很多。
快手大模型,有備而來
大模型是如今眾多科技公司競爭的重要賽道,在這方面,快手早有準(zhǔn)備。
今年 5 月一季度的業(yè)績電話會(huì)上,快手科技創(chuàng)始人兼 CEO 程一笑曾透露,公司已經(jīng)組建了大模型研發(fā)團(tuán)隊(duì),依托過去在 AIGC 算法和大語言模型方面的技術(shù)積累,正在按計(jì)劃推進(jìn)大模型開發(fā)和訓(xùn)練,各項(xiàng)進(jìn)展順利。
事實(shí)上,已有消息表明快手在大模型落地方面進(jìn)展迅速。
據(jù)透露,和目前很多科技公司展示的大模型 demo 相比,「快手 AI 對(duì)話」利用對(duì)內(nèi)部資源的高效索引,部分解決了大語言模型的幻覺問題,提升了問答的準(zhǔn)確性,另一方面也很早就在多個(gè)應(yīng)用場景開始了產(chǎn)品和功能的探索。
在 7 月 8 日,快手宣布正在內(nèi)測智能問答產(chǎn)品,計(jì)劃在搜索場景中為用戶帶來智能問答和文本創(chuàng)作等新功能,隨后在 8 月 8 日開啟「快手 AI 對(duì)話」內(nèi)測。以搜索場景為入口,我們獲得了更加便捷的搜索形態(tài),新技術(shù)帶來的便利覆蓋也更廣泛。
今天上午,這些產(chǎn)品功能背后的快手大模型終于浮出水面。有媒體報(bào)道稱,來自快手 AI 團(tuán)隊(duì)的自研大模型 ——「快意」(KwaiYii)已開啟內(nèi)測,并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn) API 和定制化項(xiàng)目合作方案。該大模型甫一出世便在多個(gè)知名大模型排行榜上均位居前列,在最新的 CMMLU 中文向排名中更是居于首位。
KwaiYii-13B 在 CMMLU 中文向排名第一。
根據(jù)其 GitHub 主頁介紹,「快意」是由快手 AI 團(tuán)隊(duì)從零到一獨(dú)立研發(fā)的大規(guī)模語言模型,而本次引發(fā)關(guān)注的正是其新版本 KwaiYii-13B。該模型在多個(gè) Benchmark 上都處于領(lǐng)先水平,證明了其在自然語言處理任務(wù)中的出色性能。
其中,KwaiYi-13B-Base 預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前處于同等模型規(guī)模的領(lǐng)先水平,顯示了快意大模型在中文和英文上都具備非常強(qiáng)悍的能力。
KwaiYii-13B-Base 在 Benchmark 上的效果(來源:快意 GitHub 主頁)。
而 KwaiYii-13B-Chat 對(duì)話模型具備出色的語言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對(duì)話等廣泛任務(wù),人工評(píng)估結(jié)果表明 KwaiYi-13B-Chat 超過主流的開源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近 ChatGPT (3.5) 同等水平。
更值得期待的是,機(jī)器之心了解到,快手 AI 團(tuán)隊(duì)將持續(xù)迭代「快意」大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力 ,另一方面也在推進(jìn)更多 C 端與 B 端業(yè)務(wù)場景下的落地 。
從生產(chǎn)力工具、手機(jī) OS 到短視頻直播平臺(tái),國內(nèi)大模型只花幾個(gè)月就快速覆蓋了各種平臺(tái),背后的技術(shù)也越來越靠譜。變革到了這一步,量變已在產(chǎn)生質(zhì)變。
大模型的到來,正讓我們進(jìn)入一個(gè)全新的世界。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。