色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > 從基礎(chǔ)能力到應(yīng)用，大模型實(shí)測(cè)結(jié)果揭曉

從基礎(chǔ)能力到應(yīng)用，大模型實(shí)測(cè)結(jié)果揭曉

作者：時(shí)間：2024-06-11 來(lái)源：IDC

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

收藏

OpenAI 于 2023 年 3 月 14 日發(fā)布最新版本多模態(tài)大模型 GPT-4 及其 API；在中國(guó)市場(chǎng)，模型的通用性和泛化能力吸引了各大廠商布局，市場(chǎng)上的大模型/生成式AI產(chǎn)品紛至沓來(lái)。2024年5月，全球代表性AI技術(shù)供應(yīng)商如OpenAI發(fā)布了更新的大模型GPT-4o，在文本、圖像、音頻和視頻等多模態(tài)融合嘗試方面展現(xiàn)出強(qiáng)大的能力，能夠以這三者的任意組合進(jìn)行輸入和輸出，Google也發(fā)布了大模型Gemini的最新功能、文生圖模型Imagen3、對(duì)標(biāo)Sora的文生視頻模型Veo等。IDC觀察到，在中國(guó)市場(chǎng)，從2024年第二季度開(kāi)始，越來(lái)越多的AI技術(shù)供應(yīng)商開(kāi)始更新升級(jí)基礎(chǔ)大模型及相關(guān)產(chǎn)品，新一輪的“百模大戰(zhàn)”一觸即發(fā)。

本文引用地址：http://cafeforensic.com/article/202406/459752.htm

實(shí)測(cè)方法

本次實(shí)測(cè)面向市場(chǎng)上主流的大模型技術(shù)供應(yīng)商，產(chǎn)品必須是已經(jīng)開(kāi)放使用，并按照國(guó)家互聯(lián)網(wǎng)信息辦公室要求已經(jīng)完成備案。測(cè)試的媒介主要是基于基礎(chǔ)大模型的網(wǎng)頁(yè)版的產(chǎn)品，IDC對(duì)參與廠商的產(chǎn)品表現(xiàn)分別進(jìn)行測(cè)評(píng)?；A(chǔ)能力問(wèn)題涉及問(wèn)答理解類(lèi)、推理類(lèi)、創(chuàng)作表達(dá)類(lèi)、數(shù)學(xué)類(lèi)、代碼類(lèi)等；應(yīng)用問(wèn)題主要包含toC通用場(chǎng)景類(lèi)和toB特定行業(yè)類(lèi)，每一類(lèi)單獨(dú)計(jì)分。

基礎(chǔ)大模型產(chǎn)品實(shí)測(cè)結(jié)果評(píng)述

為對(duì)比國(guó)內(nèi)外大模型的產(chǎn)品差異以及推動(dòng)大模型/生成式AI相關(guān)產(chǎn)品的發(fā)展和應(yīng)用，IDC成立產(chǎn)品測(cè)試團(tuán)隊(duì)，通過(guò)多個(gè)維度（如生成質(zhì)量、使用與性能、安全與合規(guī)等）對(duì)基礎(chǔ)大模型及相關(guān)產(chǎn)品進(jìn)行評(píng)測(cè)，并邀請(qǐng)外部專(zhuān)家團(tuán)隊(duì)深入分析各個(gè)產(chǎn)品答案準(zhǔn)確性、合理性等，并在審核委員會(huì)的監(jiān)督下，最終得出各廠商的評(píng)估結(jié)果，供用戶(hù)選型參考。

綜合最終的得分情況，基礎(chǔ)大模型產(chǎn)品能力處于第一梯隊(duì)的有（梯隊(duì)產(chǎn)品表現(xiàn)在同一均線(xiàn)，以下按照技術(shù)供應(yīng)商首字母順序排列）：阿里通義千問(wèn)/通義萬(wàn)相等通義系列生成式AI產(chǎn)品、百度文心一言/文心一格、科大訊飛訊飛星火 3.5 Max、OpenAI GPT4、商湯日日新SenseNova 5.0。

在所有的題目類(lèi)型中，目前如問(wèn)答理解、toC通用場(chǎng)景類(lèi)得分率較高，數(shù)學(xué)類(lèi)、推理類(lèi)、代碼類(lèi)問(wèn)題、行業(yè)應(yīng)用類(lèi)的準(zhǔn)確率較低，需進(jìn)一步優(yōu)化。詳細(xì)的測(cè)評(píng)結(jié)果展示如下：

IDC中國(guó)大模型產(chǎn)品測(cè)試團(tuán)隊(duì)表示，2024年產(chǎn)業(yè)界更加關(guān)注大模型和生成式AI的落地，生成式AI的進(jìn)一步發(fā)展需要多種模態(tài)的大模型作為引擎。更為接近人類(lèi)的思維方式，是未來(lái)大語(yǔ)言模型競(jìng)爭(zhēng)的關(guān)鍵，技術(shù)供應(yīng)商還需持續(xù)優(yōu)化大模型在數(shù)學(xué)、推理、代碼等問(wèn)題以及在行業(yè)應(yīng)用中的生成質(zhì)量，提高生成的速度并降低大模型使用的成本，加快大模型技術(shù)的應(yīng)用與普及。

免責(zé)聲明

本文中的內(nèi)容和數(shù)據(jù)均來(lái)源于IDC所發(fā)布的報(bào)告，所有內(nèi)容及數(shù)據(jù)均為我公司所有。未經(jīng)IDC書(shū)面許可，任何機(jī)構(gòu)和個(gè)人不得以任何形式翻版、復(fù)制、刊登、發(fā)表或引用。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 大模型實(shí)測(cè) 大模型

評(píng)論

相關(guān)推薦

OpenAI終止對(duì)中國(guó)提供API服務(wù)，國(guó)產(chǎn)大模型發(fā)布應(yīng)對(duì)方案

智能計(jì)算 openAI API 大模型 | 2024-06-26

免費(fèi)！字節(jié)跳動(dòng)發(fā)布豆包MarsCode智能開(kāi)發(fā)工具：支持代碼補(bǔ)全、Bug修復(fù)

智能計(jì)算字節(jié)跳動(dòng) 大模型 AI編程 | 2024-06-27

邊緣智能：AI商業(yè)化中最值得關(guān)注的一環(huán)

智能計(jì)算邊緣智能 AI 大模型 | 2024-05-16

斯坦福AI團(tuán)隊(duì)承認(rèn)抄襲清華模型，公開(kāi)道歉并撤下?tīng)?zhēng)議項(xiàng)目

智能計(jì)算 AI 清華大模型 | 2024-06-05

浪潮之下的大語(yǔ)言模型以及我國(guó)未來(lái)大語(yǔ)言模型的發(fā)展

智能計(jì)算 202405 大語(yǔ)言模型大模型 | 2024-05-09

大模型提速自動(dòng)駕駛算法開(kāi)發(fā)——2024年IDC中國(guó)自動(dòng)駕駛開(kāi)發(fā)平臺(tái)廠商評(píng)估研究報(bào)告發(fā)布

汽車(chē)電子大模型自動(dòng)駕駛算法開(kāi)發(fā) IDC | 2024-06-24

英偉達(dá)的挑戰(zhàn)者的來(lái)錢(qián)之道

智能計(jì)算英偉達(dá) 大模型 | 2024-07-23

AI大模型時(shí)代的邊云協(xié)同之EdgeXFoundry

nakey | 2024-04-10

OpenAI再次對(duì)線(xiàn)谷歌，誰(shuí)才是贏家？

智能計(jì)算 OpenAI 谷歌 Gemini ChatGPT 大模型 | 2024-05-16

大模型價(jià)格戰(zhàn)開(kāi)打，多芯混合能否成破局之策？

智能計(jì)算大模型 | 2024-06-25

從基礎(chǔ)能力到應(yīng)用，大模型實(shí)測(cè)結(jié)果揭曉

智能計(jì)算大模型實(shí)測(cè) 大模型 | 2024-06-11

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區(qū)