色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 國產(chǎn)大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

國產(chǎn)大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

作者：時間：2024-12-27 來源：IT之家

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

12 月 27 日消息，“深度求索”官方公眾號昨日（12 月 26 日）發(fā)布博文，宣布上線并同步開源 DeepSeek-V3 模型，用戶可以登錄官網(wǎng) chat.deepseek.com，與最新版 V3 模型對話。

本文引用地址：http://cafeforensic.com/article/202412/465844.htm

援引博文介紹，DeepSeek-V3 是一個 6710 億參數(shù)的專家混合（MoE，使用多個專家網(wǎng)絡將問題空間劃分為同質區(qū)域）模型，激活參數(shù) 370 億，在 14.8 萬億 token 上進行了預訓練。

多項評測成績超越 Qwen2.5-72B 和 Llama-3.1-405B 等開源模型，性能比肩 GPT-4o 和 Claude-3.5-Sonnet 等世界頂尖閉源模型。

國產(chǎn)大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

國產(chǎn)大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

該模型在知識、長文本、代碼、數(shù)學和中文等方面均取得顯著進步，尤其在算法代碼和數(shù)學方面表現(xiàn)突出，生成速度提升至 60 TPS，相比 V2.5 提升了 3 倍。

官方開源了原生 FP8 權重，并提供 BF16 轉換腳本，方便社區(qū)適配和應用。SGLang、LMDeploy、TensorRT-LLM 和 MindIE 已支持 V3 模型推理。

DeepSeek-V3 更新上線的同時，DeepSeek 還調整了 API 服務價格，模型 API 服務定價也將調整為每百萬輸入 tokens 0.5 元（緩存命中）/ 2 元（緩存未命中），每百萬輸出 tokens 8 元。

國產(chǎn)大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

官方還決定為全新模型設置長達 45 天的優(yōu)惠價格體驗期：即日起至 2025 年 2 月 8 日，DeepSeek-V3 的 API 服務價格仍然會是大家熟悉的每百萬輸入 tokens 0.1 元（緩存命中）/ 1 元（緩存未命中），每百萬輸出 tokens 2 元，已經(jīng)注冊的老用戶和在此期間內注冊的新用戶均可享受以上優(yōu)惠價格。

國產(chǎn)大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： DeepSeek-V3 AI 大語言模型 人工智能

評論

相關推薦

東南大學人工智能03

資源下載人工智能計算機科學聲音識別 | 2007-04-20

仿人機器人

資源下載仿人機器人傳感器人工智能 | 2007-04-19

東南大學人工智能01

資源下載人工智能語言識別圖像識別自然語言處理專家系統(tǒng) | 2007-04-20

本科畢業(yè)設計：一種基于發(fā)育思想的語音識別系統(tǒng)實現(xiàn)

資源下載語音識別人工智能自主式機器發(fā)育思想自組織映射網(wǎng)絡簡單反饋神經(jīng)網(wǎng)絡 | 2007-04-19

限制沒啥用！谷歌前CEO：中國人非常聰明

智能計算人工智能谷歌 | 2024-12-17

微軟囤貨是 Meta 兩倍多，英偉達 AI 芯片最大買家曝光

智能計算微軟 OpenAI 英偉達人工智能 | 2024-12-19

OpenAI每周活躍用戶數(shù)量飆升至3億希望未來一年達10億

智能計算 OpenAI 人工智能 | 2024-12-05

具有人工智能的溫度控制電路圖

設計方案具有人工智能溫度控制電路圖 | 2012-07-24

人工智能歷史

Lamborghini | 2011-03-15

傳馬斯克的\"友商\"擔心被報復紛紛示好特朗普

汽車電子馬斯克特朗普 OpenAI 人工智能 | 2024-12-04

未來的人工智能世界：技術與人文的和諧還是斗爭？

藍盒子 | 2007-09-11

工信部決定成立部人工智能標準化技術委員會

智能計算人工智能 AI | 2024-12-13

比亞迪也要造人形機器人，全球招聘具身智能人才

機器人人形機器人比亞迪人工智能 | 2024-12-17

簡單人工智能的溫度控制電路

設計方案簡單人工智能溫度控制 | 2009-07-06

STC-人工智能二維生命探測儀

renazan2000 | 2013-01-14

個人-口罩識別系統(tǒng)項目采訪

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-28

個人-窗口衛(wèi)士項目采訪

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-28

蘋果AI負責人稱公司對開發(fā)通用人工智能不感興趣，短期內難實現(xiàn)

智能計算蘋果 AI 人工智能 | 2024-12-10

機器里的大腦：一位“隱士”開發(fā)者的人工智能夢（上篇）

隨風搖擺 | 2015-11-09

人工智能與機器人

視頻物聯(lián)網(wǎng) 可穿戴設備智能硬件高峰論壇機器人人工智能 | 2015-01-19

有簡單人工智能的溫度控制電路圖

設計方案簡單人工智能溫度控制電路圖 | 2010-09-01

具有人工智能的溫度控制電路設計

設計方案具有人工智能溫度控制電路設計 | 2012-07-24

國產(chǎn)大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

智能計算 DeepSeek-V3 AI 大語言模型人工智能 | 2024-12-27

機器里的大腦：一位“隱士”開發(fā)者的人工智能夢（下篇）

隨風搖擺 | 2015-11-16

特朗普第二個任期影響科技的指南：將改變人工智能、能源等

智能計算特朗普人工智能 | 2024-12-13

AI“軍備競賽”再提速！亞馬遜(AMZN.US)推出全新芯片陣列和大語言模型

智能計算 AI 亞馬遜 AMZN.US 芯片陣列大語言模型 | 2024-12-04

有簡單人工智能的溫度控制電路

設計方案簡單人工智能溫度控制 | 2009-09-01

微軟X英特爾黑客松大賽

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-27

ADI公司：工業(yè)4.0——人工智能的端

視頻 ADI 人工智能工業(yè)4.0 | 2019-11-08

東南大學人工智能02

資源下載人工智能大規(guī)模集成電路自適應能力 | 2007-04-20

焦點

推薦視頻

技術專區(qū)

關閉