色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 微軟發(fā)布 Phi-3.5 系列 AI 模型：上下文窗口 128K，首次引入混合專(zhuān)家模型

微軟發(fā)布 Phi-3.5 系列 AI 模型：上下文窗口 128K，首次引入混合專(zhuān)家模型

作者：時(shí)間：2024-08-21 來(lái)源：IT之家

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

收藏

IT之家 8 月 21 日消息，微軟公司今天發(fā)布了 Phi-3.5 系列 AI 模型，其中最值得關(guān)注的是推出了該系列首個(gè)混合專(zhuān)家模型（MoE）版本 Phi-3.5-MoE。

本文引用地址：http://cafeforensic.com/article/202408/462244.htm

微軟發(fā)布 Phi-3.5 系列 AI 模型：上下文窗口 128K，首次引入混合專(zhuān)家模型

本次發(fā)布的 Phi-3.5 系列包括 Phi-3.5-MoE、Phi-3.5-vision 和 Phi-3.5-mini 三款輕量級(jí) AI 模型，基于合成數(shù)據(jù)和經(jīng)過(guò)過(guò)濾的公開(kāi)網(wǎng)站構(gòu)建，上下文窗口為 128K，所有模型現(xiàn)在都可以在 Hugging Face 上以 MIT 許可的方式獲取。IT之家附上相關(guān)介紹如下：

Phi-3.5-MoE：首個(gè)混合專(zhuān)家模型

Phi-3.5-MoE 是 Phi 系列中首個(gè)利用混合專(zhuān)家（MoE）技術(shù)的模型。該模型在 16 x 3.8B MoE 模型使用 2 個(gè)專(zhuān)家僅激活了 66 億個(gè)參數(shù)，并使用 512 個(gè) H100 在 4.9T 標(biāo)記上進(jìn)行了訓(xùn)練。

微軟研究團(tuán)隊(duì)從零開(kāi)始設(shè)計(jì)該模型，以進(jìn)一步提高其性能。在標(biāo)準(zhǔn)人工智能基準(zhǔn)測(cè)試中，Phi-3.5-MoE 的性能超過(guò)了 Llama-3.1 8B、Gemma-2-9B 和 Gemini-1.5-Flash，并接近目前的領(lǐng)先者 GPT-4o-mini。

Phi-3.5-vision：增強(qiáng)型多幀圖像理解

Phi-3.5-vision 共有 42 億個(gè)參數(shù)，使用 256 個(gè) A100 GPU 在 500B 標(biāo)記上進(jìn)行訓(xùn)練，現(xiàn)在支持多幀圖像理解和推理。

Phi-3.5-vision 在 MMMU（從 40.2 提高到 43.0）、MMBench（從 80.5 提高到 81.9）和文檔理解基準(zhǔn) TextVQA（從 70.9 提高到 72.0）上的性能均有提高。

Phi-3.5-mini：輕量級(jí)、強(qiáng)功能

Phi-3.5-mini 是一個(gè) 38 億參數(shù)模型，超過(guò)了 Llama3.1 8B 和 Mistral 7B，甚至可媲美 Mistral NeMo 12B。

該模型使用 512 個(gè) H100 在 3.4T 標(biāo)記上進(jìn)行了訓(xùn)練。該模型僅有 3.8B 個(gè)有效參數(shù)，與擁有更多有效參數(shù)的 LLMs 相比，在多語(yǔ)言任務(wù)中具有很強(qiáng)的競(jìng)爭(zhēng)力。

此外，Phi-3.5-mini 現(xiàn)在支持 128K 上下文窗口，而其主要競(jìng)爭(zhēng)對(duì)手 Gemma-2 系列僅支持 8K。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：微軟 生成式AI Phi-3.5

評(píng)論

相關(guān)推薦

特斯拉推送 FSD v12.5.1 更新，變道更早、更自然

汽車(chē)電子特斯拉 FSD v12.5.1 變道 Cybertruck 輔助駕駛 | 2024-07-29

英偉達(dá)四天累計(jì)上漲17%，市值增加4200億美元

智能計(jì)算英偉達(dá) 微軟 | 2024-08-14

[轉(zhuǎn)帖]微軟正式在中國(guó)發(fā)布最新的嵌入式系統(tǒng)

amine | 2002-05-17

微軟發(fā)布 Phi-3.5 系列 AI 模型：上下文窗口 128K，首次引入混合專(zhuān)家模型

智能計(jì)算微軟生成式AI Phi-3.5 | 2024-08-21

KJZ6-5三相可控硅觸發(fā)板電原理圖

設(shè)計(jì)方案 KJZ6-5 三相可控硅觸發(fā) 板電原理 | 2009-07-06

Windows CE 開(kāi)發(fā)初步

資源下載微軟 Windows CE 無(wú)線(xiàn)裝置 | 2007-12-20

OpenAI宣布改變開(kāi)發(fā)者大會(huì)舉辦形式不會(huì)公布GPT-5

智能計(jì)算 OpenAI 開(kāi)發(fā)者 GPT-5 | 2024-08-07

同創(chuàng)ATX-200SE-3型開(kāi)關(guān)電源(KA7500B) 電路

設(shè)計(jì)方案同創(chuàng) ATX-200SE-3 開(kāi)關(guān)電源 KA7500B 電路 | 2009-07-06

英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

智能計(jì)算英特爾 AI解決方案 Meta Llama 3.1 | 2024-07-25

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

微軟Q4營(yíng)收647億美元凈利220億盤(pán)后一度大跌7%

微軟云服務(wù) | 2024-07-31

哪位需要微軟嵌入式大會(huì)的講義請(qǐng)舉手.

jackwang | 2002-05-16

微軟嵌入式技術(shù)教育大會(huì)專(zhuān)訪(fǎng)實(shí)錄(老站轉(zhuǎn))

amine | 2002-05-16

比爾·蓋茨在微軟的最后一天——蓋茨攜好萊塢巨星出演搞笑片

視頻微軟比爾·蓋茨 CES | 2008-07-09

高通驍龍 7s Gen 3 芯片宣傳材料曝光：CPU / GPU / AI 性能提高 20% / 40% / 30%

手機(jī)與無(wú)線(xiàn)通信高通驍龍 7s Gen 3 | 2024-08-20

微軟平息“AI發(fā)展過(guò)快”擔(dān)憂(yōu)，英偉達(dá)股價(jià)狂飆13%

智能計(jì)算微軟 AI 英偉達(dá) | 2024-08-01

2002-5-19后的3個(gè)會(huì)議

hpnet | 2002-05-19

用高效開(kāi)關(guān)控制器LT1148-5制作的2A降壓直流變換電源

設(shè)計(jì)方案高效開(kāi)關(guān) 控制器 LT1148-5 制作降壓直流變換 | 2009-07-06

MSP430 IAR 3.42環(huán)境使用指南（中文完整版?。?

資源下載 TI 軟件介紹 MSP430 IAR 3.42環(huán)境 | 2007-11-28

5.8GHz微波接收機(jī)電路設(shè)計(jì)

資源下載微波微波接收機(jī) 電路設(shè)計(jì) 5.8GHz | 2007-12-25

Cyclone 與Spartan-3對(duì)比

資源下載 altera Cyclone 與Spartan-3 器件對(duì)比 | 2007-12-13

可控硅三相過(guò)零觸發(fā)控制板KJZ6-3電原理圖

設(shè)計(jì)方案可控硅三相觸發(fā) 控制板 KJZ6-3 原理 | 2009-07-06

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

決戰(zhàn)希臘：微軟“創(chuàng)新杯”2009實(shí)況-——軟件設(shè)計(jì)和嵌入式開(kāi)發(fā)項(xiàng)目組決賽1

視頻微軟嵌入式創(chuàng)新杯 | 2009-07-07

微軟2002嵌入式技術(shù)教育大會(huì)情況（4月11-12）北京(老站轉(zhuǎn))

amine | 2002-05-16

新AI芯片推遲上市，這對(duì)英偉達(dá)影響有多大？

智能計(jì)算 AI 芯片英偉達(dá) B200 Blackwell GPU Meta 微軟 | 2024-08-05

決戰(zhàn)希臘：微軟“創(chuàng)新杯”2009實(shí)況-——軟件設(shè)計(jì)和嵌入式開(kāi)發(fā)項(xiàng)目組決賽3

視頻微軟嵌入式創(chuàng)新杯 | 2009-07-08

決戰(zhàn)希臘：微軟“創(chuàng)新杯”2009實(shí)況-——軟件設(shè)計(jì)和嵌入式開(kāi)發(fā)項(xiàng)目組決賽4

視頻微軟嵌入式創(chuàng)新杯 | 2009-07-08

決戰(zhàn)希臘：微軟“創(chuàng)新杯”2009實(shí)況-——軟件設(shè)計(jì)和嵌入式開(kāi)發(fā)項(xiàng)目組決賽2

視頻微軟嵌入式創(chuàng)新杯 | 2009-07-07

由MIC5156-3.3構(gòu)成的由5V變?yōu)?.3V的穩(wěn)壓器電路

設(shè)計(jì)方案 MIC5156-3.3 構(gòu)成穩(wěn)壓器電路 | 2009-07-06

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區(qū)