色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 市場(chǎng)分析 > 清華大學(xué)電子工程系主任汪玉：中國(guó)的AI生態(tài)，需要各環(huán)節(jié)全流程優(yōu)化

清華大學(xué)電子工程系主任汪玉：中國(guó)的AI生態(tài)，需要各環(huán)節(jié)全流程優(yōu)化

作者：時(shí)間：2024-01-31 來(lái)源：AI 先行者沙龍實(shí)錄

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

非常榮幸，能夠在這里分享我自己對(duì)于大模型這個(gè)行業(yè)目前的一些認(rèn)識(shí)。首先說(shuō)一下我，我是清華大學(xué)電子工程系的教授，今天在座各位可能做算法和應(yīng)用比較多。但我是一位做硬件、芯片和基礎(chǔ)軟件更多的學(xué)者，以及有過(guò)一定的創(chuàng)業(yè)經(jīng)歷，所以從我的角度來(lái)給大家去講一講我怎么去看人工智能，特別是這一波大模型的發(fā)展。

本文引用地址：http://cafeforensic.com/article/202401/455247.htm

大模型這一次出來(lái)以后對(duì)于 AIGC、自動(dòng)駕駛、科學(xué)計(jì)算，特別是我最感興趣的機(jī)器人方向有著非常大的促進(jìn)作用，作為電子系的系主任，每年 9 月份我都會(huì)在新生的迎新活動(dòng)上講話。在跟這 200 多名新生去分析未來(lái)從事行業(yè)的時(shí)候，其中有一個(gè)方向就會(huì)去講機(jī)器人這個(gè)方面。這幾年的高考人數(shù)還比較多，競(jìng)爭(zhēng)是比較激烈的，因?yàn)楫?dāng)年是 1800 萬(wàn)的出生人口，到了去年和前年大概是 800 萬(wàn)左右的出生人口。我每次問(wèn)他們說(shuō)，同學(xué)們你們看一看我今年 40 多歲了，為祖國(guó)可以健康工作到 50 歲，甚至更多，等我到了七八十歲，也就是 30 年以后誰(shuí)來(lái)照顧我是一個(gè)問(wèn)題。那個(gè)時(shí)候人不夠了，2050 年贍養(yǎng)老人的壓力是很大的，因?yàn)槲覀兊?GDP 要發(fā)展，GDP 等于什么？GDP=人數(shù)×人均 GDP。現(xiàn)在中國(guó)經(jīng)濟(jì)發(fā)展的基本特征由高速增長(zhǎng)轉(zhuǎn)向高質(zhì)量發(fā)展，那就提高人均 GDP，但是如果人口降了，光提高人均 GDP 可能也趕不上，所以我們還是要大力推動(dòng)機(jī)器人這個(gè)行業(yè)。

我們可以看見中國(guó)服務(wù)機(jī)器人的產(chǎn)量已經(jīng)在進(jìn)一步提升，當(dāng)然目前還是完成一些相對(duì)簡(jiǎn)單的任務(wù)，但已經(jīng)開始深入千家萬(wàn)戶。我以這個(gè)舉例子，我們可以看到在通用機(jī)器人，包括人形機(jī)器人領(lǐng)域，一方面需要很多決策算法，我們可以看到狀態(tài)空間不斷地增大，用更大的算力和更好的算法能夠解決更復(fù)雜的問(wèn)題。另外一個(gè)層面，感知的能力在不斷升級(jí)?？梢钥吹轿覀冞@幾年包括像 Google、特斯拉這樣的企業(yè)，實(shí)踐過(guò)程中都是把感知、決策和控制集合在一起了，這是一個(gè)很大的系統(tǒng)。

在這么大的系統(tǒng)里面，要用端到端的大模型，在其中實(shí)時(shí)進(jìn)行操作，這對(duì)于計(jì)算量、響應(yīng)速度、吞吐量都有很高的要求，所以這一類應(yīng)用場(chǎng)景就給我們提出了「硬件怎么樣能夠跟上軟件的發(fā)展」，甚至是「支撐軟件的發(fā)展」的更高要求。

從我的角度來(lái)看，我覺得主要有三個(gè)方面的挑戰(zhàn)：

第一，當(dāng)然這也是面向中國(guó)大陸非常重要的挑戰(zhàn)，從 2022 年到 2023 年兩次的法案對(duì)算力的限制、對(duì)芯片的限制。

第二，現(xiàn)在推理和包括訓(xùn)練的成本是非常高的，在座的各位做創(chuàng)業(yè)也好、大公司也好，都會(huì)面臨這樣的一個(gè)挑戰(zhàn)。

第三，我們中國(guó)其實(shí)是比較獨(dú)特的一類算法和芯片的生態(tài)，怎么樣能夠去更好地推動(dòng)這樣一個(gè)生態(tài)的發(fā)展，其實(shí)也是現(xiàn)在面臨的一個(gè)很重要的挑戰(zhàn)。

首先，芯片和算力。

芯片是我最了解的東西，從設(shè)計(jì)、制造，到測(cè)試封裝，最后造出來(lái)，這里面中國(guó)的產(chǎn)業(yè)鏈并不是完全自主可控的，有很多環(huán)節(jié)需要進(jìn)口，比如說(shuō) EDA 的軟件最大的幾家都是美國(guó)的，制造生產(chǎn)過(guò)程中的一些關(guān)鍵的材料、設(shè)備，其實(shí)中國(guó)都還在努力追趕的過(guò)程中。

芯片的制造，包括剛才說(shuō)了 1017 法案限制了我們芯片算力的密度，中國(guó)正在討論 1Tops/Watt 的設(shè)計(jì)（就是每瓦能夠提供 1T 次運(yùn)算）。人腦的功耗大概是 20 瓦，在有一些任務(wù)上我們類比了一下則需要 1000Tops/Watt 這樣的指標(biāo)，那怎么樣通過(guò)芯片做到 Tops，甚至幾百 T 幾千 Tops/Watt？在過(guò)去幾年里，計(jì)算芯片從大概 1G 次 Tops/Watt 做到了 10Tops、甚至 100Tops，通過(guò)尺寸微縮的紅利，實(shí)現(xiàn)了各種各樣的專用處理器?，F(xiàn)在我們開始關(guān)注做近存儲(chǔ)計(jì)算和存內(nèi)計(jì)算，因?yàn)閿?shù)據(jù)搬運(yùn)比數(shù)據(jù)計(jì)算更費(fèi)電了，搬數(shù)（帶寬）更加復(fù)雜；再進(jìn)一步，我們也在看有沒(méi)有不用硅基芯片，不用微電子，而用光電子去做的芯片，這是我們所關(guān)注的一系列研究方向。PPT 右側(cè)是講機(jī)器人領(lǐng)域，機(jī)器人是異構(gòu)的，這里我們不展開?？偟膩?lái)說(shuō)，我們有各種各樣的路徑，比如說(shuō)通過(guò)設(shè)計(jì)新的芯片架構(gòu)，能夠提高每瓦特的算力。

另外一個(gè)方面，其實(shí)大模型的發(fā)展需要很高的互聯(lián)的帶寬。從推導(dǎo)出的數(shù)據(jù)中，我希望大家能夠看到很多信息，比如說(shuō)通信量，根據(jù)實(shí)驗(yàn)室理論計(jì)算，GPT-3 所需要的互聯(lián)帶寬是 1380TB/s，一個(gè)英偉達(dá)的卡它自帶的 600GB/s 互聯(lián)帶寬與這一需求之間的差距是很大的，這也是為什么需要把很多很多塊卡聯(lián)在一起，才能把這個(gè)模型訓(xùn)練出來(lái)?，F(xiàn)在計(jì)算性能的提升比帶寬的增速要大，目前在中國(guó)的互聯(lián)應(yīng)用場(chǎng)景里，怎么樣把機(jī)器連起來(lái)是非常費(fèi)勁的。

算力受限之后，比如訓(xùn)練 GPT-4 是用到 2.4 萬(wàn)張 A100 GPU（當(dāng)我們進(jìn)口的單卡能力受限了，而且我們自己的芯片能力本身不如 A100 的話），那么我可能需要 10 萬(wàn)塊算力卡才能完成這些計(jì)算工作。但這 10 萬(wàn)塊卡怎么互聯(lián)在一起做訓(xùn)練，這件事本身是對(duì)中國(guó)的 AI 系統(tǒng)能力提出的一個(gè)更高的、更難的需求，需要在系統(tǒng)層面進(jìn)行突破。

大家簡(jiǎn)單算一下，哪怕每一個(gè)卡或者每一臺(tái)機(jī)器出錯(cuò)的概率是萬(wàn)分之一，但連成十萬(wàn)次的出錯(cuò)概率，一定遠(yuǎn)大于連成一萬(wàn)次。出錯(cuò)的概率如此大，這是一個(gè)非常難的課題。

其次，就是成本。

現(xiàn)在我們也看到了很多廠商都在做自己的模型，不管是做基礎(chǔ)模型，還是訓(xùn)一個(gè)自己的垂類模型，成本都是非常不友好的。所以我也很期待看一看張拳石老師（下一位演講者），看看他們是怎么在學(xué)校里面做大模型的研究的。同時(shí)我們更需要跟工業(yè)界合作，因?yàn)橛?xùn)練的成本確實(shí)是一個(gè)非常嚴(yán)肅的問(wèn)題。

那么推理會(huì)好一些嗎？我們發(fā)現(xiàn)也不會(huì)。我們看到一些數(shù)據(jù)：按不同模型的類型、用戶數(shù)來(lái)算，算力費(fèi)用=日活用戶×平均 token 使用數(shù)×單位 token 算力費(fèi)用，自建算力集群的情況下，每天的費(fèi)用是 690 萬(wàn)。如果你要調(diào)用現(xiàn)有 API 來(lái)運(yùn)營(yíng)，費(fèi)用會(huì)更高。所以如果 GPT-4 Turbo 每天服務(wù) 10 億的活躍用戶，每年算力成本是兩千多個(gè)億，雖然這個(gè)數(shù)今天不一定準(zhǔn)確，但是數(shù)量級(jí)在這。我相信絕大多數(shù)中國(guó)的公司，收入是在億這個(gè)量級(jí)，肯定不是在千億這個(gè)量級(jí)，所以怎么樣去打平這個(gè)成本是非常難的一件事情。同樣，對(duì)于一個(gè)個(gè)體來(lái)說(shuō)，如果一個(gè)用戶平均每天瀏覽 10 篇文章，一年的成本可能就是 5000 塊錢，試想誰(shuí)愿意花 5000 塊錢來(lái)使用這樣一個(gè)單一功能？一定是不愿意的。

所以我們?cè)谒伎即竽Ｐ偷某杀?，舉一些例子，比如《三體 3》全書 40 萬(wàn)字，如果我用 GPT-4 Turbo 來(lái)去做估算，一次就需要大概幾十塊人民幣。這個(gè)量級(jí)讓我覺得這件事情不是剛需，可能一塊錢、一毛錢甚至一分錢以下才是我可以接受的。還有電商購(gòu)物，我為了讓大家買一個(gè) 100 塊錢以內(nèi)的東西，要花幾十塊錢勸他買或者幫他買嗎？這是不可能的。成本是大模型推理未來(lái)必須要考慮的，降低成本才有希望實(shí)現(xiàn)大規(guī)模商業(yè)應(yīng)用。

我是一個(gè)做硬件的，我的角度去看，垂類模型一定是可以做到更小的。不需要千億級(jí)別參數(shù)，通過(guò)優(yōu)化模型這一側(cè)的大小，我們可以通過(guò)降低每一次調(diào)用的計(jì)算次數(shù)或存儲(chǔ)的次數(shù)，進(jìn)而降低處理器的功耗；此外，我們會(huì)發(fā)現(xiàn)還有一些可能的方法，比如算法方面的優(yōu)化、對(duì)于模型本身的算子的優(yōu)化；來(lái)到云端，我們還可以做錯(cuò)峰把閑置的算力用起來(lái)；以及我自己最擅長(zhǎng)的芯片硬件層面，在端側(cè)做一類能夠跑大模型的硬件，專用于大模型的高效計(jì)算等。

通過(guò)這一整套從算法到芯片的協(xié)同優(yōu)化工作，大家想一想如果成本能夠降低 4 個(gè)數(shù)量級(jí)的話，從 100 塊到 1 分錢級(jí)別，我相信很多習(xí)以為常的事情就都可以用大模型了。

最后，是生態(tài)。

首先芯片層，絕大多數(shù)的人會(huì)直接在英偉達(dá)上搭建環(huán)境，很多西方國(guó)家也很郁悶，也被英偉達(dá)生態(tài)卡著。所以有些人試圖擺脫這種生態(tài)束縛，比如 Google 要做 TPU，以更低的價(jià)格來(lái)服務(wù)更多的用戶，但它的用戶目前還相對(duì)少。AMD 最近發(fā)布了一款 MI300，使股價(jià)一下子提高了很多，因?yàn)樗锌赡苣軌蚋ミ_(dá) PK 了。其次是模型層，有很多模型，這一點(diǎn)大家都是一樣的。然后中間層，在美國(guó)至少大家會(huì)分層去做軟件服務(wù)以及一些軟件類的收費(fèi)，所以在軟件中間層，可以看到已經(jīng)有一批企業(yè)在為這件事情努力，幫助這些模型公司把算力發(fā)揮到極致。

而在中國(guó)，模型層我們有「百模大戰(zhàn)」，芯片層是我比較熟悉的，有看到一些芯片廠商，有十家到二十家還不錯(cuò)的企業(yè)，正在努力突破巨頭的束縛，也有一些初創(chuàng)企業(yè)正在融資。在模型層和芯片層之間，怎么做高效的部署，也是一個(gè)非常重要的話題。

我們也在思考，是不是應(yīng)該有一類相對(duì)統(tǒng)一的中間層，能夠支持長(zhǎng)文本、能夠做到更高的性價(jià)比、能夠做到一鍵部署，并且里面有一些工具可以輔助算法和應(yīng)用的開發(fā)商們。把算法壓縮、算子優(yōu)化包括自動(dòng)編譯全都囊括在內(nèi)，這樣做成的一類中間層，是有望把 M 個(gè)大模型和 N 個(gè)硬件更好地匹配起來(lái)的，這是一個(gè)理想，我們做理想的同時(shí)就得去找資金，一塊來(lái)干這個(gè)事情。所以最近我們也在努力地做這樣一個(gè)中間層，作為在云端優(yōu)化不同的中國(guó)的（當(dāng)然也有英偉達(dá)和 AMD）算力的第一步，以此來(lái)支撐更多不同的模型。

中國(guó)的大模型生態(tài)，最后是需要應(yīng)用、模型、算法框架開發(fā)平臺(tái)和基礎(chǔ)設(shè)施聯(lián)合起來(lái)做的，今天我看了看日程，絕大部分不是討論硬件的，所以把我硬件放在第一個(gè)，謝謝知乎舉辦了這么好一個(gè)活動(dòng)，將大家匯聚到一起，去思考大模型應(yīng)該怎么走。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：

評(píng)論

相關(guān)推薦

可靠性好的交流固體繼電器

資源下載 | 2007-02-16

可控硅交流調(diào)壓器

資源下載 | 2007-02-16

T2803/T2813 WDECT/NDCT 2.5 GHz收發(fā)器

設(shè)計(jì)方案 T2803 T2813 WDECT 收發(fā)器 | 2009-07-06

英國(guó)Pickering公司推出新款21槽全混合PXIe機(jī)箱,提供更高的信號(hào)密度、功率和制冷能力

測(cè)試測(cè)量 Pickering 21槽 PXIe機(jī)箱 | 2023-11-16

開關(guān)穩(wěn)壓電源原理設(shè)計(jì)與實(shí)用電路2

資源下載 | 2007-02-16

[職場(chǎng)]名企精英的跳槽軍規(guī)

liujt_ic | 2005-09-01

寬輸入范圍、多隔離輸出計(jì)算機(jī)電源設(shè)計(jì)方法

資源下載 | 2007-02-16

[轉(zhuǎn)帖]談一下我的實(shí)習(xí)經(jīng)歷及想法

Gao | 2005-09-01

用一運(yùn)放搭一20M 低通濾波器

麥莎就是我 | 2005-09-01

BOE(京東方)亮相2023高交會(huì) “屏之物聯(lián)”引領(lǐng)數(shù)智時(shí)代新氣象

物聯(lián)網(wǎng)與傳感器 BOE 京東方 2023高交會(huì) 屏之物聯(lián) | 2023-11-16

SA2421 2.45 GHz低電壓RF收發(fā)器

設(shè)計(jì)方案 SA2421 電壓收發(fā)器 | 2009-07-06

請(qǐng)教ucos_II+lwip的問(wèn)題

slsh827 | 2005-09-01

RFl09 I/Q 2.4 GHz數(shù)字?jǐn)U頻收發(fā)器

設(shè)計(jì)方案 RFl09 數(shù)字擴(kuò)頻收發(fā)器 | 2009-07-06

英飛凌在2023財(cái)年實(shí)現(xiàn)創(chuàng)紀(jì)錄的營(yíng)收和利潤(rùn)

國(guó)際視野英飛凌 2023財(cái)年 | 2023-11-16

RF2948B QPSK 2.4 GHz擴(kuò)頻收發(fā)器

設(shè)計(jì)方案 RF2948B 擴(kuò)頻收發(fā)器 | 2009-07-06

終極劇透|萬(wàn)眾期待的長(zhǎng)三角電子盛會(huì)即將開幕!

國(guó)際視野長(zhǎng)三角電子盛會(huì) 中國(guó)電子展國(guó)際元器件暨信息技術(shù)應(yīng)用展 | 2023-11-16

[新聞]北京首批高學(xué)歷男護(hù)士上崗遭遇尷尬

liujt_ic | 2005-09-01

RF2938 QPSK 2.4 GHz擴(kuò)頻收發(fā)器

設(shè)計(jì)方案 RF2938 擴(kuò)頻收發(fā)器 | 2009-07-06

美國(guó)澄清并加強(qiáng)了對(duì)中國(guó)半導(dǎo)體出口的限制

國(guó)際視野芯片半導(dǎo)體出口限制芯片禁令 | 2023-11-16

我的飛思卡爾智能車4

視頻 Freescale 智能車 | 2010-02-01

小米汽車已小批量試生產(chǎn)

汽車電子小米汽車新能源汽車 | 2023-11-16

智能循跡車-2003全國(guó)電子設(shè)計(jì)大賽一等獎(jiǎng)

視頻 Freescale 智能車 | 2010-02-01

巢湖學(xué)院飛思卡爾智能車大賽宣傳

視頻 Freescale 智能車 | 2010-02-01

江波龍聯(lián)合多家知名廠商發(fā)起內(nèi)存質(zhì)量聯(lián)盟，促進(jìn)算力產(chǎn)業(yè)高質(zhì)量發(fā)展

網(wǎng)絡(luò)與存儲(chǔ) 江波龍內(nèi)存算力 | 2023-11-16

運(yùn)營(yíng)商支持有針對(duì)性的毫米波部署

手機(jī)與無(wú)線通信毫米波 5G Telstra AT&T | 2023-11-16

科技戰(zhàn)：中國(guó)最大芯片制造商中芯國(guó)際因美國(guó)制裁而急于囤積半導(dǎo)體工具，支出大幅增加

國(guó)際視野半導(dǎo)體市場(chǎng) 國(guó)際 | 2023-11-16

利用AD7542實(shí)現(xiàn)程控電流源

資源下載 | 2007-02-16

日本智能車比賽2005年

視頻 Freescale 智能車 | 2010-02-01

日本智能車比賽2007年次

視頻 Freescale 智能車 | 2010-02-01

IDC預(yù)計(jì)2024年全球半導(dǎo)體市場(chǎng)將達(dá)6330億美元同比增長(zhǎng)20.2%

汽車電子半導(dǎo)體 IDC 汽車電子 | 2023-11-16

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

<tt id="gochn"></tt>