AIGC手機(jī)處理器與傳統(tǒng)AP揮手告別
近年來,隨著大模型技術(shù)的迅猛發(fā)展,手機(jī)廠商紛紛亮相大模型應(yīng)用,成為手機(jī)發(fā)布會(huì)上的焦點(diǎn)。從OPPO的語音助手升級(jí)到vivo的官方宣布自研手機(jī)AI大模型,再到小米將大模型直接整合到手機(jī)系統(tǒng)中,各廠商的競爭可謂激烈異常。這一切的背后,是智能終端已然成為各類AIGC(AI Generated Content)應(yīng)用的新戰(zhàn)場(chǎng)。
首先,大模型的應(yīng)用范圍不斷擴(kuò)展,從圖像生成到文本生成,各類應(yīng)用層出不窮。國內(nèi)廠商推出的文心一言、智譜清言APP,以及國外的OpenAI移動(dòng)版ChatGPT、Llama 2手機(jī)版等,都是大模型在手機(jī)上的典型應(yīng)用。這使得智能終端逐漸成為大模型應(yīng)用的新灘頭。
智能終端芯片拼什么
算力
在將大模型引入手機(jī)時(shí),算力是首當(dāng)其沖的問題。高通在其《混合AI是AI的未來》白皮書中談到:“面對(duì)每日超過 100 億次的搜索量且移動(dòng)端搜索占比超過 60%的情況,生成式 AI 的應(yīng)用將推動(dòng)所需算力的實(shí)質(zhì)性增長,尤其是來自智能手機(jī)端的搜索請(qǐng)求。由于基于生成式 AI 的查詢能夠提供更令人滿意的答案,用戶的搜索方式已經(jīng)開始發(fā)生轉(zhuǎn)變。”高通的第三代驍龍8移動(dòng)平臺(tái)通過強(qiáng)調(diào)硬件加速器,如Hexagon NPU,實(shí)現(xiàn)在手機(jī)上運(yùn)行100億參數(shù)大模型。此外,它還改進(jìn)了傳感器中樞,通過Sensing Hub有助于大模型在手機(jī)端的“定制化”,提升了AI處理效率。
內(nèi)存和能耗
限制大模型進(jìn)入手機(jī)的第二道關(guān)卡是有限的內(nèi)存和電池壓力。聯(lián)發(fā)科表示:“雖然大模型可以帶來更好的生產(chǎn)力,但本地運(yùn)行13B的體量就意味著需要占用約 13GB 的內(nèi)存,再加上安卓本身的 4GB和其他APP內(nèi)存,已經(jīng)超過了大多數(shù)手機(jī)16G的內(nèi)存容量。天璣 9300 使用的內(nèi)存硬件壓縮技術(shù),通過量化和壓縮把大模型的內(nèi)存占用降低,只有這樣才能讓大多數(shù)用戶在日常跑得起大模型應(yīng)用?!?/p>
高通在第三代驍龍8中采用LPDDR5X內(nèi)存,提高了數(shù)據(jù)傳輸速度和帶寬,支持更大更復(fù)雜的AI模型。同時(shí),AI引擎的升級(jí),如Hexagon NPU性能提高了98%,功耗降低了40%,在內(nèi)存和能耗平衡上實(shí)現(xiàn)了更好的性能。聯(lián)發(fā)科也不甘示弱,天璣 9300 集成了 MediaTek 第七代 AI 處理器 APU 790,專為生成式 AI 而設(shè)計(jì),其性能和能效相較上一代得到顯著提升,整數(shù)運(yùn)算和浮點(diǎn)運(yùn)算的性能是前一代的兩倍,功耗降低了45%。
互聯(lián)
目前,AI 已廣泛應(yīng)用于各種物聯(lián)網(wǎng)垂直領(lǐng)域,包括零售、安全、能源和公共設(shè)施、供應(yīng)鏈和資產(chǎn)管理。AI 依靠近乎實(shí)時(shí)的數(shù)據(jù)采集和分析改進(jìn)決策質(zhì)量,優(yōu)化運(yùn)營效率,并賦能創(chuàng)新以打造差異化競爭優(yōu)勢(shì)。通過生成式 AI,物聯(lián)網(wǎng)細(xì)分領(lǐng)域?qū)⑦M(jìn)一步從 AI 的應(yīng)用中受益。在高通的Snapdragon Seamless技術(shù)展示了智能終端的互聯(lián)。這一技術(shù)能夠在不同設(shè)備之間無縫傳輸數(shù)據(jù),為用戶提供更加便捷的跨終端操作體驗(yàn)。這種互聯(lián)不僅使得大模型應(yīng)用在不同設(shè)備之間實(shí)現(xiàn)共享,也為AI解決方案的跨平臺(tái)適用性提供了可能。
AIGC手機(jī)AP亮眼之處
專注AI任務(wù)處理
移動(dòng)AIGC手機(jī)AP相比傳統(tǒng)手機(jī)AP更專注于處理AI相關(guān)任務(wù)。例如vivo的自研芯片、高通的驍龍平臺(tái)以及蘋果M3都是為了提供更出色的AI推理處理而專門設(shè)計(jì)的,突顯了其在AI任務(wù)處理方面的專業(yè)性。
多核心異構(gòu)處理
為了更好地處理不同類型和規(guī)模的AI模型,移動(dòng)AIGC手機(jī)AP可能會(huì)支持多核心異構(gòu)處理。讓我們簡單回顧手機(jī)處理器到目前為止的提升歷史,初期性能的提升主要是依靠CPU內(nèi)核架構(gòu)(比如從Arm Cortex-A5~A15)、提升CPU主頻、同類CPU內(nèi)核數(shù)量。但問題也隨之浮現(xiàn), CPU內(nèi)核性能及數(shù)量的提升帶來的功耗也越來越大,比如單純的依靠四核A15/A17內(nèi)核的處理器,如果用到移動(dòng)平臺(tái),都已經(jīng)出現(xiàn)了嚴(yán)重的功耗問題。而為了解決這一問題,Arm在2011年就研發(fā)了全新的big-Little架構(gòu),即通過大核CPU+小核CPU的組合來平衡性能和功耗問題。
在此之后,三星和聯(lián)發(fā)科都一次推出了“大小核”架構(gòu)的手機(jī)處理器,新的變革出現(xiàn)在2017年,Arm正式發(fā)布了全新的有針對(duì)人工智能及機(jī)器學(xué)習(xí)進(jìn)行優(yōu)化的DynamIQ技術(shù)。而新的DynamIQ big-little將允許在單一計(jì)算集群上進(jìn)行大小核配置,將可配置性提升到了一個(gè)新的臺(tái)階。同時(shí),DynamIQ big.LITTLE還可以對(duì)每一個(gè)處理器進(jìn)行獨(dú)立的頻率控制以及開、關(guān)、休眠三種狀態(tài)的控制,可以實(shí)現(xiàn)在不同任務(wù)間絲滑切換的處理器。2019年,Google博客公布的Pixel Visual Core結(jié)構(gòu)圖中就顯示了AIGC手機(jī)AP中需要多核異構(gòu),這顆芯片內(nèi)部集成了8個(gè)圖像處理核心(lmage Processing Unit,簡稱:IPU),一顆來自ARM的A53核心,同時(shí)還擁有MIPI/LPDDR4/PCle控制器。
此后,包括聯(lián)發(fā)科在內(nèi)的眾多手機(jī)芯片廠商開始全面采用八核“三叢集”架構(gòu)設(shè)計(jì),很多手機(jī)處理器廠商也紛紛效仿。比如,高通最新推出的驍龍8 Gen3采用的就是采1+5+2的八核“三叢集”架構(gòu)。聯(lián)發(fā)科的天璣9300則首次采用了“全大核”CPU設(shè)計(jì),即1個(gè)3.25GHz Cortex-X4超大核+3個(gè)2.85GHz Cortex-X4超大核+4個(gè)主頻2.0GHz Cortex-A720 大核。
更低功耗和高效能
AI 創(chuàng)業(yè)公司 Hugging Face 和卡內(nèi)基梅隆大學(xué)的研究人員分析了 13 種生成式 AI 任務(wù)的耗能,除了生成圖像和文本,還有摘要、對(duì)象檢測(cè)、文本分類等。每項(xiàng)任務(wù)研究人員都會(huì)運(yùn)行 1000 個(gè)提示詞,收集期間消耗的電力。結(jié)果顯示圖像生成最高,文本分類最低。生成圖像的平均耗電量為 0.007 度電(KWh),是文本分類的三倍以上(0.002 度電)。
因此,移動(dòng)AIGC手機(jī)AP需要在AI任務(wù)執(zhí)行時(shí)提供高效的性能,但同時(shí)要求較低的功耗。這是為了確保在移動(dòng)設(shè)備上能夠?qū)崿F(xiàn)可持續(xù)的性能,同時(shí)維持較長的電池壽命。
靈活的軟硬件結(jié)合
移動(dòng)AIGC手機(jī)AP可能會(huì)支持靈活的軟硬件結(jié)合,以便在不同的AI任務(wù)場(chǎng)景下進(jìn)行適應(yīng)性優(yōu)化。這可以通過軟件更新來改進(jìn)AI處理的效能,使手機(jī)能夠不斷適應(yīng)新的AI算法和模型。例如,高通的AI 硬件加速和簡化開發(fā)的軟件解決方案(比如高通 AI 軟件棧),已經(jīng)在引領(lǐng)終端側(cè) AI 推理。聯(lián)發(fā)科則提供了生成式AI開發(fā)套件NeuroPilot,支持快速部署生成式AI模型并在APU上高效運(yùn)行,同時(shí)提供全面的工具鏈以供開發(fā)豐富的AI應(yīng)用程序。
AIGC手機(jī)AP的挑戰(zhàn)與機(jī)遇
在AI模型需求高算力和高功耗的大背景下,智能終端芯片的評(píng)判標(biāo)準(zhǔn)已經(jīng)發(fā)生了變化,小模型對(duì)處理器提出了更具體的技術(shù)需求,尤其在移動(dòng)端應(yīng)用場(chǎng)景下。與傳統(tǒng)手機(jī)AP相比,移動(dòng)AIGC手機(jī)AP更專注于提供高效的AI推理處理,注重多核心異構(gòu)處理、低功耗和高效能的設(shè)計(jì)。這種技術(shù)差異使得移動(dòng)設(shè)備能夠更好地滿足未來AI應(yīng)用對(duì)于移動(dòng)終端處理器的不斷提升的需求,為用戶提供更出色的人工智能體驗(yàn)。
評(píng)論