為什么說(shuō)邊緣計(jì)算有望成就高通的“算力夢(mèng)” 即時(shí)焦點(diǎn)
6月2日,邊緣計(jì)算概念股持續(xù)活躍,美格智能強(qiáng)勢(shì)漲停。
此前高通公司高級(jí)副總裁表示,高通正在從一家通信公司過(guò)渡到一家邊緣計(jì)算公司。
【資料圖】
國(guó)盛證券指出,與英偉達(dá)在計(jì)算能力相對(duì)應(yīng),高通在全球通信領(lǐng)域處于霸主地位,無(wú)論是從決定無(wú)線通信能力的基帶產(chǎn)品,亦或是決定手機(jī)性能的手機(jī)芯片,高通都擁有絕對(duì)的全球領(lǐng)先地位。而隨著“算力”成為AI時(shí)代的最寶貴資源,高通不滿足于“通信”能力的領(lǐng)先,而是希望依靠通信能力和終端設(shè)備布局,從邊緣側(cè)進(jìn)軍被英偉達(dá)覆蓋的算力領(lǐng)域。
國(guó)盛證券認(rèn)為,隨著AI刺激下,算力加速走向“泛在”,高通有望憑借其手機(jī)芯片,物聯(lián)網(wǎng)芯片、通信芯片三大能力,成為邊緣算力的“英偉達(dá)”。
國(guó)信證券還提到,目前具備運(yùn)行優(yōu)化模型能力的終端僅限頭部品牌旗艦手機(jī),隨著AI大模型在邊緣端落地,有望推動(dòng)新一輪換機(jī)潮。
邊緣算力優(yōu)勢(shì)
邊緣算力,通常指部署在設(shè)備本地的算力或者離用戶距離較近的數(shù)據(jù)中心中的算力,邊緣算力相較于云端算力,擁有低成本、低時(shí)延、高隱私三大特性。
1)低成本:當(dāng)前主流的邊緣算力平臺(tái)主要采用高通主導(dǎo)下的ARM架構(gòu),相比于英偉達(dá)的復(fù)雜架構(gòu),ARM架構(gòu)在小算力時(shí)擁有極低的單位成本,是降低開發(fā)與用戶成本的必然選擇。
2)低時(shí)延:邊緣算力一般搭載在本地,無(wú)需將數(shù)據(jù)發(fā)送至云端并等待回傳的時(shí)間,可以滿足如自動(dòng)駕駛,快速對(duì)話等對(duì)時(shí)延要求高的場(chǎng)景。
3)高隱私:邊緣算力依靠設(shè)備本身搭載的算力或在用戶自有服務(wù)器上的算力進(jìn)行推理,可以實(shí)現(xiàn)數(shù)據(jù)不出用戶管轄范圍,對(duì)隱私的保護(hù)更好。
當(dāng)下邊緣算力主要有兩種存在模式,一種是設(shè)備本身搭載的算力,這類算力通常依托邊緣處理芯片存在,邊緣處理芯片包括了手機(jī)終端上的驍龍與蘋果M平臺(tái),面向IOT設(shè)備的如高通8155芯片或者專為AI優(yōu)化的QCM8550芯片。通常,大單品采用直采芯片+定制PCB的形式進(jìn)行開發(fā),而中小廠商與細(xì)分垂直領(lǐng)域往往采購(gòu)模組來(lái)滿足算力需求。
第二種算力存在形式是邊緣資源池,通常由離用戶較近的核心城市內(nèi)的數(shù)據(jù)中心構(gòu)成,或者由廠區(qū),道路旁的小機(jī)柜、算力盒子提供算力。
AI生態(tài)中最重要的組成部分之一
國(guó)盛證券指出,當(dāng)前市場(chǎng)普遍聚焦于云端算力發(fā)展,忽視了邊緣算力在AI乃至社會(huì)數(shù)字化發(fā)展中的重要地位。隨著AI大模型應(yīng)用逐漸滲透進(jìn)入千行百業(yè)和各類垂直細(xì)分場(chǎng)景,單純的大規(guī)模計(jì)算中心提供的算力將不能滿足多樣化的AI運(yùn)算需求,其認(rèn)為邊緣算力具備不可或缺性:
第一,未來(lái)隨著計(jì)算芯片加速發(fā)展,單位算力成本中,電費(fèi)與土地費(fèi)用占比將愈發(fā)提升,算力成本將取決于智算中心的地理位置,以我國(guó)舉例,未來(lái)算力成本較低的西部將是云端算力主要部署地。因此,大算力與低時(shí)延需求將出現(xiàn)錯(cuò)配。
第二,AI模型推理Token費(fèi)用較貴,如果需要成熟商用,邊緣預(yù)處理將是必須選項(xiàng)。通過(guò)邊緣部署的算力,將用戶的多樣化需求進(jìn)行本地的預(yù)處理,簡(jiǎn)單的需求直接利用本地模型和算力推理,復(fù)雜需求通過(guò)邊緣算力預(yù)處理后,精簡(jiǎn)成最少的TOKEN發(fā)送至云端,從而能夠最低成本的實(shí)現(xiàn)應(yīng)用功能,加速商業(yè)化。
最后,無(wú)論是對(duì)用戶個(gè)人敏感數(shù)據(jù)進(jìn)行推理,還是推理設(shè)計(jì)商業(yè)敏感數(shù)據(jù),完全與云端隔絕的邊緣算力,能為用戶提供最好的數(shù)據(jù)安全保護(hù)。
國(guó)盛證券表示,在生成式AI爆發(fā)前,邊緣算力已經(jīng)逐漸滲透進(jìn)了部分商用場(chǎng)景,如手機(jī)云游戲、無(wú)人設(shè)備駕駛、自動(dòng)視頻識(shí)別等。如今隨著MLC-LLM,谷歌模型體系等軟件基建加速,特斯拉機(jī)器人為具身智能完成物理基建,在終端設(shè)備上推理生成式模型,甚至讓智能設(shè)備同物理世界自主交互的條件已經(jīng)具備,未來(lái)隨著應(yīng)用加速滲透、預(yù)處理模型需求爆發(fā),以及邊緣小模型推理,智能設(shè)備物理交互需求爆發(fā)。
邊緣端落地有望推動(dòng)新一輪換機(jī)潮
國(guó)信證券還提到,AI部署本地化具有必要性,優(yōu)勢(shì)包括更低的延遲、更小的帶寬、提高數(shù)據(jù)安全、保護(hù)數(shù)據(jù)隱私、高可靠性等。完整的大模型僅參數(shù)權(quán)重就占滿一張80G的GPU,但是通過(guò)量化、知識(shí)蒸餾、剪枝等優(yōu)化,大模型可以在手機(jī)本地實(shí)現(xiàn)推理。
其指出,不過(guò)目前具備運(yùn)行優(yōu)化模型能力的終端僅限頭部品牌旗艦手機(jī)。
根據(jù)目前各家公司對(duì)于邊緣端部署的情況推測(cè),即使經(jīng)過(guò)量化、剪枝、蒸餾等方式優(yōu)化大模型后,仍然需要旗艦版的手機(jī)芯片可以勉強(qiáng)承載運(yùn)行。
假設(shè)旗艦機(jī)型主處理器頻率應(yīng)在2.8GHz以上,或是價(jià)格在1000美金以上,根據(jù)IDC數(shù)據(jù),1Q23全球手機(jī)銷量中主處理器頻率超過(guò)2.8GHz的占比36%,銷售價(jià)格在1000美金以上的手機(jī)銷量占比13%。
國(guó)信證券,隨著AI大模型在邊緣端落地,有望推動(dòng)新一輪換機(jī)潮。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: