云邊協(xié)同,生成世界

無(wú)人駕駛、無(wú)人機(jī)、手機(jī)、智能眼鏡、AIPC等領(lǐng)域的蓬勃發(fā)展,不僅是應(yīng)用多樣性的體現(xiàn),更是AI計(jì)算模式從集中式云端向分布式邊緣的根本性轉(zhuǎn)變。
文|孔華威
ID | BMR2004
清晨,當(dāng)你戴上AR眼鏡開(kāi)始規(guī)劃通勤路線,此時(shí)你叫的無(wú)人出租車已在樓下等候;坐進(jìn)車內(nèi),4K會(huì)議系統(tǒng)無(wú)縫接入云端協(xié)作平臺(tái),手里的手機(jī)可以實(shí)時(shí)翻譯外語(yǔ)合同,并標(biāo)注潛在風(fēng)險(xiǎn)條款,這樣一幅未來(lái)生活圖景的實(shí)現(xiàn),背后的核心引擎正是智能算力。
在智能手機(jī)搭載4K視頻與AR眼鏡、出租車市場(chǎng)無(wú)人化的設(shè)定下,一個(gè)關(guān)鍵問(wèn)題是:支撐這些場(chǎng)景的海量AI推理任務(wù)將由云端還是終端承擔(dān)?芯片技術(shù)又該如何突破?
01
算力:AI時(shí)代的核心驅(qū)動(dòng)力
未來(lái)五年,AI算力將是推動(dòng)各行各業(yè)數(shù)字化轉(zhuǎn)型和智能升級(jí)的關(guān)鍵基石。
自2017年Transformer架構(gòu)引發(fā)大語(yǔ)言模型(LLM)革命以來(lái),人工智能的發(fā)展便緊密圍繞“算力、數(shù)據(jù)、算法”三大核心要素展開(kāi)。
在算法層面,Transformer架構(gòu)憑借其強(qiáng)大的并行處理能力和高效的序列建模機(jī)制,已基本確立了主導(dǎo)地位,盡管仍有挑戰(zhàn)者,但其核心地位短期內(nèi)難以撼動(dòng)。數(shù)據(jù)方面,除了傳統(tǒng)的海量互聯(lián)網(wǎng)數(shù)據(jù),合成數(shù)據(jù)和3D時(shí)空數(shù)據(jù)正成為新的、日益重要的資源,為AI模型提供了更廣闊的訓(xùn)練基礎(chǔ)。而算力,作為驅(qū)動(dòng)AI模型訓(xùn)練和推理的“發(fā)動(dòng)機(jī)”,其迭代速度和發(fā)展方向,無(wú)論是云端集中式計(jì)算還是側(cè)端分布式計(jì)算,都呈現(xiàn)出多元且快速的演進(jìn)態(tài)勢(shì),預(yù)示著一場(chǎng)深刻的產(chǎn)業(yè)變革。
從應(yīng)用上看,無(wú)人駕駛、無(wú)人機(jī)、手機(jī)、智能眼鏡、AIPC等領(lǐng)域的蓬勃發(fā)展,不僅是應(yīng)用多樣性的體現(xiàn),更是AI計(jì)算模式從集中式云端向分布式邊緣的根本性轉(zhuǎn)變。
這種轉(zhuǎn)變的深層原因在于,新興AI應(yīng)用對(duì)低延遲、數(shù)據(jù)隱私和網(wǎng)絡(luò)帶寬效率需求迫切。邊緣AI能夠直接在設(shè)備上處理數(shù)據(jù),顯著降低了數(shù)據(jù)傳輸?shù)皆贫嗽俜祷氐难舆t,這對(duì)于自動(dòng)駕駛等需要實(shí)時(shí)決策的場(chǎng)景至關(guān)重要 。同時(shí),本地處理數(shù)據(jù)也增強(qiáng)了用戶隱私保護(hù),減少了敏感信息在網(wǎng)絡(luò)中傳輸?shù)娘L(fēng)險(xiǎn)。此外,通過(guò)在邊緣預(yù)處理和過(guò)濾,可以大幅減少需要傳輸?shù)皆贫说臄?shù)據(jù)量,從而節(jié)約寶貴的網(wǎng)絡(luò)帶寬資源 。這些應(yīng)用層面的特性正在反向驅(qū)動(dòng)算力架構(gòu)的演進(jìn),使其更貼近數(shù)據(jù)源,形成一種新的計(jì)算范式。
未來(lái)五年,AI算力將是推動(dòng)各行各業(yè)數(shù)字化轉(zhuǎn)型和智能升級(jí)的關(guān)鍵基石。從支撐前沿大模型研發(fā)的超大規(guī)模云端數(shù)據(jù)中心,到賦能個(gè)人智能生活和工業(yè)自動(dòng)化的高性能側(cè)端設(shè)備,對(duì)高效、強(qiáng)大且普惠的算力需求將持續(xù)爆發(fā)式增長(zhǎng)。這不僅關(guān)乎技術(shù)進(jìn)步,更將重塑全球計(jì)算基礎(chǔ)設(shè)施的格局。到2030年,全球AI基礎(chǔ)設(shè)施投資預(yù)計(jì)將達(dá)到7萬(wàn)億美元,其中近四分之三將流向數(shù)據(jù)中心。如此大規(guī)模的投資和增長(zhǎng),遠(yuǎn)超傳統(tǒng)IT基礎(chǔ)設(shè)施的升級(jí)速度,這表明AI正成為一種新的計(jì)算范式,需要從根本上重構(gòu)現(xiàn)有的計(jì)算架構(gòu)。這不再是現(xiàn)有系統(tǒng)的簡(jiǎn)單附加,而是對(duì)整個(gè)計(jì)算生態(tài)系統(tǒng)的基礎(chǔ)性重塑。
02
邊緣AI市場(chǎng)的覺(jué)醒
邊緣AI市場(chǎng)正經(jīng)歷一場(chǎng)“寒武紀(jì)”般的爆發(fā),各種AI應(yīng)用在設(shè)備端蓬勃發(fā)展,對(duì)算力提出了多樣化、低功耗和實(shí)時(shí)性的新要求。
來(lái)看一下云端算力 (Cloud Compute)和邊緣算力 (Edge Compute)兩者的發(fā)展。
云端算力,特別是數(shù)據(jù)中心GPU市場(chǎng),在未來(lái)五年仍將保持強(qiáng)勁增長(zhǎng)。預(yù)計(jì)數(shù)據(jù)中心GPU市場(chǎng)將從2024年的873.2億美元增長(zhǎng)到2030年的2280.4億美元,年復(fù)合增長(zhǎng)率達(dá)13.7% 。云服務(wù)提供商(CSPs)將繼續(xù)占據(jù)主導(dǎo)地位,這得益于其在AI基礎(chǔ)設(shè)施上的巨額投資,以及提供“GPU即服務(wù)”的能力,使企業(yè)無(wú)需大量前期投資即可利用先進(jìn)GPU技術(shù)進(jìn)行大規(guī)模模型訓(xùn)練和部署 。
數(shù)據(jù)中心GPU市場(chǎng)增長(zhǎng)主要由AI和機(jī)器學(xué)習(xí)的普及、高性能計(jì)算需求以及云計(jì)算服務(wù)的擴(kuò)展驅(qū)動(dòng)。其中,AI模型訓(xùn)練部分將顯著增長(zhǎng),因?yàn)槠髽I(yè)需要開(kāi)發(fā)和完善大規(guī)模機(jī)器學(xué)習(xí)和AI模型,特別是生成式AI、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等深度神經(jīng)網(wǎng)絡(luò)應(yīng)用,這需要專用的GPU集群。云端仍是大型基礎(chǔ)模型訓(xùn)練的首選平臺(tái),因?yàn)槠淠軌蛱峁┖A康挠?jì)算資源、高速互聯(lián)和數(shù)據(jù)存儲(chǔ)能力,以應(yīng)對(duì)模型參數(shù)量爆炸式增長(zhǎng)帶來(lái)的巨大計(jì)算需求。云服務(wù)提供商將繼續(xù)是AI生態(tài)系統(tǒng)中不可或缺的基礎(chǔ)設(shè)施伙伴,其在推動(dòng)前沿AI研究和大規(guī)模模型開(kāi)發(fā)方面的作用是無(wú)法替代的。
此外,邊緣AI市場(chǎng)正經(jīng)歷一場(chǎng)“寒武紀(jì)”般的爆發(fā),各種AI應(yīng)用在設(shè)備端蓬勃發(fā)展,對(duì)算力提出了多樣化、低功耗和實(shí)時(shí)性的新要求。
邊緣AI市場(chǎng)預(yù)計(jì)將從2024年的493億美元增長(zhǎng)到2030年的819.9億美元,復(fù)合年增長(zhǎng)率8.84% 。其中,邊緣AI加速器市場(chǎng)增長(zhǎng)更為迅猛,預(yù)計(jì)將從2024年的76.8億美元增長(zhǎng)到2034年的942.7億美元,年復(fù)合增長(zhǎng)率高達(dá)28.5% 。這種高速增長(zhǎng)得益于邊緣AI在多個(gè)關(guān)鍵應(yīng)用場(chǎng)景中的不可或缺性。比如,智能手機(jī)在2024年占據(jù)了邊緣AI加速器市場(chǎng)超過(guò)34%的份額,成為推動(dòng)邊緣AI普及的關(guān)鍵力量 。
除了智能手機(jī),智能眼鏡與AR/VR同樣對(duì)實(shí)時(shí)處理、低延遲和高能效的AI算力有極高要求;自動(dòng)駕駛汽車需要實(shí)時(shí)處理來(lái)自毫米波雷達(dá)、激光雷達(dá)和攝像頭的大量傳感器數(shù)據(jù),以進(jìn)行路徑規(guī)劃、目標(biāo)識(shí)別和避障,邊緣AI芯片能夠提供即時(shí)決策能力,避免了云端處理可能導(dǎo)致的延遲風(fēng)險(xiǎn);無(wú)人機(jī)在公共基礎(chǔ)設(shè)施檢查等領(lǐng)域,也需要低功耗的邊緣AI芯片進(jìn)行4K視頻的實(shí)時(shí)推理處理,以實(shí)現(xiàn)遠(yuǎn)距離目標(biāo)檢測(cè)……
值得注意的是,邊緣AI市場(chǎng)(8.84% CAGR)與邊緣AI加速器市場(chǎng)(28.5% CAGR)之間存在顯著的增長(zhǎng)率差異。這種差異暗示了在更廣泛的邊緣AI生態(tài)系統(tǒng)中,硬件組件(特別是專用加速芯片)的增長(zhǎng)速度遠(yuǎn)超其他部分,表明硬件能力是當(dāng)前邊緣AI發(fā)展的關(guān)鍵瓶頸和主要驅(qū)動(dòng)力。
這種現(xiàn)象的出現(xiàn),主要是因?yàn)榇笮虯I模型(特別是LLM)的復(fù)雜性日益增加,需要在資源受限的邊緣設(shè)備上進(jìn)行高效推理,這使得對(duì)專門優(yōu)化的硬件需求激增。此外,隨著AI應(yīng)用從云端向邊緣遷移,對(duì)低功耗、高效率芯片的需求也隨之增長(zhǎng),以滿足電池供電設(shè)備和實(shí)時(shí)應(yīng)用的要求。因此,芯片制造商正大力投資研發(fā),以提供滿足這些特定需求的邊緣AI加速器,從而推動(dòng)了這一細(xì)分市場(chǎng)的快速擴(kuò)張。
03
GPU的狂奔和綠色制約
市場(chǎng)正在從單純的硬件銷售轉(zhuǎn)向更強(qiáng)調(diào)全棧解決方案和生態(tài)系統(tǒng)服務(wù)。
根據(jù)最新預(yù)測(cè),AI芯片市場(chǎng)規(guī)模預(yù)計(jì)將從2025年的1061.5億美元(AI推理市場(chǎng))或863.7億美元(AI芯片組市場(chǎng))增長(zhǎng)到2030年的2549.8億美元至4530億美元不等,年復(fù)合增長(zhǎng)率(CAGR)在14%到26.66%之間。AI計(jì)算機(jī)市場(chǎng)更是預(yù)計(jì)從2024年的510.997億美元飆升至2030年的2816.727億美元,復(fù)合年增長(zhǎng)率高達(dá)34.4% 。整體AI市場(chǎng)規(guī)模預(yù)計(jì)到2030年將達(dá)到12364.7億美元,復(fù)合年增長(zhǎng)率32.9%。
“AI芯片”“AI計(jì)算機(jī)”以及“整體AI市場(chǎng)”的復(fù)合年增長(zhǎng)率存在差異。這種差異揭示了AI價(jià)值鏈的演變。芯片是硬件基礎(chǔ),但其價(jià)值實(shí)現(xiàn)需要通過(guò)集成到完整的系統(tǒng)(如AI PC、AI服務(wù)器)中或通過(guò)提供軟件服務(wù)獲取。高增長(zhǎng)率的領(lǐng)域(AI計(jì)算機(jī)、整體AI市場(chǎng))包含了更多的軟件、系統(tǒng)集成和應(yīng)用層面的價(jià)值。這表明,市場(chǎng)正在從單純的硬件銷售轉(zhuǎn)向更強(qiáng)調(diào)全棧解決方案和生態(tài)系統(tǒng)服務(wù)。
數(shù)據(jù)中心GPU市場(chǎng)由人工智能和機(jī)器學(xué)習(xí)的廣泛采用、對(duì)高性能計(jì)算(HPC)需求的日益增長(zhǎng)以及云計(jì)算服務(wù)的持續(xù)擴(kuò)展所驅(qū)動(dòng)。這些因素共同推動(dòng)了對(duì)GPU的需求,以支持深度學(xué)習(xí)、大型語(yǔ)言模型和數(shù)據(jù)分析等先進(jìn)應(yīng)用。
英偉達(dá)憑借其在GPU技術(shù)和AI生態(tài)系統(tǒng)方面的深厚積累,穩(wěn)固地占據(jù)著云端AI算力的王者地位。其GPU廣泛應(yīng)用于微軟、亞馬遜、谷歌和甲骨文等主要云服務(wù)提供商的AI基礎(chǔ)設(shè)施中 。
邊緣AI芯片的設(shè)計(jì)核心則在于如何在有限的功耗和尺寸下,實(shí)現(xiàn)高性能的AI計(jì)算。邊緣AI算力的技術(shù)方向非常突出,比如模型微型化,3B參數(shù)級(jí)MoE(混合專家)模型成為主流,在保留95%精度的同時(shí),算力需求降至1/10;通過(guò)量化(Quantization)和稀疏化 (Sparsity)減少模型的內(nèi)存占用和計(jì)算量,有效平衡速度、內(nèi)存效率和計(jì)算精度。
此外,需要注意的是,隨著AI模型規(guī)模的指數(shù)級(jí)增長(zhǎng)和計(jì)算密度的不斷提高,數(shù)據(jù)中心正面臨前所未有的能耗和散熱挑戰(zhàn)。因此,基礎(chǔ)設(shè)施創(chuàng)新,特別是能效和互聯(lián)技術(shù),成為未來(lái)五年云端算力發(fā)展的關(guān)鍵。
傳統(tǒng)風(fēng)冷系統(tǒng)已難以滿足現(xiàn)代AI硬件產(chǎn)生的巨大熱量。液冷和浸沒(méi)式冷卻技術(shù)正從利基市場(chǎng)走向主流,成為數(shù)據(jù)中心能效提升的必然選擇。
直接液冷 (Direct Liquid Cooling,簡(jiǎn)稱DLC)是通過(guò)管道和冷板將冷卻液直接循環(huán)到CPU和GPU等發(fā)熱組件,實(shí)現(xiàn)源頭散熱,防止過(guò)熱和性能節(jié)流。例如,聯(lián)想的Neptune水冷技術(shù)通過(guò)直接水冷CPU、GPU和NVIDIA NVSwitch(英偉達(dá)一款高速互聯(lián)的芯片),實(shí)現(xiàn)了高達(dá)40%的功耗降低和3.5倍的熱效率提升,并將數(shù)據(jù)中心PUE(Power Usage Effectiveness)降低到1.1。
浸沒(méi)式冷卻(Immersion Cooling)則是將整個(gè)服務(wù)器浸沒(méi)在非導(dǎo)電液體中,這種方法比風(fēng)冷更能有效地散熱,使AI芯片在持續(xù)高負(fù)載下保持最佳性能。浸沒(méi)式冷卻能夠?qū)崿F(xiàn)更高的計(jì)算密度,減少空間需求,并進(jìn)一步提高能效。
04
云邊協(xié)同,未來(lái)算力架構(gòu)
未來(lái)五年,AI算力將不再是單一維度的競(jìng)爭(zhēng),而是云端與側(cè)端協(xié)同發(fā)展、硬件與軟件深度融合、能效與性能并重的一場(chǎng)深刻變革。
混合AI計(jì)算模型將AI工作負(fù)載智能地分布在云端和邊緣設(shè)備之間,也就是業(yè)界常說(shuō)的“云邊協(xié)同”。
其優(yōu)勢(shì)主要包括可以降低延遲,邊緣設(shè)備處理時(shí)間敏感的數(shù)據(jù),例如自動(dòng)駕駛汽車的實(shí)時(shí)決策,避免了數(shù)據(jù)傳輸?shù)皆贫藥?lái)的延遲;敏感數(shù)據(jù)可以在本地處理,減少了向外部服務(wù)器傳輸?shù)娘L(fēng)險(xiǎn),符合GDPR等數(shù)據(jù)隱私法規(guī)的要求;邊緣AI通過(guò)本地處理數(shù)據(jù),最大程度地減少了互聯(lián)網(wǎng)數(shù)據(jù)傳輸量,從而節(jié)省了網(wǎng)絡(luò)帶寬和云數(shù)據(jù)傳輸及存儲(chǔ)成本;即使在網(wǎng)絡(luò)連接不穩(wěn)定或受限的區(qū)域,邊緣設(shè)備也能獨(dú)立運(yùn)行,提供服務(wù)連續(xù)性;混合AI模型允許企業(yè)根據(jù)工作負(fù)載波動(dòng)動(dòng)態(tài)調(diào)整資源分配,將更復(fù)雜的任務(wù)卸載到云端,同時(shí)在邊緣處理即時(shí)需求,優(yōu)化了成本效益。
與此同時(shí),云邊協(xié)同的挑戰(zhàn)也同樣存在,比如跨云端和邊緣環(huán)境部署和管理AI解決方案需要復(fù)雜的協(xié)調(diào)和集成;邊緣設(shè)備的計(jì)算和存儲(chǔ)資源通常有限,難以運(yùn)行大型復(fù)雜的AI模型;盡管邊緣處理有助于隱私,但分布式環(huán)境下的數(shù)據(jù)安全和治理仍是挑戰(zhàn);要確保云端訓(xùn)練的模型能夠高效地在異構(gòu)邊緣設(shè)備上運(yùn)行并保持一致性,以及模型的持續(xù)更新和維護(hù),都需要精密的策略。
而云邊協(xié)同的技術(shù)創(chuàng)新也值得關(guān)注,比如在數(shù)據(jù)隱私和效率上,為了克服邊緣設(shè)備的資源限制并保障數(shù)據(jù)隱私,模型分區(qū)(Model Partitioning)和聯(lián)邦學(xué)習(xí)(Federated Learning,簡(jiǎn)稱FL)正成為關(guān)鍵技術(shù)。
模型分區(qū)將大型AI模型(特別是LLM)分割成多個(gè)部分,一部分部署在資源受限的邊緣設(shè)備上(客戶端側(cè)模型),另一部分部署在云端服務(wù)器上(服務(wù)器側(cè)模型)。客戶端側(cè)模型處理原始本地?cái)?shù)據(jù),并將中間激活值發(fā)送給服務(wù)器,服務(wù)器則處理剩余的模型部分并梯度返回。這種方法減輕了邊緣設(shè)備的計(jì)算負(fù)擔(dān),同時(shí)減少了數(shù)據(jù)傳輸量。例如,針對(duì)視覺(jué)Transformer模型,自適應(yīng)模型分區(qū)機(jī)制可以根據(jù)設(shè)備資源調(diào)整模型復(fù)雜度,減少層間通信,實(shí)現(xiàn)高達(dá)32.6%的延遲降低和16.6%的能耗節(jié)省 。
聯(lián)邦學(xué)習(xí)則是一種去中心化的機(jī)器學(xué)習(xí)范式,允許在多個(gè)邊緣設(shè)備上共同訓(xùn)練一個(gè)共享模型,而無(wú)需將原始敏感數(shù)據(jù)集中到中央服務(wù)器。這極大地提升了數(shù)據(jù)隱私保護(hù),降低了通信開(kāi)銷,并支持個(gè)性化模型。在物聯(lián)網(wǎng)(IoT)生態(tài)系統(tǒng)中,聯(lián)邦學(xué)習(xí)已成為實(shí)現(xiàn)邊緣AI的關(guān)鍵技術(shù),特別適用于醫(yī)療保健、智能制造和網(wǎng)絡(luò)安全等涉及敏感數(shù)據(jù)的應(yīng)用。通過(guò)結(jié)合聯(lián)邦學(xué)習(xí)和邊緣AI,可以實(shí)現(xiàn)模型準(zhǔn)確性10%~15%的提升,并降低通信成本25%。
未來(lái)五年,AI算力將不再是單一維度的競(jìng)爭(zhēng),而是云端與側(cè)端協(xié)同發(fā)展、硬件與軟件深度融合、能效與性能并重的一場(chǎng)深刻變革。
除《商學(xué)院》雜志署名文章外,其他文章為作者獨(dú)立觀點(diǎn)不代表《商學(xué)院》雜志立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。版權(quán)所有
歡迎關(guān)注平臺(tái)微信公眾號(hào)