前言:
云計算產業正面臨一場由大模型技術引領的變革,背后的驅動力主要有兩個方面:
首先,AI算力和AI軟件的需求增長速度遠遠超過通用算力和傳統軟件;
其次,大模型的應用有助于降低軟件和項目交付的成本。
算力饑渴有望帶動云服務復興
與前兩年的繁榮相比,近兩年來云計算行業面臨困境,增長乏力。
在大模型熱潮的推動下,云計算廠商成為主要受益者之一,被視為實現彎道超車的機會。
預計大模型將帶動云上AI算力的急劇增長,逐漸縮小AI算力工作負載與通用算力的差距,為云廠商帶來新的機遇。
據硅谷知名風投A16Z估計,應用層廠商將大約20%—40%的收入用于推理和模型微調,這部分收入通常直接支付給云廠商或第三方模型提供商。
而第三方模型提供商也將一半左右的收入用于云基礎設施。因此,生成式AI總收入的10%—20%流向了云提供商。
另一方面,OpenAI的研究表明,在最大規模的人工智能模型訓練中,計算量呈指數級增長。
目前大模型訓練所需算力的增速保持在3-4個月/倍速度增長,遠超摩爾定律的增速。
綜上所述,生成式AI的大量資金最終流向了基礎設施,AI大模型訓練為云廠商帶來了可觀的直接營收。
同時,生成式AI推動了整個云服務行業的升級,為其帶來了新的市場增量。
傳統云生態過渡到新型云生態
傳統云生態以軟件、服務為核心。云計算興起過程中,一批銷售、軟件、服務、咨詢、集成伙伴自然聚合在云廠商周邊,形成了[云原生]生態。
云廠商與合作伙伴的默契是,只提供基本的公有云服務(如計算、存儲、網絡、數據庫),其他都交由合作伙伴負責。
這種生態的好處是邊界清晰、分工明確。但過去多年,中國云市場生態建設有大量不足之處。
中國市場應用現代化水平還不高。集成項目、人力外包是目前的主流形態。這帶來的問題是,服務成本高、協同效率低。
在大數據模型時代,新型的云生態系統將以多租戶平臺和AI原生應用為核心。
經過AI技術改造后的應用軟件將在整個生態系統中發揮更加關鍵的作用。
原子化、單點化、碎片化的AI應用將更為豐富,且更具價值。
其價值主要體現在解決上一代云生態系統的主要問題上,即降低服務成本、提高服務效率。
以AI為核心的大模型階段云生態,正逐漸成為主流,并逐步取代舊的云生態。
這一歷史進程是由AI算力占比的持續上升和AI算力成本的持續下降所決定的。
據OpenAI預測,AI大模型的訓練成本將持續快速下降,預計到2030年將降至僅60萬美元。
MaaS成趨勢,大模型服務是主流
隨著大模型的數量日益增多,眾多企業已認識到,獨立訓練大模型并非明智之舉,反而基于現有的通用大模型進行二次開發更為實際且高效。
這一觀點與當前大模型領域中普遍存在的[重復造輪子]現象的應對策略相吻合。
在AI原生應用大量涌現的背景下,除了前期的模型訓練,云服務提供商的盈利空間將更多地來自于向開發者提供強大的基礎大模型,并針對各類業務場景和用戶需求收取AI應用推理費用。
為了實現這一目標,云服務提供商需要確保計算服務的穩定性和推理體驗的優質性,從而在激烈的市場競爭中脫穎而出。
最終,MaaS將成為新的基礎服務,并依賴于新型IT基礎設施進一步顛覆當前的云計算市場格局。
在過去數年中,穩態業務通常部署在主機上,要求絕對穩定性,而敏態業務則更多地構建在云上,以滿足不斷變化的需求。
在此基礎上,目前存在兩種主要的上云模式:一種是平遷上云,成本較低且能保證數據可控性,但同時可用性也較低;
另一種則是將底層架構徹底云原生化改造,雖然成本高、周期長,但可以為企業帶來長期利益。然而,很少有企業能夠承擔暫停服務器進行架構改造的代價。
云服務提供商積極發力
目前,各大云服務提供商正在積極推出大模型平臺,旨在降低大模型的訓練和使用成本。
百度推出了文心千帆大模型平臺,專門面向B端企業用戶。該平臺提供一站式的大模型定制服務,包括數據管理、自動化模型定制微調以及推理服務云端部署等,同時還提供文心一言企業級推理云服務。
騰訊云推出了新一代HCC高性能計算集群,采用最新一代騰訊云星星海自研服務器和NVIDIA H800 Tensor Core GPU,提供高達3.2T的超高互聯帶寬。
阿里云推出了[魔搭社區],這是一個面向用戶的模型服務型平臺。該平臺致力于降低模型的使用門檻,為多個場景提供適配的API。
華為云的一站式AI開發平臺ModelArts為盤古大模型的訓練和推理提供了全面的優化支持,包括計算優化、通信優化、存儲優化和算法優化,成為盤古大模型重要的基礎平臺資源。
字節跳動旗下的云服務平臺火山引擎推出了智能推薦-高速訓練引擎,采用軟硬一體優化設計,支持100GB-10TB+超大模型的高效訓練。
在大模型的影響下,云計算從互聯網時代的CPU云為主向AI時代的GPU云為主的轉變已成為行業共識和必然趨勢。
在更底層的芯片端,除了英偉達之外,高通、英特爾、Arm等廠商也開始將面向大模型訓練與推理的芯片設計與生產納入工作日程,為下一個時代的可能性做好準備。
然而,除了芯片種類與數量的變化,大模型對云計算廠商的影響其實體現在更深層面。
結尾:
對于大模型相關能力的研究和投入,各大云廠商必須給予足夠的重視。
通用人工智能的支持是大勢所趨,也是各大云廠商必須完成的任務。
在這方面,任何疏忽或缺失都可能導致無法在激烈的市場競爭中立足。
因此,各大云廠商應將其視為一個必備的核心能力,不斷加大投入力度,以應對不斷變化的市場需求和競爭態勢。
隨著新需求的涌現,需要構建與之相匹配的新生態,并制定相應的新策略。