在過去一年里,大模型浪潮席卷全球,讓人工智能迎來下一個黃金十年。當各種大模型、基礎模型遍地開花,以金山云為代表的公有云廠商憑借底層、平臺層以及應用層渾然一體的天然優勢,在這片藍海市場中占據了有利地位。
▲金山云副總裁 錢一峰
“我們有典型的應用場景,比如:金山辦公WPS等,還有很多知名的大模型廠商,都選擇部署在金山云上?!?關于云+人工智能的未來發展,金山云副總裁錢一峰對記者如是說。
那么,在這場“百?!鄙踔痢扒!贝髴鹬?,金山云要扮演的角色是什么?圍繞通用大模型、行業大模型等不同賽道,如何快速切入市場?在底層技術棧的支撐能力上,如何以差異化優勢贏得客戶?關于這一連串問題,我們可以用幾個關鍵字來概括,那就是“中立”、“行業模型”和“混合云”。
1、 中立
面對令人眼花繚亂的各種模型,金山云首先表明自己的態度,那就是圍繞中立路線,打造大模型全棧服務能力。
至于,金山云為什么要保持中立路線?在諸?;鞈鹬?,如何規劃更具戰略性的大模型技術藍圖,才能搶占未來?金山云公有云產品中心負責人孫曉,首先從產品戰略層面分析了大模型的發展現狀!
從大模型的生產到落地,中間涉及各種能力,不同層面都有不同的玩家。整體來看,可以劃分為三層:第一層,模型層。這一層主要是模型直接催生出來的廠商,包括大模型廠商、行業模型廠商、場景模型廠商。第二層,平臺層。主要包括大模型訓練平臺服務商、云服務商、MaaS平臺服務商。第三層,基礎服務層。比如:基礎設施服務商、算力服務商、網絡服務商、超算中心服務商。
正是上述這些玩家組合在一起,才構成了大模型的百花齊放,讓應用落地成為可能。此種背景下,不同層面的廠商,面臨著不同挑戰。比如:頂層的大模型廠商,花大量算力訓練出來的模型文件不能被競爭對手獲取,所以模型本身的安全性成為企業關注的重點。同時,從用戶應用的角度看,企業私密數據是核心資產,當應用爆發,被大量終端用戶使用,用戶的隱私數據如何有效管理?更確切地說,作為一家云廠商,如何既滿足上層大模型廠商的模型使用需求,同時還能將自己的算力和其他基礎能力賦能給這些模型廠商用戶?這是一個值得深入思考的問題!
另外,上層大模型廠商大部分是初創型公司,他們更關心當前所使用的數據的基礎架構是否具備跨云遷移能力。所以,安全、可靠和跨平臺遷移的基礎設施能力,是企業關注的另一個重要能力!
整體來看,大模型帶來的底層的技術變化是,除了傳統的IaaS和PaaS,會催生出超越之前的算力、網絡、硬件和數據中心能力。而中間面向大模型的平臺層,會以更松耦合的方式支撐上層應用。同時,層與層之間基本以接口的方式去支撐應用,讓用戶不被任何一家廠商綁定,真正按需選擇。
此種背景下,金山云的戰略定位也就變得越發清晰。首先,金山云的立場非常堅定,那就是嚴守中立,做大模型的助力者。其次,在技術能力上,要提供從訓練到推理的全流程云服務。
值得一提的是,保持中立不是一個“口號”,金山云的中立產品理念會以技術可監測的形式嵌入模型相關服務中,比如:通過使用日志提供可接入、可審計的能力。
2、 行業模型
問題是,既然金山云要保持中立,為什么還在規劃推出自己的行業模型“金山云輕舟智問”?
“我們不做通用大模型,但要想進行企業應用落地,甚至去支持整個平臺,一定要在行業模型上需要從頭到尾去進行探索。” 金山云人工智能與大數據產品中心負責人徐寅斐強調。
簡單理解,金山云輕舟智問主攻行業模型,只面向工時價值高的特定領域,或者說只做和自己目前業務相關的特定領域,比如:法律、金融、公共服務。
具體而言,金山云輕舟智問的全場景能力可以用 “一三一四”來概括,諧音梗是“一生一世”?!耙弧?,是一套能力,即給用戶提供端到端的一套知識問答能力,可以以產品形態對外輸出,也可以通過一些元素化能力為客戶服務?!叭?,對應三個模型,包括行業語言模型、文本分片和Embedding。還有一個“一”,是一個平臺,即金山云瀚海平臺。最后的“四”,是四大功能,包括與模型訓練相關的微調推理、數據加速,還有應用層的輸出,主要是智能檢索和文檔智能。
為了做好企業知識助手,金山云基于上述幾大核心能力,一直在苦練內功。比如:面對結構化、非結構化數據,如何進行統一解析和索引構建?這是一個浩大的工程,需要多模態解析和提取能力,而金山云自研的KDM則很好地滿足了用戶需求。再比如:智能檢索,這是金山云基于售后場景慢慢成長出來的能力,可以幫助用戶更精準地檢索到想要的知識。以高性能云盤為例,ESSD分四個檔位,每個檔位都有不同的IOPS和吞吐能力。如果用戶在某一場景中需要500M的寫入吞吐,如何匹配適合的云盤?如果系統是簡單的語義匹配,會去文檔庫搜索推薦云盤,最后搜索出一堆和結果無關的內容。但如果有更精確的智能推薦能力,會模擬人的操作步驟,首先會搜索ESSD有哪些產品規格,然后對用戶的意圖進行識別,對問題進行改寫,并且會把問題拆成多步,然后再對比用戶的實際性能需求和產品規格,給出相應的推薦。
經過過去一年的努力,金山云圍繞MaaS互信推理專區方案升級技術和產品,解決了模型廠商和應用廠商之間的互信問題。
在去年發布的MaaS 1.0基礎上,MaaS互信推理專區2.0方案更加強大,它以金山云IaaS和PaaS為底座,可實現云上LangChain的一鍵部署,默認對接多個生態合作商業大模型和開源大模型。同時,支持包括BGE、Bert等在內的Embedding模型,能無縫對接金山云全托管向量數據庫Milvus,提供面向企業開發者的簡單易用、安全可信的一站式推理應用部署平臺。此外,MaaS 2.0支持通過標準化的API接口和Web前端界面,實現包括模型推理和知識庫搭建的RAG大模型場景應用。為進一步增強云上運行的安全性,MaaS 2.0還提供容器服務加密鏡像解決方案,依托金山云裸金屬服務,實現在金山云容器服務中從鏡像加密、加密鏡像上傳、解密鏡像運行的全流程模型安全運行。
3、 混合云
AIGC浪潮不僅帶來了各種模型的快速發展,也讓底層的算力、存儲、數據庫等能力全面升級。2023年,金山云的核心產品一直在持續演進,比如:發布了第七代云主機、操作系統遷移到歐拉的內核上、EBS塊存儲已經發展到4.0的ESSD極速云盤、推出負載均衡新品ALB、對象存儲推出了基于全閃介質的KS3極速型產品……
而混合云是金山云基于過去底層能力進化出來的能力,也是另一個強項,既可做到物理隔離,又能擁有整個公有云的產品陣列。憑借全棧的底層基礎設施管理能力,金山云可以通過混合云能力幫助用戶打通自建IDC和公有云服務之間的壁壘。
金山云把云算力網絡分為三層,重點關注網絡規模、網絡帶寬和網絡穩定性幾大能力。而在相對重要的底層,會有自研的IB/RoCE等服務方案,以及相關的可靠交付工具。同時,在服務器端還有Agent,具有整個鏈路的探測能力,可以做全網的性能測試,這對交付來說非常重要。
用戶通過金山云可以獲得更具彈性的云上構建能力,不僅可以保持云下獨立,又能享受云上規模的紅利。其中,在基礎資源方面的體驗是,兼顧客戶使用場景,支持多資源形態混合管理。在云上能力輸出方面的體現是,可以讓客戶在云下使用云上產品技術,拓展云上產品的場景化能力。
基于以上能力,金山云在2024年會基于大模型場景深化拓展,秉承中立原則,繼續聚焦圍繞核心能力實現自我提升,同時跟合作伙伴攜手幫助更多企業實現智能化升級!
小結:
走過2023年大模型元年,2024年將進入人工智能原生應用爆發年,推理需求會暴漲,而金山云則會嚴守中立定位,憑借在基礎能力和行業實踐方面的積累擁抱人工智能,做大模型的助力者。