
上海云軸科技股份有限公司(ZStack)成立于2015年,國(guó)家級(jí)專(zhuān)精特新“小巨人”,致力于成為智算時(shí)代全球領(lǐng)先的基礎(chǔ)軟件提供商,為用戶(hù)提供數(shù)智化算力平臺(tái)。ZStack 位居IDC云系統(tǒng)軟件市場(chǎng)報(bào)告TOP5,獨(dú)立云廠(chǎng)商排名第一,賽迪顧問(wèn)中國(guó)虛擬化市場(chǎng)報(bào)告領(lǐng)導(dǎo)者象限,產(chǎn)品矩陣全面覆蓋數(shù)據(jù)中心云基礎(chǔ)設(shè)施,涵蓋虛擬化、云平臺(tái)、容器云平臺(tái)、分布式存儲(chǔ)、超融合一體機(jī)、云原生超融合、多云管理平臺(tái)、數(shù)據(jù)庫(kù)云平臺(tái)等產(chǎn)品線(xiàn),目前已落地超過(guò)600朵信創(chuàng)云,助力超過(guò)4000家企業(yè)數(shù)字化轉(zhuǎn)型。在智算時(shí)代,憑借ZStack AIOS平臺(tái)智塔,ZStack入選 IDC報(bào)告中國(guó)生成式AI應(yīng)用開(kāi)發(fā)平臺(tái)主要廠(chǎng)商和技術(shù)代表廠(chǎng)商。
2025年2月2日,針對(duì)日益強(qiáng)勁的AI推理需求和企業(yè)級(jí)AI應(yīng)用私有化部署場(chǎng)景(Private AI),云軸科技 ZStack 宣布 AI Infra 平臺(tái) ZStack 智塔全面支持企業(yè)私有化部署 DeepSeek V3/R1/ Janus Pro三種模型,并可基于海光、昇騰、英偉達(dá)、英特爾等多種國(guó)內(nèi)外 CPU/GPU 適配,助力企業(yè)級(jí) AI 應(yīng)用進(jìn)一步落地。

云軸科技ZStack智塔功能架構(gòu)圖
據(jù)悉,隨著DeepSeek于2024年12月上線(xiàn)并開(kāi)源 DeepSeek V3/ R1/Janus Pro,全球公有云平臺(tái)如 AWS、Azure、華為云陸續(xù)宣布支持 DeepSeek R1或R1/V3。ZStack 智塔作為支持 DeepSeek 的企業(yè)級(jí)私有化 AI Infra 平臺(tái),將充分發(fā)揮 DeepSeek 開(kāi)源模型和低成本高性能特點(diǎn),進(jìn)一步推進(jìn)AI的企業(yè)級(jí)商用進(jìn)程。
全面支持 DeepSeek 三種模型,滿(mǎn)足企業(yè)不同AI場(chǎng)景需求
AI Infra 平臺(tái) ZStack 智塔在模型層提供模型開(kāi)發(fā)和應(yīng)用所需的各種基礎(chǔ)工具和組件,支持各種開(kāi)源閉源AI模型的生命周期管理。ZStack 智塔首發(fā)支持 DeepSeek V3/ R1/Janus Pro,V3 適用于通用型自然語(yǔ)言處理任務(wù),R1 專(zhuān)注于復(fù)雜推理任務(wù),而 Janus Pro 則擅長(zhǎng)多模態(tài)理解與生成,可滿(mǎn)足企業(yè)不同 AI 場(chǎng)景的需求。

支持國(guó)產(chǎn)/國(guó)外多種 CPU/GPU,適配企業(yè)數(shù)據(jù)中心多樣化算力資源
AI Infra 平臺(tái) ZStack 智塔在算力層提供計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等基礎(chǔ)資源和服務(wù),可支持 DeepSeek 在海光、昇騰、英偉達(dá)、英特爾等多種國(guó)內(nèi)外 CPU/GPU 算力資源上進(jìn)行私有化部署,適配企業(yè)數(shù)據(jù)中心多樣化算力資源。
ZStack 智塔具備智能異構(gòu)調(diào)度引擎自動(dòng)匹配硬件特性,支持 CUDA、ROCm、CANN 等體系架構(gòu),以及無(wú) GPU 測(cè)試方案,CPU 部署 DeepSeek-R1-7B 輕量化模型,在 16 核云主機(jī)實(shí)現(xiàn) 9.26 tokens/s可用級(jí)表現(xiàn)。

提供企業(yè)靈活性與定制化服務(wù),構(gòu)建新一代企業(yè)數(shù)智化平臺(tái)
AI Infra 平臺(tái) ZStack 智塔可以根據(jù)企業(yè)自身需求,在私有云或混合云環(huán)境中部署DeepSeek模型,從而確保數(shù)據(jù)的安全性和隱私保護(hù);還提供裸金屬、虛擬機(jī)和容器計(jì)算資源的彈性擴(kuò)展,支持與多種硬件和軟件的集成,使得企業(yè)能夠輕松地將AI能力整合到現(xiàn)有系統(tǒng)中,這種靈活性和定制化服務(wù)滿(mǎn)足了企業(yè)級(jí)用戶(hù)對(duì)AI應(yīng)用的多樣化需求。
ZStack 智塔在資源利用方面具備可多卡并發(fā)推理技術(shù),通過(guò)多張 GPU 聯(lián)合推理,提升小顯存 GPU 可用性,減少閑置;顯卡切分技術(shù),通過(guò)對(duì)單張 GPU 進(jìn)行算力、顯存切分,提升大顯存 GPU 的資源利用率;模型量化技術(shù),模型平臺(tái)可以對(duì)模型進(jìn)行量化,配合 DeepSeek 低成本高性能特點(diǎn)大幅提升 AI 效率。

AI Infra 平臺(tái)是企業(yè)加速釋放AI生產(chǎn)力的關(guān)鍵引擎平臺(tái),它聚焦企業(yè)級(jí)AI應(yīng)用的私有化部署場(chǎng)景(Private AI),是支撐人工智能應(yīng)用開(kāi)發(fā)、部署、運(yùn)行和管理的一系列基礎(chǔ)工具和軟件平臺(tái),具備算力管理層、模型管理層、應(yīng)用管理層三大能力模型。賽迪顧問(wèn)認(rèn)為,2025年是中國(guó) AI Infra 平臺(tái)應(yīng)用元年。

AI 推理算力需求激增,催生了企業(yè)級(jí)智算資源管理新需求;AI 應(yīng)用加速向企業(yè)級(jí)場(chǎng)景滲透,模型工具鏈、運(yùn)營(yíng)管理組件助力降低 AI 應(yīng)用門(mén)檻;數(shù)據(jù)隱私和安全性驅(qū)動(dòng)AI應(yīng)用的私有化部署,新一代企業(yè)數(shù)智化轉(zhuǎn)型底座 AI Infra 平臺(tái)呈現(xiàn)飛速發(fā)展趨勢(shì)。2025年1月,賽迪顧問(wèn)發(fā)布《2025中國(guó) AI Infra 平臺(tái)市場(chǎng)發(fā)展研究報(bào)告》中預(yù)計(jì),AI Infra 平臺(tái)2024年、2025年將分別達(dá)到19.4億元和36.1億元,2025年同比增長(zhǎng)將超過(guò)86%。
| |
熱門(mén)跟貼