
從算力內(nèi)卷到存力突圍,一場(chǎng)有關(guān)企業(yè)AI基建的價(jià)值重估。
新眸原創(chuàng)·作者 | 桑明強(qiáng)
當(dāng)全球科技巨頭為AI大模型瘋狂加碼GPU算力時(shí),一家頭部券商公司卻公開(kāi)訴苦:費(fèi)力搭建的GPU集群,利用率卻始終卡在30%,算力空轉(zhuǎn)導(dǎo)致每月僅電費(fèi)就是一筆不小的開(kāi)銷(xiāo),核心瓶頸竟然是一塊“看不見(jiàn)的短板”:存儲(chǔ)帶寬。
這并非孤例——某車(chē)企自動(dòng)駕駛團(tuán)隊(duì)在迭代模型時(shí)發(fā)現(xiàn),因數(shù)據(jù)讀寫(xiě)延遲過(guò)高,單次訓(xùn)練周期被迫延長(zhǎng)40%,直接拖慢產(chǎn)品落地進(jìn)度。這些故事背后,揭示了大模型時(shí)代最隱秘的真相,存儲(chǔ)正成為大模型落地的最大暗礁。
大模型訓(xùn)練場(chǎng)景下,數(shù)據(jù)集一般以文檔、圖片、音視頻等非結(jié)構(gòu)化數(shù)據(jù)為主,這些文件通常很小,在幾十字節(jié)到幾百kb級(jí)別,但數(shù)量龐大,大約幾億到幾十億量級(jí),這就要求存儲(chǔ)系統(tǒng)具有強(qiáng)大的元數(shù)據(jù)管理能力,用來(lái)支撐海量小文件的高吞吐。
據(jù)愛(ài)分析測(cè)算,在同等GPU算力規(guī)模下,存儲(chǔ)性能差異可導(dǎo)致3倍模型訓(xùn)練周期波動(dòng)。以GPT-4為例,它訓(xùn)練需處理超100PB數(shù)據(jù),存儲(chǔ)帶寬要求600GB/s,相當(dāng)于每分鐘填滿(mǎn)45塊10TB硬盤(pán),而傳統(tǒng)4節(jié)點(diǎn)存儲(chǔ)集群僅能提供24GB/s帶寬,差距達(dá)25倍。
在這種背景下,產(chǎn)業(yè)界陷入兩難困局:既要支持千億級(jí)參數(shù)AI大模型、TB級(jí)帶寬的“暴力吞吐”,又要扛住30年數(shù)據(jù)留存、11個(gè)9可靠性的“馬拉松考驗(yàn)”,還要滿(mǎn)足國(guó)產(chǎn)化和市場(chǎng)的真實(shí)需求。
“這中間的挑戰(zhàn)其實(shí)非常大。”京東云相關(guān)負(fù)責(zé)人告訴《新眸》,一方面,存儲(chǔ)廠商需要跟主流芯片廠商以及國(guó)產(chǎn)操作系統(tǒng)相互兼容認(rèn)證;另一方面,還要在全國(guó)產(chǎn)化環(huán)境里做到高性能、高穩(wěn)定性和低成本,這背后意味著大量的對(duì)接、優(yōu)化和自主研發(fā)工作。
這些問(wèn)題也是眼下很多CTO、CIO焦慮的地方。盡管DeepSeek等模型能力讓人振奮,也讓外界看到了大模型落地千行百業(yè)的可能性,但擺在他們面前的,除了買(mǎi)GPU、堆算力外,還要思考如何從存儲(chǔ)端切入,為企業(yè)算清楚大模型落地和數(shù)字化的“經(jīng)濟(jì)賬”。
01
GPU空轉(zhuǎn)背后:一場(chǎng)被忽視的存儲(chǔ)革命
存儲(chǔ)成本就像是房間里的大象,所有人都看見(jiàn),但沒(méi)人敢動(dòng)。據(jù)業(yè)內(nèi)人士透露,有的企業(yè)光內(nèi)部存儲(chǔ)系統(tǒng)就采購(gòu)了5套,每一套都需要單獨(dú)維護(hù),由于這些數(shù)據(jù)分散在不同系統(tǒng),管理難度陡增的同時(shí),也為后續(xù)數(shù)據(jù)價(jià)值挖掘平添了障礙。
一項(xiàng)調(diào)查顯示,大模型訓(xùn)練中存儲(chǔ)成本占比高達(dá)10%-20%,但多數(shù)企業(yè)仍將其視為“必要損耗”。拿一臺(tái)L3級(jí)別的自動(dòng)駕駛測(cè)試車(chē)來(lái)講,平均每天產(chǎn)生60TB的數(shù)據(jù),完整測(cè)試產(chǎn)生的數(shù)百PB數(shù)據(jù)需要存儲(chǔ)30年以上。
存儲(chǔ)成本居高不下,是大模型時(shí)代的一大痛點(diǎn),癥結(jié)在于缺少對(duì)數(shù)據(jù)的有效分層。傳統(tǒng)存儲(chǔ)方案下,為了保證企業(yè)生產(chǎn)活躍度和數(shù)據(jù)安全,通常需要做到3個(gè)副本,這也是導(dǎo)致存儲(chǔ)空間利用率低的直接原因,類(lèi)似問(wèn)題在互聯(lián)網(wǎng)、金融、醫(yī)療等行業(yè)普遍存在——冷數(shù)據(jù)占用大量資源,卻鮮少被訪(fǎng)問(wèn)。
更別談一些特定領(lǐng)域,它們對(duì)于存量數(shù)據(jù)的存儲(chǔ)要求更為苛刻。比如政府電子檔案要求保存周期為5年甚至更長(zhǎng),公檢法司數(shù)據(jù)要求保存周期至少30年以上。
問(wèn)題的復(fù)雜性在于技術(shù)門(mén)檻。要知道,大模型訓(xùn)練的本質(zhì)是海量數(shù)據(jù)的處理與流動(dòng),過(guò)程中需要實(shí)時(shí)處理數(shù)百PB級(jí)數(shù)據(jù),存儲(chǔ)系統(tǒng)需同時(shí)滿(mǎn)足千萬(wàn)級(jí)IOPS、TB級(jí)帶寬、微秒級(jí)延遲。相比之下,傳統(tǒng)解決方案往往顧此失彼:高端存儲(chǔ)陣列性能達(dá)標(biāo)但成本高昂;開(kāi)源方案雖成本低,卻面臨穩(wěn)定性問(wèn)題。
“一定程度上,云海AI存儲(chǔ)的出現(xiàn)填補(bǔ)了市場(chǎng)空白。”據(jù)京東云相關(guān)負(fù)責(zé)人透露,這款歷經(jīng)京東618、雙11等復(fù)雜場(chǎng)景打磨的產(chǎn)品,以全自研統(tǒng)一分布式存儲(chǔ)引擎為核心,實(shí)現(xiàn)4K隨機(jī)寫(xiě)性能突破千萬(wàn)級(jí)IOPS,平均延遲在100微秒級(jí),并通過(guò)1.1x副本技術(shù)節(jié)省整體基礎(chǔ)設(shè)施成本超30%。

“近幾年市場(chǎng)對(duì)國(guó)產(chǎn)存儲(chǔ)的關(guān)注度明顯提高?!庇绕湓诖竽P屠顺毕?,存儲(chǔ)性能已從后臺(tái)支持系統(tǒng),躍升為AI生產(chǎn)力核心要素。一種主流觀點(diǎn)認(rèn)為,當(dāng)參數(shù)規(guī)模突破千億量級(jí)時(shí),對(duì)存儲(chǔ)的要求會(huì)更高,屆時(shí)唯有具備彈性擴(kuò)展能力的分布式存儲(chǔ)架構(gòu),才能支撐未來(lái)3-5年的AI進(jìn)化需求。
在與多個(gè)客戶(hù)深入交流后,京東云方面發(fā)現(xiàn),除了國(guó)產(chǎn)化層面的要求,對(duì)海外存儲(chǔ)廠商的祛魅逐漸成為行業(yè)共識(shí),國(guó)外的月亮不一定更圓,這也是云海AI存儲(chǔ)為什么能在銀行、證券、汽車(chē)、零售等領(lǐng)域廣泛落地——它既能做到不輸海外存儲(chǔ)廠商的高性能、高可用性,還在于它是京東100%自研產(chǎn)品,核心技術(shù)完全自主可控。
02
自主可控:國(guó)產(chǎn)存儲(chǔ)的“性能逆襲”密碼
“每一個(gè)架構(gòu)好在哪里、壞在哪里,我們有充足的底氣來(lái)判斷。”京東云相關(guān)負(fù)責(zé)人告訴《新眸》,從2012年開(kāi)始計(jì)算,云海AI存儲(chǔ)在京東場(chǎng)景已經(jīng)實(shí)踐了超過(guò)13年。
作為下一代關(guān)鍵技術(shù),存儲(chǔ)是AI基礎(chǔ)設(shè)施重要一環(huán),也是國(guó)產(chǎn)化的重點(diǎn),尤其對(duì)于金融、政務(wù)領(lǐng)域來(lái)講。在這個(gè)背景下,核心技術(shù)是否自主可控將成為關(guān)鍵門(mén)檻,相比之下,國(guó)外存儲(chǔ)廠商的商業(yè)化產(chǎn)品雖然在性能上整體領(lǐng)先,但無(wú)法作為優(yōu)先選擇;至于國(guó)內(nèi)廠商,則需要驗(yàn)證其技術(shù)自主可控能力,以及產(chǎn)品與周邊國(guó)產(chǎn)化生態(tài)軟硬件系統(tǒng)的兼容性。
和傳統(tǒng)分布式不同,云海分布式存儲(chǔ)主要聚焦于AI訓(xùn)練和推理場(chǎng)景,而非僅限于數(shù)據(jù)處理。由于它采用完全自研的架構(gòu),而非基于開(kāi)源平臺(tái),“每一行代碼都是自己寫(xiě)的”使得云海在面對(duì)大規(guī)模數(shù)據(jù)存儲(chǔ)和高性能需求時(shí)更具競(jìng)爭(zhēng)力。事后來(lái)看,這是一條艱難但正確的選擇。
事實(shí)上,除了京東云云海外,這些年國(guó)內(nèi)發(fā)力AI存儲(chǔ)并不在少數(shù),但最終結(jié)果卻反響平平,據(jù)業(yè)內(nèi)人士透露,有的廠商費(fèi)了大力氣挖人、投入了大量資源,卻至今未能推出成熟的產(chǎn)品。
這同時(shí)也是互聯(lián)網(wǎng)廠商自研存儲(chǔ)的難點(diǎn)所在,不僅要解決監(jiān)控組件、數(shù)據(jù)庫(kù)組件、工程化要求等第三方依賴(lài)問(wèn)題,針對(duì)不同客戶(hù)需求進(jìn)行模塊化單獨(dú)輸出,還要考慮到業(yè)界主流存儲(chǔ)架構(gòu)突變帶來(lái)的風(fēng)險(xiǎn)性。
背后的考量與權(quán)衡不言而喻。回憶起打磨云海AI存儲(chǔ)的那段經(jīng)歷,京東云相關(guān)負(fù)責(zé)人坦言中間也經(jīng)歷過(guò)很多內(nèi)部的爭(zhēng)論,比如數(shù)據(jù)保護(hù)的技術(shù)路線(xiàn)選擇上,當(dāng)時(shí)內(nèi)部就選擇覆蓋寫(xiě)還是追加寫(xiě)時(shí),討論過(guò)很多次。
覆蓋寫(xiě)作為業(yè)界主流的技術(shù)路徑,相對(duì)來(lái)說(shuō)開(kāi)發(fā)難度、風(fēng)險(xiǎn)都比較小,但壞處是,在存儲(chǔ)故障處理能力、包括故障后響應(yīng)時(shí)延方面非常弱,而且性能也沒(méi)法做到極致。綜合考量下,云海AI存儲(chǔ)最終選擇了更有難度的追加寫(xiě)技術(shù)路徑,為了讓它有更高的穩(wěn)定性,團(tuán)隊(duì)前后就存儲(chǔ)架構(gòu)優(yōu)化方面又花了將近一年時(shí)間。
03
存力即戰(zhàn)力
京東云云海如何改寫(xiě)存儲(chǔ)經(jīng)濟(jì)賬
當(dāng)全球AI競(jìng)賽進(jìn)入耐力賽階段,存儲(chǔ)價(jià)值正在從“后勤保障”升級(jí)為“核心戰(zhàn)力”。
拿汽車(chē)場(chǎng)景舉例,在自動(dòng)駕駛等模型訓(xùn)練、研發(fā)過(guò)程中,存儲(chǔ)和GPU的關(guān)系往往是緊密耦合的,一旦GPU集群出現(xiàn)閑置狀態(tài),就會(huì)導(dǎo)致極大的資源浪費(fèi)。關(guān)于這點(diǎn),業(yè)界有一個(gè)經(jīng)典測(cè)算,如果GPU集群出現(xiàn)5%左右的閑置時(shí)間,其成本就相當(dāng)于重建一套分布式存儲(chǔ)集群。
云海的實(shí)踐也驗(yàn)證了這一點(diǎn)——某自動(dòng)駕駛公司通過(guò)存力優(yōu)化,滿(mǎn)足了該企業(yè)上百個(gè)GPU計(jì)算節(jié)點(diǎn)在模型訓(xùn)練過(guò)程中訪(fǎng)問(wèn)存儲(chǔ)數(shù)據(jù),并應(yīng)對(duì)計(jì)算節(jié)點(diǎn)的高并發(fā)訪(fǎng)問(wèn)的需求,大大縮短了訓(xùn)練周期;某國(guó)有大行基于云海構(gòu)建存力底座,采用統(tǒng)一分布式存儲(chǔ)的方式,既滿(mǎn)足大模型訓(xùn)練的海量數(shù)據(jù)存儲(chǔ)需求,還有效降低了成本。
類(lèi)似的故事也發(fā)生在某知名券商。為了支撐業(yè)務(wù)發(fā)展,該券商需要進(jìn)行系統(tǒng)架構(gòu)的全面云原生化升級(jí),但問(wèn)題在于,傳統(tǒng)存儲(chǔ)架構(gòu)不夠靈活,很難適應(yīng)“小微化、高頻化”的業(yè)務(wù)新模式,更別談支撐業(yè)務(wù)系統(tǒng)快速上線(xiàn)、快速變更。
“這恰恰是云海的獨(dú)特優(yōu)勢(shì)所在?!睋?jù)京東云方面透露,基于云海分布式存儲(chǔ)搭建的統(tǒng)一存儲(chǔ)平臺(tái),該券商構(gòu)建了超大規(guī)模數(shù)據(jù)湖,統(tǒng)一管理結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),在實(shí)現(xiàn)數(shù)據(jù)高效存儲(chǔ)與流動(dòng)的同時(shí),存儲(chǔ)平臺(tái)還兼容多存儲(chǔ)接口類(lèi)型,真正做到與用戶(hù)業(yè)務(wù)系統(tǒng)無(wú)縫鏈接。
荔枝FM內(nèi)部曾經(jīng)算過(guò)一筆賬:4.5億用戶(hù)音頻數(shù)據(jù)若沿用傳統(tǒng)3副本機(jī)制,年存儲(chǔ)成本將是一筆巨額開(kāi)銷(xiāo),而基于京東云自研云海存儲(chǔ)系統(tǒng),綜合存儲(chǔ)成本直降30%,背后秘密在于京東云獨(dú)創(chuàng)的冷熱數(shù)據(jù)自動(dòng)分層機(jī)制——熱數(shù)據(jù)保留3副本保障毫秒級(jí)響應(yīng),冷數(shù)據(jù)則采用EC低冗余技術(shù)(1.1x副本率),磁盤(pán)利用率直接提升至90%。
值得一提的是,云海這套組合拳還能同步構(gòu)建跨機(jī)架多節(jié)點(diǎn)容災(zāi)體系,實(shí)現(xiàn)每次讀寫(xiě)自動(dòng)多副本備份,支撐荔枝FM4.5億用戶(hù)的高品質(zhì)音頻服務(wù)零中斷。在業(yè)內(nèi)人士看來(lái),大模型競(jìng)賽下半場(chǎng),存力正從幕后走向臺(tái)前,京東云云海通過(guò)性能、成本、自主可控的三重突破,不僅解決了企業(yè)的現(xiàn)實(shí)痛點(diǎn),更重新定義了AI基礎(chǔ)設(shè)施的價(jià)值鏈——存儲(chǔ)系統(tǒng)的ROI=性能增益+成本節(jié)省+故障止損。
“國(guó)產(chǎn)存儲(chǔ)崛起的關(guān)鍵不單單是性能、可靠性的比拼,更需要你站在未來(lái)思考。”按照京東云相關(guān)負(fù)責(zé)人的判斷,未來(lái)通用大模型解決用戶(hù)所有需求的可能性較低,取而代之的是,將呈現(xiàn)多種應(yīng)用化大模型根據(jù)用戶(hù)場(chǎng)景并行使用的情況,隨著DeepSeek等LLM的應(yīng)用發(fā)展,后續(xù)推理的需求將持續(xù)走高,預(yù)計(jì)將遠(yuǎn)高于訓(xùn)練需求。
事實(shí)也的確如此,根據(jù)IDC發(fā)布的一份報(bào)告顯示,全球數(shù)據(jù)將從2018年的33ZB增至2025年的175ZB。而中國(guó)的數(shù)據(jù)總量也在全球首屈一指,調(diào)查數(shù)據(jù)顯示,中國(guó)數(shù)據(jù)占全球數(shù)據(jù)比重正在從2018年的23.4%,發(fā)展到2025年的27.8%。
從這個(gè)角度來(lái)看,有關(guān)"存儲(chǔ)經(jīng)濟(jì)學(xué)"的價(jià)值重構(gòu),已經(jīng)成為企業(yè)AI戰(zhàn)略的勝負(fù)手。
本文系新眸原創(chuàng),申請(qǐng)轉(zhuǎn)載授權(quán)、商務(wù)合作請(qǐng)聯(lián)系微信: ycj841642330,添加好友請(qǐng)備注公司和職位。
更多內(nèi)容,點(diǎn)擊下方關(guān)注
熱門(mén)跟貼