女人裸体网站一区二区三区,久久99欧美午夜精品久久久,天天日夜夜操在线,免费久久一级黄片,福利影院欧美第一页

撰文| 吳先之吳坤諺

編輯| 王潘

3月末，多家海外存儲(chǔ)頭部企業(yè)，宣布從4月起提高部分產(chǎn)品報(bào)價(jià)，國內(nèi)廠商也隨之上調(diào)價(jià)格，終結(jié)了DRAM內(nèi)存與NAND閃存的降價(jià)勢(shì)頭。

多家廠商曾在近期表示，價(jià)格上漲速度高于此前預(yù)期。“供給側(cè)減產(chǎn)，原廠自年初實(shí)施了嚴(yán)格的控價(jià)減產(chǎn)，更主要的動(dòng)因來自需求側(cè)。”某存儲(chǔ)芯片廠商表示，AI應(yīng)用井噴，驅(qū)動(dòng)存儲(chǔ)芯片市場(chǎng)需求走高。

另一位業(yè)內(nèi)人士提到，根據(jù)DeepSeek所發(fā)布的產(chǎn)品特征看，對(duì)于存儲(chǔ)性能的需求還會(huì)再上一個(gè)臺(tái)階。“從長(zhǎng)期來看，對(duì)于存儲(chǔ)讀取的需求會(huì)越來越高，我們判斷，對(duì)推理的存儲(chǔ)讀取性能需求可能會(huì)超過訓(xùn)練的需求?！?/p>

大模型時(shí)代，外界對(duì)于應(yīng)用側(cè)百花齊放更有感知，在追求極致算力時(shí)卻忽視了，應(yīng)用井噴其實(shí)對(duì)存儲(chǔ)也提出了更高要求。愛分析報(bào)告中提到，在同樣GPU算力規(guī)模下，存儲(chǔ)性能的高低可能造成模型訓(xùn)練周期3倍的差異。如吞吐性能達(dá)千萬級(jí)IOPS、帶寬達(dá)TB級(jí)、時(shí)延低至百微秒，這些在傳統(tǒng)存儲(chǔ)也很難企及的要求，如今已成為AI存儲(chǔ)的入門門檻。

一邊是來自存儲(chǔ)成本的壓力，如今存儲(chǔ)已占到大模型訓(xùn)練整體成本的10%-20%；另一邊是對(duì)于AI存儲(chǔ)的更高性能要求。這讓CTO們追逐大模型時(shí)不得不面對(duì)這樣的焦慮：如何用更可控的成本，去實(shí)現(xiàn)更符合大模型訓(xùn)推的存力？

這一趨勢(shì)，也讓一部分廠商的存儲(chǔ)業(yè)務(wù)駛?cè)肟燔嚨?，例如已?jīng)過多年京東內(nèi)部復(fù)雜業(yè)務(wù)驗(yàn)證的京東云云海。事實(shí)上，京東云云海最初和其他互聯(lián)網(wǎng)廠商的存儲(chǔ)模塊沒有太大差異，由內(nèi)部提供監(jiān)控組件、管控組件、數(shù)據(jù)庫組件，自己?jiǎn)为?dú)做好存儲(chǔ)產(chǎn)品。一位知情人士提到，“許多云廠商做存儲(chǔ)產(chǎn)品只有兩種路徑，一種是線下私有化的存儲(chǔ)輸出，另一種是找第三方合作?！?/p>

從結(jié)構(gòu)上看，大模型訓(xùn)練在算力比拼的同時(shí)，大模型不可能長(zhǎng)期“單腳走路”，存力那只“腳”，正在成為AI時(shí)代各方競(jìng)逐的新戰(zhàn)場(chǎng)。

AI時(shí)代的存儲(chǔ)標(biāo)準(zhǔn)變了

年初，DeepSeek爆火的一個(gè)重要?jiǎng)右?，便是緩解了外界?duì)于算力的焦慮，然而卻也讓存力這個(gè)隱形且重要的變量，走到臺(tái)前。

AI訓(xùn)練的重心“偏移”首當(dāng)其沖，思維鏈的巨大潛力將主要訓(xùn)練場(chǎng)景自預(yù)訓(xùn)練轉(zhuǎn)移至推理，落地到存儲(chǔ)則是由過去的讀寫并重到更偏向讀。在這一過程中，我們大可堆疊GPU，但在算力單元開“算”前，等待數(shù)據(jù)從存儲(chǔ)系統(tǒng)到達(dá)計(jì)算單元的過程才是耗時(shí)費(fèi)力的關(guān)鍵。

因此，DeepSeek自研存儲(chǔ)再一次把業(yè)內(nèi)目光拉到了存儲(chǔ)及存儲(chǔ)架構(gòu)上。DeepSeek 3FS解決方案每秒可以完成6.6TB的數(shù)據(jù)搬運(yùn)，相當(dāng)于1秒鐘傳輸完700部4K高清電影。而自動(dòng)調(diào)取資源，則縮短國產(chǎn)芯片與國際頭部品牌的差距。業(yè)內(nèi)方才后知后覺地反應(yīng)過來，決定大模型效率的不止是GPU，存儲(chǔ)系統(tǒng)正在成為新的瓶頸。

DeepSeek自研3FS的驅(qū)動(dòng)力，來自不斷增長(zhǎng)的推理需求，不得不回頭解決存儲(chǔ)架構(gòu)。

AI快速發(fā)展的大背景下，傳統(tǒng)對(duì)象存儲(chǔ)的短板快速暴露，互聯(lián)網(wǎng)云廠商通常以私有云或OEM形式輸出存儲(chǔ)能力，缺乏長(zhǎng)期、穩(wěn)定的存儲(chǔ)團(tuán)隊(duì)支撐。而傳統(tǒng)存儲(chǔ)廠商AI訓(xùn)練的經(jīng)驗(yàn)積累又欠火候，尤其是面對(duì)當(dāng)下需求爆發(fā)的訓(xùn)練、推理場(chǎng)景，在應(yīng)對(duì)變化上有些力不能支。

簡(jiǎn)要對(duì)比幾家存儲(chǔ)產(chǎn)品，可以發(fā)現(xiàn)兩個(gè)重要信息，一個(gè)是AI存儲(chǔ)的標(biāo)準(zhǔn)已明顯改變，另一個(gè)是國內(nèi)外廠商的差距正在快速縮小。

從存儲(chǔ)性能來看，吞吐量級(jí)、有效帶寬與時(shí)延都會(huì)影響GPU的算力利用率，存儲(chǔ)性能不足造成的GPU閑置，導(dǎo)致模型落地困難、業(yè)務(wù)成本劇增。去年，一家頭部AI公司因存儲(chǔ)帶寬不足，導(dǎo)致2000張A100顯卡算力利用率長(zhǎng)期低于40%，導(dǎo)致單日經(jīng)濟(jì)損失超百萬美元的教訓(xùn)還歷歷在目。

標(biāo)準(zhǔn)之外，國內(nèi)外廠商的差距也在明顯縮小。

老牌存儲(chǔ)品牌IBM，已完成了從HPC場(chǎng)景向AI場(chǎng)景的演進(jìn)，尤其是在AI場(chǎng)景廣泛應(yīng)用的DDN，在 IOPS、讀/寫帶寬等關(guān)鍵性能指標(biāo)上的表現(xiàn)可圈可點(diǎn)。但與此同時(shí)，DDN的技術(shù)封閉性和轉(zhuǎn)優(yōu)化硬件等因素，客觀上導(dǎo)致用戶建設(shè)成本高昂。

DeepSeek自研的3FS是開源新品，表現(xiàn)上不輸老牌存儲(chǔ)，在讀帶寬上，單集群每秒6.6TB，平均單節(jié)點(diǎn)每秒36.7GB，悄然抬高AI存儲(chǔ)的入門門檻。同樣開源的還有Ceph，在相同配置規(guī)格上的單節(jié)點(diǎn)讀、寫帶寬能力分別為單節(jié)點(diǎn)5.6GB每秒與4.5GB每秒，IOPS單節(jié)點(diǎn)15萬。

除DeepSeek之外，另一家國產(chǎn)廠商京東云云海的表現(xiàn)凸顯，24塊NVMe SSD配置規(guī)格下，讀、寫帶寬能力分別為單節(jié)點(diǎn)95GB每秒與60GB每秒，IOPS單節(jié)點(diǎn)280萬，單路4k讀寫延遲僅為0.5毫秒。京東云云海在提供高性能的同時(shí)，適用性較高，可以同時(shí)滿足DeepSeek、ChatGPT、LLaMA等20余種主流大模型的存力需求。

需求驅(qū)動(dòng)的存儲(chǔ)的發(fā)展固然需要適時(shí)而動(dòng)，但更重要的是前瞻性的布局，讓京東云云海多年的技術(shù)儲(chǔ)備迎來了需求推動(dòng)的東風(fēng)。

京東云內(nèi)部向來有“先有京東存儲(chǔ)，后有京東云”的說法，從某種意義上講，京東存儲(chǔ)的發(fā)展階段，折射出了需求驅(qū)動(dòng)的變化。

京東云云海誕生于京東電商的大規(guī)模高并發(fā)場(chǎng)景，這一階段，存儲(chǔ)只是作為基礎(chǔ)設(shè)施存在，此時(shí)云海主要是解決傳統(tǒng)基礎(chǔ)設(shè)施中的存算分離需求，尤其是面對(duì)數(shù)據(jù)庫、中間件、ClickHouse等在線應(yīng)用敏感型中間件的低延遲要求。

2021年，京東在重慶建立了亞洲最大的超算中心SuperPOD，除了自身公有云之外，想必還存有參與機(jī)器學(xué)習(xí)“競(jìng)賽”的考量。沒曾想兩年后，ChatGPT爆火，大模型訓(xùn)練成本、效率的要求越來越高，算力爆發(fā)開始帶動(dòng)存力。而原本便是做高性能存儲(chǔ)的云海突然“坐在了風(fēng)口上”，承接了這一輪技術(shù)紅利而步入快速發(fā)展階段。

自身業(yè)務(wù)的豐富性，以及長(zhǎng)期扎根產(chǎn)業(yè)的具體場(chǎng)景中，才會(huì)出現(xiàn)拉通各家存力性能時(shí)，京東云云海在IOPS、帶寬與時(shí)延數(shù)據(jù)的突出表現(xiàn)。

卡位大模型時(shí)代的存儲(chǔ)

2008年的一場(chǎng)春運(yùn)，掀起了高鐵替換傳統(tǒng)內(nèi)燃機(jī)列車的大幕，這才有了海外游客為之驚嘆的四通八達(dá)的高鐵交通系統(tǒng)。事實(shí)上，基礎(chǔ)設(shè)施的超前配置恰是中國經(jīng)濟(jì)、科技發(fā)展的一項(xiàng)核心動(dòng)能。

具體到AI的發(fā)展軌跡，我們雖不能透過大模型研發(fā)的“黑箱”窺見這么一個(gè)確定的時(shí)刻，但可以確認(rèn)的是，在算力焦慮開始演變成“算效”焦慮的當(dāng)下，存儲(chǔ)性能也是時(shí)候迎頭趕上。而滿足大模型時(shí)代的存儲(chǔ)需求，也成為京東云云海“卡位戰(zhàn)”的核心目標(biāo)。

前文提到，從AI訓(xùn)練的需求來看，存儲(chǔ)性能的考量主要集中在IOPS、時(shí)延與帶寬上。

IOPS指的是每秒輸入輸出操作次數(shù)，作為衡量存儲(chǔ)性能的重要指標(biāo)，IOPS越高，設(shè)備檢索或存儲(chǔ)數(shù)據(jù)的速度越快。說白了，存儲(chǔ)的并發(fā)吞吐量實(shí)際上決定了模型本身剛性的讀取與寫入速度。

另一方面，AI訓(xùn)練PB級(jí)數(shù)據(jù)規(guī)模下的隨機(jī)訪問好比人滿為患的超市。不論超市增加多少售貨員，只要售貨員的效率不高，顧客便會(huì)在不同隊(duì)列中往返等待，待訓(xùn)練框架吞吐的數(shù)據(jù)也是如此——空有IOPS而短于時(shí)延的性能沒有任何意義。

帶著這樣的標(biāo)準(zhǔn)審視京東云云海的性能表現(xiàn)，不論是打底的千萬級(jí)IOPS，還是基于RDMA調(diào)優(yōu)，做到單個(gè)小文件訪問時(shí)延平均100微秒，我們都能看出京東云云?？ㄎ籄I存儲(chǔ)的底氣所在。

更重要的是，其在數(shù)據(jù)傳輸?shù)膸捓寐噬弦步咏鼧O致水準(zhǔn)。在400GB的IB網(wǎng)絡(luò)中，京東云云海存儲(chǔ)的帶寬利用率壓榨到了84%左右，這一指標(biāo)已然接近理論極限。

隨著性能的“硬提升”，存儲(chǔ)性能與GPU之間的“小馬拉大車”關(guān)系迎刃而解，京東云云海亦借此于存儲(chǔ)行業(yè)卡住了自己的身位。但緊隨其后的是自內(nèi)部業(yè)務(wù)場(chǎng)景走向更廣闊的天地，在其極致性能走進(jìn)實(shí)際場(chǎng)景的過程中，還少不了“軟適配”。

作為不顯于人前的底層基礎(chǔ)設(shè)施，存儲(chǔ)不涉及具體應(yīng)用層產(chǎn)品，在理論上沒有定制化的需要。實(shí)際上，不同行業(yè)的數(shù)據(jù)存儲(chǔ)習(xí)慣與業(yè)務(wù)場(chǎng)景千差萬別，存儲(chǔ)產(chǎn)品本身亦需要因地制宜的調(diào)優(yōu)。

例如當(dāng)下正圍繞智駕展開肉搏的車企，其存儲(chǔ)需求便集中在路況或車機(jī)實(shí)時(shí)采集的數(shù)據(jù)存儲(chǔ)，以及這些數(shù)據(jù)湖倉一體化清洗后，高效調(diào)用來訓(xùn)練智駕模型兩方面。尤其是后者，“一旦高端GPU集群有閑置5%左右的時(shí)間，他的成本就相當(dāng)于要重建一套分布式存儲(chǔ)的集群?！?/p>

我們了解到，進(jìn)入國內(nèi)某智駕實(shí)力玩家L3與L4模型研發(fā)中的京東云云海，滿足了該企業(yè)上百個(gè)GPU計(jì)算節(jié)點(diǎn)在模型訓(xùn)練過程中訪問存儲(chǔ)數(shù)據(jù)，并應(yīng)對(duì)計(jì)算節(jié)點(diǎn)的高并發(fā)訪問的需求。

云端之下，面對(duì)主要采用一體機(jī)為存儲(chǔ)設(shè)施的醫(yī)療行業(yè)，京東云云海亦會(huì)在統(tǒng)一存儲(chǔ)引擎的平臺(tái)基礎(chǔ)上，向集成商、ISV開放不同能力，共同結(jié)合具體的配置容量、盤的個(gè)數(shù)、規(guī)模與存儲(chǔ)介質(zhì)做深度定制。

自2023年正式步入外部市場(chǎng)的京東云云海，目前已開拓了包括汽車、銀行、券商、零售等領(lǐng)域超100家大型企業(yè)。迄今為止，其未曾出現(xiàn)過任何服務(wù)中斷的故障。

存儲(chǔ)的中國故事

今年1月，西方世界開始進(jìn)一步限制AI芯片與技術(shù)的出口，而今更直接的“經(jīng)濟(jì)對(duì)抗”，更是加速了“以國代進(jìn)”這個(gè)伴隨中國科技力量崛起的宏大敘事。

值此情況下，產(chǎn)業(yè)界普遍關(guān)注的自研自產(chǎn)的芯片、光刻機(jī)等供給或主動(dòng)或被動(dòng)地踏上自主創(chuàng)新的道路。但不可忽視的是，存儲(chǔ)同樣是構(gòu)建完整AI技術(shù)體系的“磚瓦”。

礙于存儲(chǔ)相較算力的發(fā)展滯后，AI存儲(chǔ)的迭代勢(shì)必要“步算力后塵”。

進(jìn)一步說，曾經(jīng)不論是老牌廠商還是京東云云海這樣的聚焦AI存儲(chǔ)的廠商，其謀發(fā)展都繞不開其系統(tǒng)能力對(duì)高端英偉達(dá)GPU的適配，而今其存儲(chǔ)系統(tǒng)對(duì)國產(chǎn)芯片的適配以及在信創(chuàng)環(huán)境下的運(yùn)行，開始成為當(dāng)下衡量存儲(chǔ)廠商發(fā)展空間的重要參考。

在這一方面，京東云云海的發(fā)展歷程頗具代表性。

正如早先提到的“先有京東存儲(chǔ)，后有京東云”，京東早在2012年便開始攻堅(jiān)存儲(chǔ)，亦在獨(dú)自摸索的過程中嘗試過開源架構(gòu)。后來開源架構(gòu)運(yùn)維成本居高不下的問題開始暴露，京東云云海開始All in自研，這才有了2017年開始正式服務(wù)于京東公有云的云海1.0架構(gòu)。

直到現(xiàn)在，京東云云海經(jīng)歷過底層架構(gòu)變更、單機(jī)房或跨域、冷熱數(shù)據(jù)管理等技術(shù)路線的探索與爭(zhēng)論，但唯一保持不變的是其對(duì)自研的持續(xù)投入。

直到2022年，互聯(lián)網(wǎng)廠商就NLP機(jī)器學(xué)習(xí)的“科研競(jìng)賽”推動(dòng)其研發(fā)開始聚焦于高性能的能力構(gòu)建，這才有了如今我們看到的卡位大模型時(shí)代的京東云云海。而在此之上，其多年聚焦自研的投入也迎來回報(bào)，相較于海外架構(gòu)與方案，云海更注重平臺(tái)對(duì)國產(chǎn)硬件的適配。

據(jù)悉，京東云云海在信通院評(píng)測(cè)的代碼自研率達(dá)98.9%+，“連開源的一個(gè)庫都沒用過”。其在信創(chuàng)環(huán)境下的運(yùn)行，則做到了與操作系統(tǒng)、數(shù)據(jù)庫、中間件、服務(wù)器、CPU、主板、網(wǎng)卡、SSD等主流國產(chǎn)化硬件和軟件兼容互認(rèn)，最大程度發(fā)揮國產(chǎn)硬件的能力。

這一點(diǎn)自京東云云海滿足多個(gè)頭部銀行、券商等對(duì)信創(chuàng)的硬性需求中，可見一斑。

我們還自某自動(dòng)駕駛公司處了解到，起初其接觸京東云云海時(shí)，便在試行環(huán)境下讓云海和海外方案提供商做過一次PK：在20T的模型大小下，兩者同樣在100T左右的數(shù)據(jù)集訓(xùn)練中實(shí)現(xiàn)了秒級(jí)的讀寫。但在基本吞吐性能之外，云海的網(wǎng)絡(luò)利用率相較海外廠商高3%，且同等條件下的成本更低。

即使是對(duì)國產(chǎn)化要求規(guī)格最高的金融行業(yè)，自主可控、全棧自研也不過是其挑選提供商的一個(gè)要素。相比之下，能否在業(yè)務(wù)場(chǎng)景中展現(xiàn)出相對(duì)其他提供商更高的性價(jià)比才是關(guān)鍵。

DeepSeek、可靈、通義等名頭打響海外，我們共同見證AI時(shí)代下中國科技崛起。在此之下，芯片與存儲(chǔ)對(duì)應(yīng)的算力與存力，亦默默成為“托舉”中國科技前行的力量。

面對(duì)國產(chǎn)化替代的歷史機(jī)遇，京東云云海于內(nèi)前瞻布局高性能，于外積極互聯(lián)互通，作為AI基礎(chǔ)設(shè)施的創(chuàng)新參與者，京東云云海已經(jīng)代表AI存力市場(chǎng)率先邁出了堅(jiān)定的一步。

微信號(hào)｜TMTweb

公眾號(hào)｜光子星球

別忘了掃碼關(guān)注我們！