打開網(wǎng)易新聞 查看精彩圖片

DeepSeek點(diǎn)燃了“引線”后,大模型再一次進(jìn)入到了“爆發(fā)期”。

短短一個(gè)多月里,大模型的能力上限不斷被刷新,“落地”已然成為產(chǎn)業(yè)上下游的普遍共識(shí)。

在這樣的局面下,一家企業(yè)最佳的生態(tài)位是什么呢?

上世紀(jì)90年代,杰弗里·摩爾在深入研究了埃弗雷特·羅杰斯的“創(chuàng)新擴(kuò)散理論”后,在《跨越鴻溝》將“技術(shù)采用生命周期”的客戶群體分成了五類,分別是創(chuàng)新者、早期采用者、早期大眾、后期大眾和落后者。

打開網(wǎng)易新聞 查看精彩圖片

對(duì)號(hào)入座的話,大模型正處于從早期采用者向早期多數(shù)過渡的階段,也就是“鴻溝”所在的階段。

由此來審視這輪大模型浪潮,相較于模型層的你追我趕,一場(chǎng)更重要的博弈在于怎么將創(chuàng)新迅速“擴(kuò)散”到產(chǎn)業(yè)中,支撐創(chuàng)新應(yīng)用的落地。

01 跨越算力鴻溝:一場(chǎng)“雙螺旋”競(jìng)賽

DeepSeek意外“出圈”后,在流量洪峰的沖擊下一度陷入了“崩潰循環(huán)”,直到半個(gè)多月后才走出“服務(wù)器繁忙”。

一些想要接住DeepSeek流量的第三方MaaS平臺(tái),則在月虧4億的壓力下,無奈關(guān)閉了相關(guān)推理服務(wù)。

這些現(xiàn)象指向了同一個(gè)原因——算力瓶頸。

算力供應(yīng)的不穩(wěn)定,即便是DeepSeek這樣的團(tuán)隊(duì),也無法在短時(shí)間里填補(bǔ)缺口;而算力價(jià)格的居高不下,不單單束縛了千萬使用者的手腳,MaaS平臺(tái)也深感壓力山大。

大模型想要落地到千行萬業(yè),讓“智力”轉(zhuǎn)化為實(shí)實(shí)在在的生產(chǎn)力,首先要打破算力瓶頸。大模型創(chuàng)新擴(kuò)散的鴻溝,很大程度上屬于算力鴻溝,只有打破了算力瓶頸,才能創(chuàng)新的擴(kuò)散鋪平道路。

就在DeepSeek走紅的同一時(shí)間,百度智能云對(duì)外宣布——在百舸4.0的能力加持下,成功點(diǎn)亮昆侖芯三代萬卡集群。

如果說DeepSeek給出了模型訓(xùn)練的新思路,百舸4.0給出了跨越算力鴻溝的新解法:通過覆蓋大模型落地全流程的算力平臺(tái),讓用戶能夠高效率、低成本使用算力。

打開網(wǎng)易新聞 查看精彩圖片

訓(xùn)練大模型的第一步是創(chuàng)建集群。許多人不知道的是,GPU集群需要大量復(fù)雜、瑣碎的配置和調(diào)試,通常需要幾周時(shí)間。但基于百舸4.0創(chuàng)建集群,只需要1小時(shí)就可以跑起來。

完成創(chuàng)建集群后,真正的考驗(yàn)才剛開始,因?yàn)榧旱囊?guī)模越大,出故障的概率就越高,運(yùn)維的復(fù)雜性急劇增加。例如Meta訓(xùn)練Llama3時(shí)用了1.6萬張GPU的集群,平均每3小時(shí)就會(huì)出一次故障。同樣是萬卡任務(wù),百舸4.0可以保障有效訓(xùn)練時(shí)長(zhǎng)占比達(dá)到99.5%,遠(yuǎn)高于行業(yè)內(nèi)公布的相關(guān)指標(biāo)。

大模型訓(xùn)練既要穩(wěn)定,也要效率。訓(xùn)練千億、萬億參數(shù)的模型,動(dòng)輒需要幾周到幾個(gè)月的時(shí)間。百舸4.0在集群設(shè)計(jì)、任務(wù)調(diào)度、并行策略、顯存優(yōu)化等方面進(jìn)行了大量?jī)?yōu)化,最終讓端到端的性能提升了30%。

同時(shí)不應(yīng)該忽略的,還有百舸4.0的多芯混訓(xùn)、多芯適配能力。能夠把同一廠商不同代際芯片、不同廠商的芯片統(tǒng)一管理,混布成一個(gè)集群高效完成模型的訓(xùn)練和推理任務(wù)。

按照百度智能云官方公布的數(shù)據(jù):在萬卡規(guī)模上,百舸4.0將兩種芯片混合訓(xùn)練的效率折損控制在了5%以內(nèi);某金融機(jī)構(gòu)在百舸的支持下,完成了不同型號(hào)GPU資源的部署、上線,有力保障了6000多次訓(xùn)練任務(wù)。

古代打仗講求“兵馬未動(dòng)糧草先行”,放到大模型產(chǎn)業(yè)同樣適用,其中的算力就是“糧草”。想要大模型深入落地到千行萬業(yè),勢(shì)必要開啟一場(chǎng)追求高效率和低成本的“雙螺旋”競(jìng)賽。

可以找到的一個(gè)實(shí)戰(zhàn)案例是:春節(jié)假期結(jié)束時(shí),有近20家芯片企業(yè)在忙著適配DeepSeek,在百舸4.0的賦能下,百度的昆侖芯是國(guó)內(nèi)率先支持單機(jī)部署滿血版DeepSeekR1的芯片,單機(jī)8卡配置便可實(shí)現(xiàn)2437tokens/s吞吐,并給出了業(yè)內(nèi)最低的價(jià)格。

02 吹響落地號(hào)角,工程能力見真章

和每次產(chǎn)業(yè)革命初期一樣,創(chuàng)新的擴(kuò)散始于“早期采用者”,往往是創(chuàng)新意識(shí)比較明確且有能力進(jìn)行智能化轉(zhuǎn)型的大中型企業(yè)。

某種程度上說,大中型企業(yè)的選擇,更能折射出真實(shí)的市場(chǎng)需求,更能從中洞察到創(chuàng)新的方向。

曾有媒體統(tǒng)計(jì)了“2024全年大模型相關(guān)中標(biāo)項(xiàng)目”,一共有910個(gè)項(xiàng)目,中標(biāo)金額約為25.2億元。其中百度智能云斬獲了55個(gè)項(xiàng)目,中標(biāo)金額3.4億元,在能源、政務(wù)、金融等行業(yè)的中標(biāo)數(shù)量位于所有廠商第一。

打開網(wǎng)易新聞 查看精彩圖片

到了2025年1月,公開數(shù)據(jù)統(tǒng)計(jì)到的大模型相關(guān)中標(biāo)項(xiàng)目數(shù)量已經(jīng)達(dá)到125個(gè),項(xiàng)目金額為12.67億元。百度

智能云實(shí)現(xiàn)了中標(biāo)項(xiàng)目數(shù)量和中標(biāo)金額上的雙第一,中標(biāo)金額4.17億元,占到了全行業(yè)的三分之一。

為什么會(huì)出現(xiàn)這樣的局面?

國(guó)際權(quán)威咨詢機(jī)構(gòu)弗若斯特沙利文進(jìn)行了深入的市場(chǎng)調(diào)研后,在《2024 年中國(guó)大模型行業(yè)應(yīng)用優(yōu)秀案例白皮書》給出了解釋:企業(yè)用戶在大模型落地的主要需求點(diǎn)包含完善的落地指導(dǎo)、先進(jìn)的產(chǎn)品架構(gòu)、全面的安全治理以及開放的生態(tài)支持,百度智能云代表的AI云廠商在技術(shù)生態(tài)、行業(yè)經(jīng)驗(yàn)和服務(wù)能力方面具備顯著優(yōu)勢(shì),能夠以高效率、低成本的方式加速大模型的推廣與行業(yè)應(yīng)用。

原因依然離不開“高效率和低成本”。

進(jìn)一步從技術(shù)層面剖析的話,和百度智能云的全棧AI技術(shù)能力不無關(guān)系。

百度是國(guó)內(nèi)為數(shù)不多同時(shí)深耕芯片、框架、模型、應(yīng)用的企業(yè),能夠針對(duì)大模型的訓(xùn)推、部署和調(diào)優(yōu)等進(jìn)行全流程優(yōu)化。比如昆侖芯三代萬卡集群,在行業(yè)內(nèi)率先驗(yàn)證了可以通過模型優(yōu)化、并行策略、有效訓(xùn)練率提升、動(dòng)態(tài)資源分配等手段,將訓(xùn)練、微調(diào)、推理任務(wù)混合部署,進(jìn)而最大化提升集群綜合利用率,降低單位算力成本的可行性。

在大模型進(jìn)入全球視野的第四年,早已形成了兩個(gè)戰(zhàn)場(chǎng):第一個(gè)戰(zhàn)場(chǎng)是大模型訓(xùn)練,第二個(gè)戰(zhàn)場(chǎng)是大模型落地。

特別是在“百模大戰(zhàn)”格局瓦解,大模型的牌桌上僅剩下百度、阿里、DeepSeek、智譜等少數(shù)玩家后,越來越多企業(yè)將注意力集中到了應(yīng)用層,思考怎么將技術(shù)可能性轉(zhuǎn)化為穩(wěn)定生產(chǎn)力,討論如何通過標(biāo)準(zhǔn)化流程、工具鏈支撐和全生命周期管理,解決大模型開發(fā)與部署中的效率、成本和質(zhì)量矛盾。

在百度智能云的示范下,云廠商競(jìng)賽的升維已然是可以預(yù)見的結(jié)果,倒逼全行業(yè)提升工程能力,從底層芯片、智算平臺(tái)、大模型等多個(gè)維度進(jìn)行布局,推進(jìn)全棧創(chuàng)新與快速迭代。

也就是說,落地應(yīng)用的號(hào)角吹響后,競(jìng)爭(zhēng)的天平進(jìn)一步向“擴(kuò)散”傾斜,不單單是算力之爭(zhēng)、模型之爭(zhēng),而是工程能力的比拼:誰能借助系統(tǒng)性的技術(shù)體系和方法論降低成本、提升大模型落地易用性、幫助企業(yè)更好地構(gòu)建AI原生應(yīng)用,誰才有機(jī)會(huì)成為最后的贏家。

03 長(zhǎng)跑才剛開始,算力仍是重頭戲

按照“創(chuàng)新擴(kuò)散理論”,一旦跨越了從早期采用者到早期大眾擴(kuò)散的“鴻溝”,市場(chǎng)將會(huì)進(jìn)入到高速增長(zhǎng)階段。

2024年被公認(rèn)是大模型推理應(yīng)用的元年,2025年注定是落地生花的一年,從央國(guó)企先行逐漸演變成一股不可逆的產(chǎn)業(yè)浪潮。對(duì)算力的需求,將呈現(xiàn)出指數(shù)級(jí)的增長(zhǎng)態(tài)勢(shì)。

折射到AI基礎(chǔ)設(shè)施的布局上,點(diǎn)亮昆侖芯三代萬卡集群的百度智能云并未停下來,還將進(jìn)一步點(diǎn)亮3萬卡集群。百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖曾公開表示:“百舸4.0正是為部署10萬卡大規(guī)模集群而設(shè)計(jì)的,目前已經(jīng)具備了成熟的10萬卡集群部署和管理能力?!?/p>

不只是百度智能云,國(guó)外的xAI、Meta、OpenAI等都在積極布局10萬卡乃至更大規(guī)模的智算集群。

個(gè)中原因并不難理解。

一方面,大模型的Scaling Law仍在繼續(xù),大模型競(jìng)賽本質(zhì)依然是算力競(jìng)賽,能否解決跨地域部署、多芯混訓(xùn)以及集群穩(wěn)定性等問題,關(guān)系著是否能滿足源源不斷的算力需求,是否有參與大模型競(jìng)賽的資格。

另一方面,比創(chuàng)新更重要的,是創(chuàng)新的擴(kuò)散。大模型賦能千行萬業(yè)的過程中,需要根據(jù)不同企業(yè)的需求動(dòng)態(tài)分配計(jì)算資源,提高資源利用率的同時(shí),降低云服務(wù)的成本,10萬卡乃至更大規(guī)模的集群至關(guān)重要。

參考每次工業(yè)革命的時(shí)間跨度,大模型的產(chǎn)業(yè)競(jìng)賽,更像是一場(chǎng)考驗(yàn)?zāi)土Φ鸟R拉松。擅長(zhǎng)耐力賽的百度,正以一種兼顧技術(shù)創(chuàng)新與產(chǎn)業(yè)落地的獨(dú)特節(jié)奏,穩(wěn)步推動(dòng)大模型從創(chuàng)新走向產(chǎn)業(yè)應(yīng)用。

正如World Governments Summit 2025峰會(huì)上的一幕,當(dāng)阿聯(lián)酋AI部長(zhǎng)奧馬爾詢問“如何看待數(shù)據(jù)中心和AI基礎(chǔ)設(shè)施的未來”時(shí),百度創(chuàng)始人李彥宏篤定地回答道:“我們?nèi)孕鑼?duì)芯片、數(shù)據(jù)中心和云基礎(chǔ)設(shè)施進(jìn)行持續(xù)投入,用于打造更好、更智能的下一代模型?!?/p>