打開網(wǎng)易新聞 查看精彩圖片

文|魏琳華

編|王一粟

大模型落地如火如荼,從上一代AI浪潮中殺出來的商湯,嗅到了這里面新的機會。

在最火的具身智能賽道,這兩年誕生了許多明星創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司的創(chuàng)始人往往擁有技術(shù)明星的光環(huán),不少都是在學術(shù)界中某個技術(shù)領(lǐng)域中響當當?shù)念I(lǐng)頭人。

這些初創(chuàng)公司雖然在某一個單點技術(shù)上遙遙領(lǐng)先(大腦、小腦或者本體),但在機器人落地過程中,要突破從單一技術(shù)到整體復雜產(chǎn)品的整合。

比如,機器人要做到“能聽會看”,就要深度集成AI大模型的能力,需要與AI服務商有密切的合作。

“大家不需要從頭再去做視覺算法研發(fā),這樣效率比較低?!?a class="keyword-search" >商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆對光錐智能稱,“比如在一些特定的任務抓取識別上,只要能快速滿足需求,廠商可能就多賣出去幾十臺機器人。”

商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆
打開網(wǎng)易新聞 查看精彩圖片
商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆

除了AI模型,不少具身智能公司也面臨“數(shù)據(jù)缺失”“模擬物理規(guī)則”等難點?!吧虦羞@方面的能力和積累,比如之前做自動駕駛就會有一些歷史的數(shù)據(jù)和解決方案,這些和具身智能是相通的?!睏罘Q。

“不只是基礎設施,算力之外,還有很多相關(guān)服務?!痹诰呱碇悄苄袠I(yè)的實踐,體現(xiàn)出商湯在生成式AI時代的新商業(yè)思考——要圍繞AI做從模型、數(shù)據(jù)、算力等多個方面的技術(shù)服務商。

包括具身智能在內(nèi),加上AIGC、AI4S(AI 科學)、傳統(tǒng)企業(yè)智能化轉(zhuǎn)型,商湯在4月10日的技術(shù)交流日上給出了四個行業(yè)的解決方案。這些方案,并不是商湯一廂情愿的臆想,而是過去兩年中,在行業(yè)中淬煉出的“金丹”。

扎根行業(yè),商湯的AI 基礎設施——大裝置落地就成了有根之木,有源之水。

一個不懂模型的AI 基礎設施廠商,不是一個好服務商。商湯用大裝置證明了這一點,也希望利用這一點賺取新時代的“技術(shù)溢價”。

受夠了傳統(tǒng)企業(yè)服務的苦,對商湯而言,從上一代項目制的業(yè)務中脫身,轉(zhuǎn)而做含金量更高的AI技術(shù)服務,才能真正體現(xiàn)技術(shù)的商業(yè)價值。

低門檻、高性價比,AI基礎設施怎么做?

直到今天,“性價比”仍然是AI大模型的生死線。

雖然DeepSeek在年初極大地推動了大模型的普及和成本降低,但在如何讓大模型變得便宜好用的命題上,AI 基礎設施的潛力還遠遠沒有挖掘完畢。

“今天,AI 基礎設施供應商對客戶的需求滿足度還遠遠不夠。”楊帆說,“今天最優(yōu)秀、效果最好的模型,廠商還沒辦法拿到市場上直接提供服務,因為它的性價比太低?!?/p>

平衡大模型的性能和成本,卻不是一個簡單的命題。一個不同的選擇,會造成截然相反的效果。

楊帆舉了一個例子:

一家廠商需要做一個基于DeepSeek的對話產(chǎn)品,并根據(jù)自有數(shù)據(jù)庫再進行定制化訓練。但對于這樣一個模型來說,在調(diào)用量高和低兩種情況下,如果都采用分布式部署架構(gòu),兩者的性價比相差極大。

由于分布式架構(gòu)本身硬件成本較高,在QPS(每秒查詢數(shù))高的情況下,它可以高效利用資源,實現(xiàn)極致性價比;但在QPS低的情況下,反而會造成硬件資源閑置過多,從而讓成本比傳統(tǒng)部署更高。

所以,AI基礎設施從來不是一門只靠硬件就能做好的生意,從算力到模型,每一層都有無數(shù)個細小的選擇會決定最終的成果。

商湯正在做的,就是通過AI基礎設施和模型訓練的配合,結(jié)合AI基礎設施的三要素:算力、算法和數(shù)據(jù),將大模型的性價比壓縮到極致。

作為底層架構(gòu)的硬件端,商湯算力充足。到2024年底,商湯大裝置的算力規(guī)模比去年翻了近一倍,達到23000PetaFlops,超過了整個北京的公共智能算力。

商湯臨港智算中心(AIDC)
打開網(wǎng)易新聞 查看精彩圖片
商湯臨港智算中心(AIDC)

同時,商湯算力的構(gòu)成一部分來自于國產(chǎn)芯片,避免被單一GPU“卡脖子”風險。但多種芯片難免會降低數(shù)據(jù)處理效率,商湯國產(chǎn)芯片異構(gòu)訓練效率為同構(gòu)的95%,保持效率的同時,商湯還能做到保持算力穩(wěn)定、充足,其算力利用率高達80%。

在優(yōu)化算力的基礎上,商湯通過算法優(yōu)化策略,實現(xiàn)大模型訓練、推理兩部分的性能大幅提升。以推理為例,針對DeepSeek V3等第三方模型,商湯每秒處理Token數(shù)(TGS)已達1600+,在未做專項優(yōu)化下,訓練效率竟然能優(yōu)于DeepSeek的官方成績,要知道,DeepSeek可是以效率和成本著稱。

除了把性價比壓到極致,商湯的另外一個努力方向,就是把大模型業(yè)務做到更加易用。

當開源成為行業(yè)主流,商湯擁抱開源,是為了讓廠商能夠自由調(diào)用開源工具,降低大模型訓練門檻。

“今天有很多好的開源產(chǎn)品,它們幫助廠商更快地迭代自己的模型?!睏罘e了個例子:

一個做模型同時做應用的極客團隊,在研發(fā)階段先用純開源的工具體系做快速搭建,驗證PMF(Product Market Fit,產(chǎn)品市場匹配度),但在業(yè)務上量的情況下,企業(yè)就需要選擇一個能幫助商業(yè)化的AI基礎設施服務商。在這個過程中,客戶希望繼續(xù)使用原來的開源工具,但服務平臺往往接口無法對齊,需要重新實現(xiàn)。

針對一系列開源衍生的需求,商湯升級的大裝置2.0版本給出了三個能力支持:開源兼容接口幫助廠商實現(xiàn)零成本遷移;模型廣場讓用戶自由選擇多種開源大模型并提供調(diào)用,實現(xiàn)零門檻使用;商湯的SenseCore平臺還提供優(yōu)化過的各種開源組件,讓用戶可以根據(jù)自己的需求來自由調(diào)用。

當千行百業(yè)對于大模型的需求提高到“拿來即用”的標準上,商湯想做的,就是把模型的性價比打下來,同時讓廠商自身業(yè)務融入大模型的門檻降得更低。

懂客戶,商湯怎么做差異化壁壘?

不過,在競爭激烈的AI基礎設施供應商賽道中,商湯要想把營收做到第一梯隊,它面臨的競爭壓力依然不小。

面對硬件資源更加充沛,同時靠邊際效應把成本打得更低的云廠商來說,商湯們難以燒錢奉陪打價格戰(zhàn)。

競爭密切的領(lǐng)域,商湯怎么廝殺出重圍?

除了懂模型,更要懂客戶。

在和千行百業(yè)的客戶探索AI技術(shù)落地的十年中,商湯在無數(shù)個實踐結(jié)果后,最終推出了目前需求密切、落地更成熟的四大行業(yè)解決方案——具身智能、AIGC、AI4S(AI for Science)和傳統(tǒng)企業(yè)智能化轉(zhuǎn)型。

作為既做模型,也做AI基礎設施的服務商,商湯內(nèi)部的產(chǎn)品、技術(shù)部門擁有成熟技術(shù),把具體行業(yè)需要的對應能力直接“復制粘貼”提供給用戶,免去后者從頭鉆研的時間和精力成本。

以具身智能行業(yè)為例,針對數(shù)據(jù)短缺的問題,商湯能通過“仿真+真機”雙通道的解決方式,生成大量可用數(shù)據(jù),直接用到模型的訓練中。將這些能力整合到一起,商湯針對具身智能行業(yè)拿出了“端到端”式的方案,從數(shù)據(jù)生產(chǎn)、工具支撐到模型研發(fā),都能一手包辦。

打開網(wǎng)易新聞 查看精彩圖片

這種“拿來即用”的產(chǎn)品在商湯內(nèi)部還有很多。比如具身智能同樣需要應用的視覺算法,再到自動駕駛的歷史數(shù)據(jù),還有模型訓練中需要的適配工具。

除了具身智能行業(yè)外,商湯還把這種能力延伸到了其他行業(yè)。

“實際上,無論是互聯(lián)網(wǎng)類客戶,還是一些線下傳統(tǒng)行業(yè)客戶,他們除了資源、平臺、訓練和推理的成本和性價比之外,還有很多不同的需求。”楊帆列舉了很多來自客戶的具體需求:

比如,有的廠商需要做模型定制,但模型需要在網(wǎng)信辦備案審核,但整體流程對于廠商來說復雜耗時,商湯可以把審核能力開放給用戶;有的廠商需要數(shù)據(jù)私有化,不僅要保護數(shù)據(jù)安全,甚至可能需要國密認證,商湯也能提供對應關(guān)鍵能力。

拿出成熟技術(shù)、打出“更懂客戶”旗幟的商湯,并未止步于基礎的MaaS服務,而是選擇再加碼人才,幫客戶走完落地的每個關(guān)鍵點。

在技術(shù)交流日中,楊帆提及,商湯在2023年專門成立了一個子業(yè)務板塊“AI專家服務”。

“其實在給產(chǎn)業(yè)智能化客戶提供服務時,我們發(fā)現(xiàn),追求一鍵式部署、無代碼編輯等自動化功能對于這些廠商來說意義甚微?!睏罘f。

企業(yè)一般的需求是希望基于一個基礎模型,根據(jù)自己已有的數(shù)據(jù)做定制化模型,并且要求推理能夠滿足他們對性價比的要求。

對于需求明確,但對AI技術(shù)不夠熟悉的客戶來說,標準化的解決方案沒辦法解決所有問題。在這種情況下,商湯往往需要在配置AI基礎服務的基礎上加上服務能力,派出專家提供支持。

靠著人才服務的支持和技術(shù)know-how的輸出,商湯擁有了超越其他AI企業(yè)的差異化壁壘。

抓住生成式AI浪潮,商湯蝶變

技術(shù)的浪潮滾滾向前,一個殘酷的事實是,能真正穿越周期的企業(yè)是極少數(shù)。

2016年的深度學習浪潮中,如今留下還能堅持做通用大模型的已經(jīng)寥寥無幾;2023年的大模型浪潮中,六小虎也開始分化,不少已經(jīng)退出通用大模型的研發(fā)。

在巨頭之外,商湯是一個幸運兒。

目前,商湯自己一邊做模型,一邊把這個過程中習得的能力和優(yōu)勢復制給客戶,把經(jīng)驗做成真正有用的商品,成為了AI基礎設施服務中價值更高的附屬品。

在AI基礎設施服務+大模型服務的配合下,商湯的轉(zhuǎn)型已經(jīng)初見成效。

根據(jù)IDC報告,2024年H1,商湯以14.8%的市場份額位居中國大模型解決方案市場第二。

打開網(wǎng)易新聞 查看精彩圖片

目前,生成式AI也成為了商湯營收的中流砥柱,這代表了營收質(zhì)量的提升。據(jù)財報,2024年,商湯生成式AI相關(guān)業(yè)務收入超過24億元,同比增長103%;其收入占總業(yè)務比例從2023年的34.8%,升至2024年的63.7%。商湯董事長兼CEO徐立曾表示,生成式AI也是商湯最快突破20億元規(guī)模的業(yè)務。

從AI 1.0時代到2.0時代,生存超過十年的商湯,一直埋頭做AI技術(shù),保證核心技術(shù)在第一梯隊。

大裝置業(yè)務,是商湯“反向求解”的一次實踐。

早在2018年,由于做感知智能時遇到了海量數(shù)據(jù)處理的問題,商湯基于技術(shù)需求,打造了國內(nèi)首個AI千卡集群原型機。2020年,商湯又建立了國內(nèi)首個智算中心。彼時,這樣的重資產(chǎn)投入對于商湯來說,是一筆不小的成本。

但正如英偉達為了游戲的極致視覺體驗鉆研GPU,從而在深度學習的時代“無心插柳柳成蔭”,成為當下AI時代的最大贏家。商湯在AI 1.0時代的資產(chǎn)投入,變成了AI大模型訓練的“礦井”。

再以AI基礎的三要素算力、算法和數(shù)據(jù)作為維度評判,商湯在擁有充足算力的基礎上,既有底層硬件優(yōu)化、自研大模型的經(jīng)驗,又有合成數(shù)據(jù)的能力和歷史數(shù)據(jù)沉淀。這就使商湯從一般的AI基礎設施供應商中脫穎而出。

技術(shù)交流日上,商湯大裝置面向具身智能、AIGC、AI4S以及傳統(tǒng)企業(yè)智能化轉(zhuǎn)型推出四大行業(yè)解決方案,則又是一次“反向求解”的成果。

對于一家公司而言,高舉高打的戰(zhàn)略固然重要,但貼地飛行的經(jīng)驗總結(jié)才是制勝關(guān)鍵。畢竟,實踐出真知。

商湯在和客戶合作的過程中,能深度洞察到行業(yè)的痛點和需求,再根據(jù)自身落地的實踐成果,把成功的經(jīng)驗重點做批量復制,最終完成商業(yè)的閉環(huán)。

重技術(shù)的商湯,在一次次反向求解中,終于找到了屬于技術(shù)主義者的勝利。