打開網(wǎng)易新聞 查看精彩圖片

尤洋想知道,梁文鋒的目標(biāo)到底是什么。

文|《中國企業(yè)家》記者 閆俊文

編輯|張曉迪

頭圖來源|受訪者

DeepSeek成了熱門概念,握住它,仿佛就掌握了財富之門的密鑰。

騰訊、百度等大公司目前都已接入了DeepSeek的R1模型。2月中旬,得益于DeepSeek概念,騰訊股價一度漲超6%,達到506港元,創(chuàng)下近三年的新高。另一些服務(wù)器和初創(chuàng)公司也借此造勢,或出售一體機,或售賣token,發(fā)了一筆熱財。

一時間,追隨者如過江之鯽,DeepSeek成了“寬門”,人人都希望通過它來掘金。但偏偏有人例外,要過“窄門”,不跟著DeepSeek的節(jié)奏走。

3月1日,一家名為潞晨科技的AI Infra初創(chuàng)公司發(fā)布公告,“潞晨云將在一周后停止提供DeepSeek API服務(wù),請盡快用完您的余額。如果沒用完,我們?nèi)~退款。”這個公告距離它在2月4日上線這項業(yè)務(wù)還不足一個月。

快速接入,而后快速停止,根源是售賣DeepSeek等開源模型API token的MaaS業(yè)務(wù)模式帶來了虧損。

2月9日,潞晨科技創(chuàng)始人尤洋在微博上“掰指頭”算賬,阿里云、百度云、騰訊云等內(nèi)卷低價或免費提供服務(wù),滿血版的DeepSeek-R1每百萬token官方也只能收到16元,如果滿血版的DeepSeek-R1每日輸出1000億token,每月收入約為4500萬元,但每月的機器成本是4.5億元,虧損4億元!用戶越多,虧損越多,尤洋得出結(jié)論,MaaS(Model as a Service)在中國短時間內(nèi)可能是最差的商業(yè)模式。

這種觀點引發(fā)了熱議。在知乎上,尤洋給出自己的算賬過程,但一部分網(wǎng)友認為他將問題無限拔高,直言其否定了DeepSeek。

3月1日中午,DeepSeek在知乎發(fā)表的一篇名為《DeepSeek-V3/R1推理系統(tǒng)概覽》的文章提到,理論上一天的總收入為56萬美元,成本利潤率 545%。

但尤洋仍堅持自己的觀點,并列舉了三大理由:1.測試速度和實際場景的差距;2.機器利用率峰值和波谷的巨大差距;3.機器的不穩(wěn)定性。他感嘆,有點不太想深入討論,因為很多人甚至想當(dāng)然地把“DeepSeek不虧錢”當(dāng)成一種不能撼動的真理。

3月1日下午,潞晨科技宣布暫停DeepSeek API服務(wù)。

3月底和4月底,《中國企業(yè)家》兩次采訪尤洋。他是一位90后,戴著眼鏡,身材瘦削,不善言談,與他在網(wǎng)絡(luò)上“火力全出”的形象截然不同。

事實上,尤洋要穿過三重“窄門”,一個是大家都在擁抱售賣DeepSeek等開源模型的API服務(wù),但尤洋拒絕;另一個則是他堅定選擇與華為昇騰等國產(chǎn)算力廠商合作,大部分人還在等待美國政府對英偉達H20芯片的寬限令;最后,他押注視頻大模型,這與文本模型的熱鬧形成了反差。

“視頻大模型是AI時代的相機?!庇妊笳f,潞晨開源的視頻模型Open-Sora 2.0,近期榮登GitHub Trending全球開源熱度榜單第一,以此為基礎(chǔ)的AI視頻生成平臺Video Ocean,僅需用戶提供一句話描述,即可在線生成高質(zhì)量動態(tài)視頻,發(fā)布后登上Product Hunt全球產(chǎn)品熱度榜單第一。

尤洋履歷頗豐,本科畢業(yè)后,他先在清華大學(xué)攻讀碩士研究生,后赴美國加州大學(xué)伯克利分校深造,獲得博士學(xué)位后,任新加坡國立大學(xué)高性能人工智能實驗室主任、校長青年教授;2021年,尤洋受投資人邀請,在北京創(chuàng)立了潞晨科技,迄今已獲得創(chuàng)新工場、真格基金、紅杉中國、藍馳創(chuàng)投、北京市AI產(chǎn)業(yè)投資基金等投資機構(gòu)的數(shù)輪融資。

來源:受訪者
打開網(wǎng)易新聞 查看精彩圖片
來源:受訪者

目前,潞晨科技在北京和新加坡等地有近80人的團隊,根據(jù)2024年披露的數(shù)據(jù),該公司合同營收7700萬元人民幣,賬面上有能滿足30個月開支的現(xiàn)金流。

以下是對話的內(nèi)容實錄(有刪減):

放棄DeepSeek API服務(wù),最主要原因是虧損

放棄DeepSeek API服務(wù),最主要原因是虧損

《中國企業(yè)家》:你們在2月和3月遭遇的網(wǎng)絡(luò)風(fēng)波,現(xiàn)在已經(jīng)過去了嗎?

尤洋:對我們來說,其實一直沒有什么影響,我個人也沒有去與DeepSeek對立的想法。

《中國企業(yè)家》:現(xiàn)在外界對技術(shù)與商業(yè)模式的討論,各種各樣的說法都有。

尤洋:在知乎上或者其他地方攻擊我的那些人,我敢負責(zé)任地說,這些人里99%從來沒有用300多張卡去真正部署過DeepSeek,甚至沒用100張卡部署過。僅去跟風(fēng)想象一件事情,和實際動手驗證,得到的觀察是截然不同的。

我確實親手驗證過這件事情,如果是業(yè)界專家看,我的觀點跟DeepSeek發(fā)布的數(shù)據(jù),是沒有任何沖突的。

《中國企業(yè)家》:但DeepSeek說自己的成本利潤率是545%,而你在微博上說MaaS模式下,毛利率是-700%。

尤洋:首先,DeepSeek原文中說了,這是理論數(shù)字。沒有考慮用戶的體驗和商業(yè)服務(wù)的可用性保障,并且他把那些APP以及網(wǎng)頁和MaaS上的token都加在一起計算了收入,但顯然很多是大家可以免費使用的。

春節(jié)的時候,我感覺DeepSeek的熱度有點過于瘋狂了。它還在非理性市場,一旦變得市場化,需求側(cè)變得不穩(wěn)定和高要求,那么它的測算還會有非常大的波動。

《中國企業(yè)家》:您微博上所說的數(shù)據(jù),比方說收入4500萬元,機器成本3.6億元,毛利率-700%,這個結(jié)論是你們自己跑出來的?

尤洋:根據(jù)微博上另一位博主在AMD機器上的實測換算得到。補充一個例子,Hugging Face中國區(qū)的一位資深專家在朋友圈發(fā)圖,他把卡的性能發(fā)揮到極致,燒了一下午的token,也沒有燒夠100萬個,當(dāng)然他用的卡可能是低配版??紤]到服務(wù)全國用戶,可能全國有5000萬人在用,大多數(shù)人每天可能就用一兩個小時。但因為我們不能準(zhǔn)確預(yù)測哪些用戶要用多少,什么時候用,同時為了容納高峰保障MaaS服務(wù)的商業(yè)穩(wěn)定,機器要能容納最高峰,低谷還是得放著,成本還是高峰那么多。

我的算力不管是租還是自建,算力成本都是隨時間穩(wěn)定產(chǎn)生的,推理與訓(xùn)練需求的服務(wù)器也不一樣,這得放多少服務(wù)器,可能需要數(shù)萬臺H20等推理服務(wù)器時刻運轉(zhuǎn)。比如大家不能接受微信在高峰時段不可用和三天兩頭崩掉。類似的,作為MaaS供應(yīng)商,下游商業(yè)應(yīng)用和C端用戶也需要有體驗和服務(wù)的可用性保障。

《中國企業(yè)家》:速度是指token的輸出速度嗎?

尤洋:賺還是虧,核心的指標(biāo)就是一臺GPU每秒能出多少token,以及對應(yīng)的成本。比如它究竟是一秒鐘輸出了1000個token還是10000個token,因為它最終是按照token的價格去賣的。

來源:AI生成
打開網(wǎng)易新聞 查看精彩圖片
來源:AI生成

《中國企業(yè)家》:公司在2月初上線了DeepSeek的API服務(wù),但經(jīng)過一個月的嘗試,決定不做這個業(yè)務(wù),這是為什么?

尤洋:如果不嘗試的話,我感覺沒有發(fā)言權(quán)的。其他初創(chuàng)公司可能會覺得,前幾個月我燒一下,然后過幾個月再堅持一下,跑不通了,我再把它砍掉,但是我們可能就直接過了不到一個月的時間就把它砍掉了。

《中國企業(yè)家》:為什么決斷這么迅速?

尤洋:有兩個原因,第一,我們海外的潞晨云業(yè)務(wù)增長比較快,我們應(yīng)該把資金投入到非常難得的增長機會里;第二,MaaS的商業(yè)模式還不太成熟就已陷入內(nèi)卷,現(xiàn)在中國至少有50個云廠商都在提供開源的DeepSeek模型API服務(wù),它已經(jīng)不是一個稀缺的東西了,現(xiàn)在部署起來也比較成熟,利潤空間非常有限。

根據(jù)IDC數(shù)據(jù),TOP3公有云已占據(jù)MaaS 85%市場份額,截至2024年底,MaaS全國用量10000億token/天。以較貴的DeepSeek-V3刊例價計算,該業(yè)務(wù)全國全年市場總計營收期望值為:10000億token/天×8元/百萬token×365天=29.2億元。但實際上,為搶占市場,有大量免費和低價token,不計成本惡性競爭,遠達不到上述營收期望。

《中國企業(yè)家》:公司公告里也說了“暫?!?,你也說MaaS暫時是中國最差的商業(yè)模式,什么時候會再次嘗試?

尤洋:我們非常靈活,只要它符合市場,并且能產(chǎn)生一定的利潤,不管用何種方式,只要它能產(chǎn)生健康的利潤,我覺得應(yīng)該去做。

《中國企業(yè)家》:初創(chuàng)公司很少提利潤,一般都是先做規(guī)模,擴大市場份額。

尤洋:可能不一定公司需要盈利,但是至少這個生意邏輯應(yīng)該是跑得通的,我的單位經(jīng)濟模型到底是什么?長期來看,它如何產(chǎn)生價值,我覺得產(chǎn)生利潤就是一個企業(yè)應(yīng)該追求的東西。

《中國企業(yè)家》:作為一個創(chuàng)業(yè)者,你怎么看Kimi和DeepSeek這樣的明星公司?

尤洋:我感覺都有點可遇而不可求。根據(jù)楊植麟的自述,在2023年但凡晚個幾周,他可能就達不到他今天的壯舉,他的融資窗口只有一個月,當(dāng)然,他本身也有張予彤(前金沙江創(chuàng)投主管合伙人)的加持,這種機會難得,可遇而不可求,DeepSeek背后的幻方量化資金非常雄厚,較早就有萬卡集群了。

這兩者的情況其實不像是創(chuàng)業(yè),他們本身就已經(jīng)家大業(yè)大了,更像在運營一個阿里或者谷歌的研發(fā)中心,而不是一般創(chuàng)業(yè)者的模式。

《中國企業(yè)家》:MaaS模式之下,就沒有獲益的公司?

尤洋:MaaS對OpenAI來說是一個很好的商業(yè)模式。我始終覺得AI最終應(yīng)該形成兩三家企業(yè),兩三家有絕對實力的企業(yè)進行必然(適度)的壟斷,而不是一家。比如中國有三家,這三家的模型非常好,它可以像OpenAI那樣去閉源,做成MaaS并獲得合理收益。

現(xiàn)在MaaS商業(yè)模式之所以不好,是因為大都使用開源模型或者沒有拉開差距的閉源模型,各家沒有本質(zhì)不同,為了搶占市場,只能打價格戰(zhàn)和免費惡性競爭,但成本是根據(jù)GPU固定產(chǎn)生的。

初創(chuàng)公司的商業(yè)模式是什么?

初創(chuàng)公司的商業(yè)模式是什么?

《中國企業(yè)家》:你在微博上引用紅杉資本合伙人周逵的話,尋找“難而正確的事”并沉下心來去做,什么是正確的事?

尤洋:但凡是高價值的東西,肯定會有很多人想去做。因為它有高價值,肯定也不會那么簡單,首先每個人都選一個自己相信的點,比如我相信未來就是算力平臺,加上視頻大模型,這兩個生意是有光明前景的。

《中國企業(yè)家》:潞晨的商業(yè)模式是什么?

尤洋:第一,幫助企業(yè)去做自己的AI大模型,比如企業(yè)自有模型、行業(yè)模型,我們面向一些中小型客戶以及傳統(tǒng)客戶,在海外就是潞晨云,國內(nèi)就是一體機,這是我們一直在做的事情;第二,我們最近特別關(guān)注視頻大模型,視頻大模型未來就是AI的相機。

《中國企業(yè)家》:視頻大模型為什么是未來的機會?

尤洋:視頻大模型是未來三年少有的持續(xù)增長的市場,關(guān)鍵是視頻大模型它有兩點,第一,它對算力的需求優(yōu)化極高,一個很小的視頻可能都有幾百萬token,視頻大模型未來的三五年核心就是算力優(yōu)化,這是最重要的事情。

來源:AI生成
打開網(wǎng)易新聞 查看精彩圖片
來源:AI生成

第二,視頻大模型產(chǎn)品形態(tài)很有可能會變成一個算力優(yōu)化的工作,它跟大語言模型的核心區(qū)別是,大語言模型是需要實時交互的,比如說我用ChatGPT或者DeepSeek,如果我問它一個問題,它過兩三分鐘才回復(fù),甚至超過20秒回復(fù),我就沒有耐心了。

但視頻大模型我提交一個任務(wù),比如,我讓它生成一個電影,生成一個短視頻,我是可以等的。

《中國企業(yè)家》:視頻模型的生意本質(zhì)還是MaaS模式。

尤洋:對,但它的MaaS商業(yè)上比較友好,即便用戶同時擠過來,可以隊列式處理請求。

《中國企業(yè)家》:在云上,訓(xùn)練一個中小企業(yè)自己專屬的模型的話,大概成本是多少錢?

尤洋:大概是3萬元/月,當(dāng)然有的可能需求高一點也可以,也有些企業(yè)花了幾百萬。在海外,我們大概每月有100萬美元的收入。

《中國企業(yè)家》:有廠商已經(jīng)把一體機的價格賣到了14萬元左右,你們的一體機價格在數(shù)百萬元,差別是什么?

尤洋:如果只是買10萬元的一體機的話,它跑DeepSeek-R1-671B參數(shù)效率不是最高的,也不會有太好的實際意義。其實他們很多是套殼KTransformers這個開源項目。簡單做個性價比核算:硬件10萬元,Q4量化(一種壓縮模型的技術(shù))的殘血DeepSeek-R1/V3模型輸出能力10token/s,只能供1個用戶使用,每月滿載理論輸出能力26M token;而從云廠買等量未閹割滿血模型的API token價值一兩百塊,還有免費額度和按量折扣。100多萬元的一體機可以服務(wù)高精度高并發(fā)的商業(yè)需求和簡單私有模型微調(diào)開發(fā),顯然實用很多。

我們還做了Colossal-AI開源,這是全亞洲最大的大模型訓(xùn)練推理的平臺系統(tǒng),僅就開發(fā)工具而言,我們在優(yōu)化方面積累還是非常深的,收獲了5個世界500強客戶。

華為是個大機會

華為是個大機會

《中國企業(yè)家》:現(xiàn)在你們焦慮嗎?畢竟H20受限了。

尤洋:還好,國內(nèi)沒有H20的話,我們就做國產(chǎn)芯片,華為昇騰等國產(chǎn)算力發(fā)展得很快。

《中國企業(yè)家》:我看到國外媒體說華為要發(fā)新的芯片910C,你們會覺得有差別嗎?會對你們的成本結(jié)構(gòu)有什么影響?

尤洋:差別不大,我們就是想選一個市場上能買到的最好和最受歡迎的機器,基于它去做優(yōu)化。其實我覺得對我們是更有利的。因為假定國產(chǎn)芯片可能暫時落后英偉達芯片的話,我們其實有更多優(yōu)化空間可以做。

《中國企業(yè)家》:你在微博上也說,華為的芯片優(yōu)化不可能靠1~2家小公司搞定。

尤洋:華為有幾千人的團隊與芯片業(yè)務(wù)相關(guān),華為的芯片肯定是有中流砥柱的作用。我覺得再配合幾十家、上百家公司去協(xié)同華為生態(tài),這樣比較靠譜,肯定不能靠一兩家小公司去把這個事情做好。

《中國企業(yè)家》:目前,國產(chǎn)芯片相較于英偉達芯片,主要差距在哪里?

尤洋:一張英偉達芯片賣多少錢,一張國產(chǎn)芯片賣多少錢,受限于生產(chǎn)芯片的成本和暫時的技術(shù)限制,所以(國內(nèi))生產(chǎn)同樣性能的芯片成本就高很多,導(dǎo)致必須得這樣定價,定價又導(dǎo)致研發(fā)速度跟不上英偉達。

來源:AI生成
打開網(wǎng)易新聞 查看精彩圖片
來源:AI生成

比如說同樣花了1萬塊錢,英偉達能每分鐘出10萬個token,國產(chǎn)芯片只能出3萬或者2萬個token。我覺得華為等已經(jīng)做得很好了,只不過英偉達積累的時間更長,做了20多年了,飯得一口一口吃。

《中國企業(yè)家》:在國產(chǎn)芯片上做優(yōu)化和加速的難點是什么?

尤洋:大模型層,首先DeepSeek的難點是,國產(chǎn)芯片沒那么穩(wěn)定,它的周邊配套也不是特別好,國產(chǎn)芯片很多算子缺失,精度、編譯器、集群等又經(jīng)常出bug,導(dǎo)致使用它開發(fā)比較困難,總體上,肯定不是一個芯片本身跑分高低的問題。

這相當(dāng)于我有一個賽車,它的設(shè)計理論速度,比如說250公里每小時,但是我可能要精心嘗試跑100次才能跑出一個這樣的速度,它還沒那么穩(wěn)定。

《中國企業(yè)家》:對于AI Infra企業(yè)來說,是模型進化更重要還是加速更重要?

尤洋:其實兩者并不矛盾,模型的進化能帶動需求的旺盛,進一步帶動對開發(fā)、應(yīng)用模型的信心和投入,提升對訓(xùn)推加速、算力的需求,進而加速模型進化。

《中國企業(yè)家》:如果你有機會去見到DeepSeek的梁文鋒,你會和他討論什么問題?

尤洋:其實我最關(guān)心的是,他到底是想做一個成功的商業(yè)化公司,還是想通過一些其他手段做一些非盈利的事情?想知道一下,他的目標(biāo)到底是什么,因為兩者肯定差距是非常大的。比如說OpenAI可能還是想做一個Google那樣非常高價值的商業(yè)化公司,我不知道梁文鋒是不是想做中國AI版的谷歌。