打開網(wǎng)易新聞 查看精彩圖片

根據(jù)DeepSeek過往的產(chǎn)品更新周期來看,梁文鋒的主場時間又快到了。

文|《中國企業(yè)家》記者 閆俊文

編輯|張曉迪

頭圖來源|視覺中國

這兩天,中美大模型公司各有大事發(fā)生。

4月15日凌晨,OpenAI發(fā)布了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它們的核心特征是成本更低,速度更快;同一天,另一家中國明星AI公司,智譜AI正式啟動上市輔導備案,由中金公司擔任輔導機構。備案報告顯示,智譜AI將在今年8月至10月完成IPO輔導計劃。

此前的3月底,智譜AI CEO張鵬曾告訴《中國企業(yè)家》,他判斷實現(xiàn)AGI,路程還長,“不管我們?nèi)诹硕嗌馘X,其實都是AGI道路上的盤纏,未來,還需要更多盤纏,我們會持續(xù)地做相關的事情”。

如今看來,這個“更多的盤纏”就是指IPO。

2025年開年,DeepSeek“燃爆”AI圈,目前,截至R1模型正式發(fā)布已經(jīng)過去86天。

DeepSeek和梁文鋒的團隊什么時候推出新的大模型產(chǎn)品,尤其是R1的更新版?

《中國企業(yè)家》統(tǒng)計了國外Anthropic、Meta等公司更新大模型的周期,如果是模型的重大升級,周期在5至10個月左右;而同一版本的功能升級則在3至4個月之間。

根據(jù)DeepSeek官網(wǎng)數(shù)據(jù),梁文鋒的AI團隊更新產(chǎn)品與國外主流公司同頻,2024年9月發(fā)布V2.5,12月發(fā)布V3,2025年3月將V3更新為V3-0324版本,也幾乎每隔3個月就會迎來一次升級。

有一些預測認為,DeepSeek下一次更新R1模型可能是在5月初,屆時或提前發(fā)布,但DeepSeek方面目前還尚未對這種預測進行回應。

OpenAI也在追求更小更快

OpenAI也在追求更小更快

公開資料顯示,GPT-3的參數(shù)規(guī)模為1750億,GPT-4的參數(shù)規(guī)模為1.76萬億,到了GPT-4o參數(shù)約2000億規(guī)模,此次OpenAI推出的GPT-4.1 Mini,被稱作OpenAI的高效小型模型,在多個基準測試中表現(xiàn)超越GPT-4o,大幅減少延遲并降低83%成本。

GPT-4.1 Nano被稱之為首個超小型模型,它能支持100萬token的上下文窗口,適用于低延遲任務,如分類和自動補全。

值得注意的是,上述三個模型將上下文窗口處理的規(guī)模從GPT-4o的128K直接提升至100萬token(1M)。這意味著模型在更長的文本中保持專注和理解的能力得到了強化。

具體到成本、價格方面,GPT?4.1比GPT?4o便宜26%,輸入、輸出分別是每百萬token2美元和8美元;GPT?4.1 Nano輸入、輸出分別為0.1美元和0.4美元。

對比DeepSeek,標準時間段內(nèi),V3模型輸入、輸出百萬token的費用為0.5元、8元,R1推理的費用分別為1元和16元。

可以說,OpenAI也打上了token的價格戰(zhàn),價格直接對標DeepSeek。

與此同時,OpenAI已暫停了其此前2月發(fā)布的GPT-4.5,原因在于成本太高,其API定價為輸入、輸出每百萬token75美元、150美元。官方回應說此次調(diào)整旨在將更多資源投入未來模型的研發(fā)。

關于開源,OpenAI的CEO山姆·阿爾特曼不得不走向與DeepSeek同樣的路徑,他曾表示,DeepSeek的出現(xiàn)并未影響GPT的增長,OpenAI將推出更好的開源模型。

不過,在DeepSeek沖擊之下,阿爾特曼曾經(jīng)一度非常惱火,甚至恐慌,他曾在社交平臺上指責R1模型使用了GPT的數(shù)據(jù)蒸餾,又寫公開信給美國政府,聲稱限制AI技術流向中國等國家,并禁用DeepSeek。

來源:視覺中國
打開網(wǎng)易新聞 查看精彩圖片
來源:視覺中國

但這并不影響DeepSeek的影響力。在英偉達的2025GTC開幕主題演講會上,黃仁勛數(shù)次提到R1模型,并用R1模型驗證了黃仁勛所謂的“推理越多,所需算力越多”的說法。

除了OpenAI,谷歌在4月9日也舉辦了發(fā)布會,宣布推出Agent2Agent智能體交互協(xié)議,該協(xié)議允許生態(tài)系統(tǒng)中的AI智能體進行底層技術無關的相互操作。多個智能體的協(xié)作將帶來更高的自主性,同時成倍提高生產(chǎn)力、降低長期成本。

梁文鋒的主場時間又快到了

梁文鋒的主場時間又快到了

在R1模型“爆火”之后,DeepSeek除了模型升級,人事布局上動作頗多,DeepSeek官網(wǎng)在3月份發(fā)布了招聘CFO、COO、財務負責人崗位的信息。這也被一些媒體解讀為DeepSeek在為融資做準備;模型方面,DeepSeek最大的動作是3月25日發(fā)布了V2模型的更新版。

目前,DeepSeek并未發(fā)布有關融資方面的信息。4月3日,梁文鋒和團隊發(fā)表了一篇論文,題目是《通用獎勵建模的推理時間縮放》,文章論述了如何讓注意力機制更高效地處理更長的上下文等。

DeepSeek“燃爆”AI圈后,外界對其充滿好奇和新的期待。潞晨科技CEO尤洋近期在接受《中國企業(yè)家》采訪時說,如果有機會跟梁文鋒面對面,他最想問梁文鋒的是他最終的目標是什么,“梁文鋒是想做一個成功的商業(yè)化公司,還是想通過一些其他手段做一些非盈利的事情?這兩者肯定差距是非常大的,OpenAI可能還是想做一個Google那樣的非常高價值的商業(yè)化公司?!?/p>

記者了解到,目前,無論是杭州本地的大公司,還是深圳的頂級創(chuàng)投,都難見梁文鋒一面。

近期英偉達公開表示,美國政府正在限制其H20芯片向中國的出口,并且H20芯片對華出口需要獲得許可證,這一要求是“無限期”。

而H20芯片正是梁文鋒最在意的“基礎設施”,早先,梁文鋒在接受媒體采訪時說,“我們真正的挑戰(zhàn)從來不是資金,而是高端芯片的出口禁令?!?/strong>

不過,面對禁令,梁文鋒也并非坐以待斃,他曾在接受媒體采訪時說,“英偉達的GPU沒有什么神秘之處,但要趕上他們,就必須重建團隊、付出時間和成本,追趕下一代技術——這才是真正的護城河。”