當(dāng)奧特曼讓OpenAI寧可選擇日活十億的應(yīng)用,而不是頂尖的大模型時,是不是大模型的歷史已經(jīng)終結(jié)了?

大模型最前沿的對決,將發(fā)生在谷歌與OpenAI之間。OpenAI在大模型性能稍稍領(lǐng)先,谷歌在基礎(chǔ)設(shè)施與應(yīng)用生態(tài)優(yōu)勢明顯,雙方都在加速奪取對方陣地控制權(quán)。在巨頭這里,AGI的探索人類智能邊界的意義已經(jīng)褪色,它自己的問題還遠未解決,卻聲稱要準(zhǔn)備解決人類的許多問題。

短兵相接的節(jié)奏,已經(jīng)要以天來計。差不多一周時間,谷歌推出了,迭代了一大串多模態(tài)模型,又推出了更省算力的思考模型Gemini 2.5 Flash;OpenAI讓ChatGPT記住用戶告訴過它的一切,發(fā)布了號稱要淘汰GPT-4.5的GPT-4.1系列,以及會用圖像思考的滿血版o3與o4-mini。好幾次都臉貼臉發(fā)布,火藥味濃厚。

如今,在Scale AI打造的“人類最后的考試”(Humanity's Last Exam)中,排在最前列的,只有谷歌與OpenAI的前沿模型,包括這周的o4-mini與Gemini-2.5-Flash。其他能進入前十的,只有Anthropic的Cloude-3.7-Sonnet,以及DeepSeek的R1(僅限文本類排名)。

打開網(wǎng)易新聞 查看精彩圖片

來源:scale.com,人類最后考試(僅文本)模型評測

如此快節(jié)奏的發(fā)布,以及逐步趨同的功能,預(yù)示著在擴展定律邊際效應(yīng)減弱后,這個行業(yè)的技術(shù)路線開始收斂。這個時候,比拼的就是執(zhí)行力了。員工主觀意愿雖然重要,但是客觀的基礎(chǔ)設(shè)施與應(yīng)用生態(tài),在很大程度上又可以“縮放”主觀意愿的效果。

下一代大模型的預(yù)訓(xùn)練,越來越依賴于團隊對基礎(chǔ)設(shè)施的熟悉程度與優(yōu)化能力。近日,OpenAI公開討論了GPT-4.5的訓(xùn)練經(jīng)驗,以及據(jù)此對訓(xùn)練下一代模型的展望。大模型參數(shù)規(guī)模越大,預(yù)訓(xùn)練數(shù)據(jù)集越大,硬件故障導(dǎo)致的損失也就越大;而基礎(chǔ)設(shè)施的規(guī)模增長,也在放大硬件故障的復(fù)雜度,計算、存儲、通信、能源,需要系統(tǒng)性考慮;當(dāng)算力需求超出單集群的供給能力時,就不得不轉(zhuǎn)向多集群訓(xùn)練架構(gòu),這又是全新的挑戰(zhàn)。。

因此,即使擁有無限的GPU、網(wǎng)絡(luò)和電力,也“無法在GPT-4的技術(shù)棧上訓(xùn)練GPT-4.5”。不從基礎(chǔ)設(shè)施的起點解決這個問題,GPT-5.5或許就是OpenAI上限。

行業(yè)正在進入推理時代。在大模型商品化趨勢明顯的當(dāng)下,性價比是擴大用戶規(guī)模的關(guān)鍵之一。對于AI應(yīng)用來說,用更低的成本提供相近的服務(wù),也是增厚利潤率的來源之一。這就意味著,誰能盡可能地壓榨基礎(chǔ)設(shè)施的單位成本的算力,誰的優(yōu)勢就更明顯。

目前看來,優(yōu)勢也在谷歌這一邊。盡管在解決編碼問題時,o3以微弱的優(yōu)勢領(lǐng)先于Gemini 2.5 Pro,但代價是需要用戶付出近20倍的成本。反觀主打小巧高效的o4-mini,與Gemini相比,結(jié)果不僅更貴,水平也略低一點。o4-mini所謂的高性價比,是相對OpenAI自身的產(chǎn)品體系而言的,不是相對整個市場而言的,這無疑削弱了它的競爭力。

打開網(wǎng)易新聞 查看精彩圖片

目前無法完全將其歸因于谷歌的硬件優(yōu)勢。在算法與產(chǎn)品層面,整個行業(yè)也還有不小降本空間。谷歌今天發(fā)布的Gemini-2.5-Flash就是如此,開發(fā)者可以通過設(shè)置預(yù)算上下限,來控制模型在思考階段的推理深度;模型也會根據(jù)提示的復(fù)雜度,自動判斷所需推理量和思考時間。

但最終競爭還是會落到芯片與基礎(chǔ)設(shè)施上。半導(dǎo)體分析機構(gòu)Semianalysis認為谷歌的定制TPU,總擁有成本要低于英偉達的通用GPU?!捌饰鰯?shù)據(jù)中心,就像是窺探AGI的核心……在AI的軍備競賽中,不同公司(數(shù)據(jù)中心的)架構(gòu)差異非常大?!苯衲?月,該機構(gòu)的Dylan Patel在X上寫道。當(dāng)時,谷歌尚未發(fā)布專為推理而設(shè)計的AI芯片Ironwood,它的能效是上一代的TPU的2倍,Pathways技術(shù)可以助其實現(xiàn)高效分布式計算。

OpenAI仍是追趕者,采購英偉達的GPU,租用微軟、甲骨文等的基礎(chǔ)設(shè)施,無法最大程度地獲益于芯片與基礎(chǔ)設(shè)施優(yōu)化。去年,它,但是即使一切順利,它與博通合作的定制芯片,也要等到2026年才能啟動規(guī)模量產(chǎn);而且,初代自研芯片達不到成熟水平,無法迅速規(guī)模部署,至少經(jīng)歷三次迭代。亞馬遜的Trainium已經(jīng)迭代到第二代,,但實際總擁有成本仍然遠不及英偉達。,目前采購的仍是英偉達的Blackwell架構(gòu)芯片。

時間站在谷歌這一邊。在追趕基礎(chǔ)設(shè)施的兩三年時間里,OpenAI的對策是培育更為龐大的應(yīng)用生態(tài)。這不僅關(guān)系到規(guī)模化變現(xiàn),讓自己活著見到那一天,還因為這是提升用戶粘性的有效手段。只有這樣,才能將用戶關(guān)于“性價比”的比較,鎖定在自己的產(chǎn)品體系內(nèi)。無論是豐富軟硬件生態(tài)中的蘋果用戶,還是社交媒體網(wǎng)絡(luò)效應(yīng)下的Meta用戶,不會輕易因為價格就離開這個生態(tài)。

從去年開始,,為的正是孵化或并購出“一整套圍繞AI打造的生態(tài)”,包括新的搜索框與硬件設(shè)備。

OpenAI加入了。搜索是生成式AI最有希望的爆款應(yīng)用之一,也是奧特曼產(chǎn)品矩陣?yán)砟钪嘘P(guān)鍵拼圖。去年初,市場就流傳著出OpenAI要做搜索的消息,媒體還打探到OpenAI正在積極地挖谷歌的員工;7月,SearchGPT正式內(nèi)測;年底,ChatGPT上線搜索,奧特曼稱這是他自ChatGPT發(fā)布兩年以來最喜歡的功能,讓他的使用頻次翻了番。今年,OpenAI進一步將搜索與智能體組合起來,包裝成最高月薪2萬美元的博士級的研究助手。

近日,OpenAI還被傳出正在開發(fā)一個類似X的社交網(wǎng)絡(luò)項目。在更早一點時間,奧特曼看到Meta計劃為其AI助手添加社交動態(tài)時表示,“也許我們會做一個社交應(yīng)用”;他還在與馬斯克斗嘴的時候反擊,。這都讓傳言變得更具體生動。

智能體是大模型應(yīng)用落地的確定性路徑。, OpenAI仍然在構(gòu)筑自己的智能體生態(tài)。o3與o4-mini擁有智能體級別的工具使用能力(agentic tool use),相較以往大模型往往是被動執(zhí)行指令,它們能夠思考何時以及如何使用工具。直播中,OpenAI總裁布洛克曼(Greg Brockman)還提到,o3在解決一個復(fù)雜任務(wù)時,曾被觀察到連續(xù)調(diào)用了高達600次工具。1個月前OpenAI還發(fā)布了Responses API,將OpenAI模型和內(nèi)置工具的互動變得更為輕松。

日前,奧特曼在接受Stratechery專訪時聲稱,“一款10億日活的產(chǎn)品,比最頂尖的AI模型更有價值”。OpenAI正在接近這個目標(biāo)。去年底,OpenAI周活用戶達到3億,今年2月突破4億;在剛過去的TED 2025大會上,奧特曼稱全球10%人口頻繁使用ChatGPT,短短幾周內(nèi)就實現(xiàn)翻倍。

但這一切,仍然都沒有逃出谷歌的勢力范圍。在今年2月的財報會議上,谷歌稱Gemini已經(jīng)接入旗下七個擁有超過20億用戶的產(chǎn)品和平臺。在其他產(chǎn)品逐步將搜索作為AI對話框的其中一項功能后,谷歌一方面繼續(xù)用AI增強搜索,AI 概覽覆蓋了10億月活用戶,超過2億部安卓手機可以使用“畫圈即搜索”的AI功能;另一方面,去年底率先推出Deep Research功能,讓它幾乎成為行業(yè)標(biāo)配。谷歌的A2A協(xié)議也號稱比MCP更懂如何讓智能體與智能體互動。

在技術(shù)仍然發(fā)散式創(chuàng)新的階段,谷歌曾短暫地迷失過方向,倉促起舞,幾場災(zāi)難性的發(fā)布會,成為了笑料。但在技術(shù)逐步收斂的階段,估值3000億美元的OpenAI,想要對決市值1.8萬億的谷歌,每一天都是挑戰(zhàn)。