打開(kāi)網(wǎng)易新聞 查看精彩圖片

新智元報(bào)道

編輯:桃子 犀牛

【新智元導(dǎo)讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據(jù)稱(chēng)是OpenAI的神秘模型一夜爆紅,每日處理高達(dá)260億token,是Claude用量4倍。奧特曼在TED放話:將推超強(qiáng)開(kāi)源模型,直面DeepSeek挑戰(zhàn)。

近了,近了!

全網(wǎng)多個(gè)流出的代碼截圖顯示,滿血版o3、o4-mini,以及o4-mini high,有極大概率在下周發(fā)布。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

不僅如此,在OpenRouter平臺(tái)上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,據(jù)稱(chēng)就是o4-mini。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

另一款Quasar模型也殺入競(jìng)技場(chǎng)TOP 5,奧特曼對(duì)其亮眼的表現(xiàn)做出了回應(yīng)

這款模型最大亮點(diǎn)在于,上下文長(zhǎng)達(dá)100萬(wàn)token,一舉超越了Claude 3.7 Sonnet。

更令人震驚的是,OpenRouter數(shù)據(jù)顯示,Optimus Alpha才上線沒(méi)幾天一夜爆紅,每日處理token數(shù)量高達(dá)260億。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

另一邊,OpenAI正在為開(kāi)源模型做準(zhǔn)備,上周內(nèi)部召開(kāi)討論會(huì),邀請(qǐng)了AI社區(qū)大佬提建議。

在TED最新對(duì)談中,奧特曼再次回應(yīng)了DeepSeek,「我們正在開(kāi)發(fā)一款強(qiáng)大且媲美頂尖LLM的開(kāi)源模型」。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

不論是o4系的發(fā)布,還是OpenAI開(kāi)源模型登場(chǎng),都足以讓AI圈興奮一段時(shí)間了。

o4系模型出世,直接霸榜?

大佬Matthew Berman從更多公開(kāi)測(cè)試的蛛絲馬跡中,發(fā)現(xiàn)了神秘模型Optimus Alpha的一些亮點(diǎn)。

  • 卓越的多文件協(xié)同處理能力

  • 出眾的設(shè)計(jì)美學(xué)感知

  • 對(duì)復(fù)雜系統(tǒng)的直覺(jué)式理解

  • 閃電般的響應(yīng)速度

  • 自如切換抽象層級(jí)的能力

打開(kāi)網(wǎng)易新聞 查看精彩圖片

在Aider多語(yǔ)言編程方面,可與o3-mini-medium、Grok 3相媲美,拿下53%的分?jǐn)?shù)。

創(chuàng)意寫(xiě)作v3基準(zhǔn)上,它甚至擊敗了Gemini 2.5 Pro,ELO得分1320.8。另外,在SQL的生成上,平均得分為0.830,其中80%為滿分。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

可以明確的是,新模型專(zhuān)為編程和技術(shù)任務(wù)構(gòu)建。在SQL查詢(xún)生成、Web開(kāi)發(fā)和系統(tǒng)設(shè)計(jì)方面的性能,均超過(guò)了任何公開(kāi)可用的工具。

比如,在Roo Code社區(qū)中,Optimus Alpha使用量已是Claude模型的4倍,深受廣大開(kāi)發(fā)者歡迎。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

在編碼測(cè)試中,Matthew給出一個(gè)簡(jiǎn)單的指令——為我創(chuàng)建一個(gè)帶有功能購(gòu)物車(chē)的電子商務(wù)網(wǎng)站。

Optimus Alpha便智能地設(shè)計(jì)出完整的UI界面,還制作出了「抽屜式購(gòu)物車(chē)」,要知道大多數(shù)AI都會(huì)失敗。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

再比如,一次性生成貪吃蛇游戲。

Optimus Alpha可以做到自定義漸變色用于貪吃蛇,深綠色的頭部可便于視覺(jué)區(qū)分。

而且,簡(jiǎn)潔直觀的操控界面,完整的游戲機(jī)制,都印證了其編碼能力的強(qiáng)大。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

最關(guān)鍵的是,代碼生成速度令人驚嘆,這體驗(yàn)就像隨時(shí)召喚一位世界頂級(jí)工程師。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

更強(qiáng)的o4系模型已預(yù)定,那么關(guān)于開(kāi)源模型,OpenAI又有怎樣的規(guī)劃呢?

不如,一起看看TED大會(huì)上,奧特曼如何回應(yīng)的AI開(kāi)源競(jìng)賽,以及關(guān)于當(dāng)前爆火GPT-4o生圖、AI下一個(gè)突破、對(duì)就業(yè)創(chuàng)造力影響。

GPT-4o承包創(chuàng)意工作,人類(lèi)怎么辦?

周五,奧特曼現(xiàn)身溫哥華TED大會(huì)現(xiàn)場(chǎng),與TED負(fù)責(zé)人Chris Anderson進(jìn)行了一場(chǎng)深入的對(duì)談。

對(duì)談一開(kāi)始,Anderson用最近爆火的Sora生圖功能生成了一張圖片,圖片中奧特曼正向他分享著驚人的信息。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

Anderson表示這圖畫(huà)的還不錯(cuò),至少是個(gè)B+。接著他又展示了一張圖片,這次他讓Sora描繪一下智能和意識(shí)的區(qū)別。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

這張圖真的讓Anderson感到震驚了,因?yàn)檫@顯然不只是圖像的生成,它似乎理解了你想要什么。

對(duì)此奧特曼表示,這個(gè)圖像生成的功能是GPT-4o的一部分,包含里面的所有智能。

「這也是為什么它能做出這些讓人驚嘆的事情?!?/p>

面對(duì)如此智能的AI,Anderson不禁問(wèn)奧特曼,「我的未來(lái)該怎么辦?」。

奧特曼說(shuō)人們對(duì)此有兩種看法。一種是「天啊,它把我做的事全干了,我該咋辦?」。

而另一種是「每次技術(shù)革命都這樣」,新的工具能提升人的能力,讓人做的更多。

「所以適應(yīng)起來(lái)應(yīng)該不難。」

這時(shí),Anderson突然冒出一句:「這會(huì)不會(huì)是個(gè)版權(quán)問(wèn)題???」

觀眾哄堂大笑,現(xiàn)場(chǎng)還夾雜著掌聲。看來(lái)大家都對(duì)這個(gè)問(wèn)題很感興趣。

奧特曼的回應(yīng)是,如果藝術(shù)家愿意把自己的風(fēng)格授權(quán)給別人用,那么可以為他們?cè)O(shè)計(jì)分成機(jī)制。

也就是說(shuō),未來(lái)不只是「版權(quán)」問(wèn)題這么簡(jiǎn)單了,「風(fēng)格」也將會(huì)成為重要的車(chē)資產(chǎn)。

不過(guò),真正棘手的,在海量的AI作品面前,要怎么區(qū)分「靈感借鑒」和「抄襲模仿」呢?

OpenAI將推最強(qiáng)開(kāi)源LLM

Anderson問(wèn)奧特曼,DeepSeek的出現(xiàn)有沒(méi)有讓你有點(diǎn)慌?

奧特曼認(rèn)為開(kāi)源很重要。就在昨晚,他們還在開(kāi)會(huì)討論開(kāi)源模型的參數(shù)和方向。

OpenAI正打算開(kāi)源一款非常強(qiáng)大的模型,性能比現(xiàn)在所有的開(kāi)源模型都要好。

奧特曼還強(qiáng)調(diào)了一下,雖然他們?cè)陂_(kāi)源方面行動(dòng)的有點(diǎn)晚,但他們會(huì)做的很好。

雖然DeepSeek勢(shì)頭迅猛,但并沒(méi)有影響ChatGPT的增長(zhǎng)速度。

「我從來(lái)沒(méi)見(jiàn)過(guò)任何一家公司有這種增長(zhǎng)速度。ChatGPT的增長(zhǎng)簡(jiǎn)直瘋狂!」奧特曼表示。

根據(jù)上次公布的數(shù)據(jù),OpenAI每周有5億的活躍用戶(hù),而且還在飛速增長(zhǎng)。

奧特曼還提到了新的「記憶」功能。模型會(huì)慢慢了解你,陪你走過(guò)人生的不同階段。

他希望OpenAI能繼續(xù)保持專(zhuān)注,做出這個(gè)領(lǐng)域里最頂尖的產(chǎn)品。

AI雙突破,2年研究半天搞定

奧特曼預(yù)計(jì)AI將在兩個(gè)方向上有重大的突破。

首先是在科學(xué)領(lǐng)域。

奧特曼說(shuō)他相信科學(xué)發(fā)現(xiàn)是讓人們生活越來(lái)越好的最重要推動(dòng)力。有了新發(fā)現(xiàn),我們就能用更少的資源做更多的事,把「可能」的邊界往外推。

OpenAI最新的模型已經(jīng)開(kāi)始讓科學(xué)家們興奮了,他們的效率比以前高得多。

借助AI工具,很快會(huì)開(kāi)始看到在對(duì)抗疾病方面的一些實(shí)質(zhì)性進(jìn)展。

至于物理學(xué),奧特曼說(shuō)可能需要更長(zhǎng)時(shí)間,但很期待。

另一個(gè)重要方向是軟件開(kāi)發(fā)。

奧特曼說(shuō)未來(lái)幾個(gè)月,這個(gè)領(lǐng)域就會(huì)發(fā)生翻天覆地的變化。

他說(shuō)一些工程師現(xiàn)在一個(gè)下午就能完成以前兩年才能做完的工作!

對(duì)于外界的一些傳聞,奧特曼說(shuō)他們并沒(méi)有偷偷藏著有意識(shí)的模型,以及能自我改進(jìn)的模型。

奧特曼還對(duì)他們模型的安全性很有信心。

「有人會(huì)說(shuō)各種事情,但現(xiàn)在全球大概有10%的人正在使用我們的系統(tǒng),我們對(duì)自己的安全記錄非常驕傲?!?/p>

他還透露,OpenAI已經(jīng)準(zhǔn)備好了一旦發(fā)現(xiàn)危險(xiǎn)就迅速叫停的機(jī)制。

這就是一個(gè)不斷試錯(cuò)的過(guò)程:把系統(tǒng)推向現(xiàn)實(shí)世界,在風(fēng)險(xiǎn)還相對(duì)可控的時(shí)候收集反饋,發(fā)現(xiàn)問(wèn)題,然后解決。

ChatGPT不是AGI

奧特曼說(shuō)ChatGPT還不能算是AGI,因?yàn)樗€不能自己持續(xù)學(xué)習(xí)、提升。

它也沒(méi)辦法在自己不擅長(zhǎng)的領(lǐng)域主動(dòng)變強(qiáng),自主地探索新科學(xué)、更新知識(shí)庫(kù)。

甚至還不能像人類(lèi)一樣坐在電腦前完成各種知識(shí)型工作。

對(duì)于到底什么是AGI這個(gè)問(wèn)題,奧特曼直接講了個(gè)笑話:「你把10個(gè)OpenAI的研究員關(guān)一個(gè)屋子里,讓他們定義AGI,估計(jì)能整出14個(gè)不同的答案?!?/p>

目前都沒(méi)有個(gè)統(tǒng)一的說(shuō)法。

所以比起「AGI啥時(shí)候來(lái)」,更重要的是認(rèn)識(shí)到我們正處在AI能力指數(shù)級(jí)增長(zhǎng)的曲線上。

你可以說(shuō)「這是我眼中的AGI」,別人可以說(shuō)「超級(jí)智能在那兒」,但不管咋樣,我們都得面對(duì)這個(gè)超級(jí)厲害的系統(tǒng)帶來(lái)的好處,同時(shí)想辦法讓它安全。

整場(chǎng)近一小時(shí)對(duì)談中,奧特曼其他的一些精彩觀點(diǎn):

  • 要盯緊AI智能體的安全問(wèn)題。

  • 奧特曼分享成為父親對(duì)他個(gè)人產(chǎn)生了深遠(yuǎn)的影響,他否認(rèn)了AI會(huì)對(duì)他的孩子未來(lái)構(gòu)成風(fēng)險(xiǎn),但也承認(rèn)有更大的責(zé)任去塑造一個(gè)對(duì)孩子有積極影響的世界。

  • 奧特曼還描述了一個(gè)未來(lái),AI將比他的孩子更聰明,但他認(rèn)為這是一個(gè)好事。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會(huì)無(wú)縫融入日常生活,未來(lái)一代人將會(huì)覺(jué)得當(dāng)前人們又辛苦又落后。

參考資料:

https://x.com/TheMattBerman/status/1910813233008509191

https://www.youtube.com/watch?v=5MWT_doo68k

https://x.com/FutureJurvetson/status/1910820537783423078