打開(kāi)網(wǎng)易新聞 查看精彩圖片

藍(lán)鯨新聞4月17日訊(記者 朱俊熹)當(dāng)?shù)貢r(shí)間4月16日,OpenAI發(fā)布最新的推理模型o3和o4-mini。OpenAI表示,這是其"迄今為止發(fā)布的最智能的模型",在智能性和實(shí)用性方面設(shè)定了全新標(biāo)準(zhǔn)。

據(jù)OpenAI介紹,o3是其最強(qiáng)大的

在o3開(kāi)發(fā)過(guò)程中,OpenAI稱發(fā)現(xiàn)大規(guī)模強(qiáng)化學(xué)習(xí)呈現(xiàn)出與GPT系列預(yù)訓(xùn)練相同的趨勢(shì),即"計(jì)算量越大,性能越好"。OpenAI在訓(xùn)練計(jì)算量和推理過(guò)程中的思考方面都提升了一個(gè)數(shù)量級(jí),看到了明顯的性能提升。通過(guò)強(qiáng)化學(xué)習(xí),OpenAI還訓(xùn)練兩個(gè)新模型使用工具。

最新的推理模型o3和o4-mini能夠組合使用ChatGPT中的所有工具,包括網(wǎng)頁(yè)搜索、圖像生成、使用Python分析數(shù)據(jù)等。在OpenAI提供的示例中,當(dāng)用戶詢問(wèn)電池技術(shù)的突破對(duì)電動(dòng)汽車的影響時(shí),o1模型在推理5秒后給出了文字、代碼片段為主的回復(fù),而o3模型經(jīng)過(guò)40秒的推理時(shí)間,多次使用搜索功能,除文字外還能直接生成圖像和圖表。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

圖片來(lái)源:OpenAI

相較于前代推理模型,新模型在

打開(kāi)網(wǎng)易新聞 查看精彩圖片

圖片來(lái)源:OpenAI

去年9月,OpenAI率先推出推理模型o1,引領(lǐng)了大模型范式的轉(zhuǎn)變。自那以來(lái),全球許多大模型廠商都發(fā)布了自己的推理模型,包括谷歌Gemini 2.5、Grok 3,以及國(guó)內(nèi)的DeepSeek-R1、通義千問(wèn)QwQ-32B等,對(duì)OpenAI形成了追趕。3月底,阿里通義也推出了視覺(jué)推理模型QVQ-Max,同樣主打能結(jié)合圖片、視頻信息進(jìn)行分析和推理。

激烈的競(jìng)爭(zhēng)讓OpenAI對(duì)新模型的發(fā)布更為迫切。據(jù)英國(guó)《金融時(shí)報(bào)》上周報(bào)道,OpenAI一直在推動(dòng)盡早發(fā)布o(jì)3模型,使得員工和第三方組織僅能在幾天時(shí)間內(nèi),對(duì)模型性能和風(fēng)險(xiǎn)進(jìn)行安全評(píng)估。而2023年發(fā)布的GPT-4模型,經(jīng)過(guò)了6個(gè)月的評(píng)估。OpenAI強(qiáng)調(diào),已對(duì)o3、o4-mini兩個(gè)模型進(jìn)行了至今最嚴(yán)格的安全壓力測(cè)試。

事實(shí)上,o3模型原本并不在OpenAI的預(yù)期路線圖中。2月中,OpenAI CEO Sam Altman曾在社交平臺(tái)X上表示,將不會(huì)單獨(dú)發(fā)布o(jì)3模型,而是會(huì)將o3的技術(shù)集成到下一代GPT-5模型中,預(yù)計(jì)在幾周或幾個(gè)月內(nèi)推出。Sam Altman曾多次抱怨,算力的限制導(dǎo)致公司不得不推遲新模型的發(fā)布。今年3月OpenAI完成400億美元的新融資后,他終于表示"不再受到計(jì)算限制"。

OpenAI稱,o3和o4-mini的發(fā)布反映了其模型的發(fā)展方向:將o系列的推理能力,與GPT系列的對(duì)話能力、工具使用能力相融合。"通過(guò)統(tǒng)一這些優(yōu)勢(shì),我們未來(lái)的模型將支持無(wú)縫、自然的對(duì)話,同時(shí)進(jìn)行主動(dòng)的工具使用和高級(jí)問(wèn)題解決。"