4月15日凌晨,OpenAI的新系列模型GPT-4.1如約而至。該系列包含了三個(gè)模型,分別是GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。其中,GPT-4.1 nano被OpenAI稱(chēng)作其迄今“最快、最便宜”的模型。
據(jù)OpenAI介紹,GPT-4.1模型系列上下文窗口均達(dá)到100萬(wàn)個(gè)token,且整體性能表現(xiàn)要優(yōu)于GPT-4o和GPT-4o mini,尤其在編碼任務(wù)上表現(xiàn)突出。

圖片來(lái)源:OpenAI官網(wǎng)
與此同時(shí),OpenAI宣布將在三個(gè)月后在A(yíng)PI中淘汰GPT-4.5。究其原因,一方面是成本太高,另一方面,競(jìng)爭(zhēng)環(huán)境,特別是開(kāi)源模型的進(jìn)步,也被認(rèn)為是一大關(guān)鍵因素。
GPT-4.1系列發(fā)布,編程能力全面超越GPT-4o
據(jù)OpenAI介紹,此次推出的GPT-4.1模型系列包括三個(gè)版本,分別為GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano,且每個(gè)版本均針對(duì)不同的使用場(chǎng)景進(jìn)行了優(yōu)化。
GPT-4.1模型系列在各方面都優(yōu)于GPT-4o和GPT-4o mini,特別是在編程和指令遵循方面,取得了重大進(jìn)展。此外,GPT-4.1模型系列具有更長(zhǎng)的上下文窗口,支持高達(dá)100萬(wàn)token的上下文,并且能夠更為有效地提取關(guān)鍵信息,知識(shí)截止日期更新至2024年6月。

圖片來(lái)源:OpenAI直播截圖
其中,GPT-4.1在編程、指令遵循和長(zhǎng)上下文理解方面表現(xiàn)出色。在代碼能力基準(zhǔn)測(cè)試SWE-bench Verified中,GPT-4.1得分為54.6%,而GPT-4o得分約為33%。
OpenAI首席財(cái)務(wù)官薩拉?弗里亞爾(Sarah Friar)上個(gè)月在倫敦的一場(chǎng)科技峰會(huì)上表示,OpenAI的目標(biāo)是打造一個(gè)“智能軟件工程師”。

圖片來(lái)源:OpenAI官網(wǎng)
GPT-4.1 mini和GPT-4.1 nano則是兩款輕量模型,兼顧低成本與高性能。GPT-4.1 mini的智能水平與GPT-4o相當(dāng),甚至優(yōu)于GPT-4o,但成本降低了83%,延遲也幾乎減半。
而GPT-4.1 nano是該系列中速度最快、成本最低的模型,適用于低延遲任務(wù)。在維持出色性能的同時(shí),顯著提升了運(yùn)行效率。在A(yíng)ider多語(yǔ)言編碼測(cè)試中,GPT-4.1 nano得分為9.8%,甚至高于GPT-4o mini。

模型智能水平與延遲的關(guān)系 圖片來(lái)源:OpenAI官網(wǎng)
值得注意的是,目前,GPT-4.1系列僅通過(guò)OpenAI API提供給開(kāi)發(fā)者使用,尚未在ChatGPT中向普通用戶(hù)開(kāi)放。
發(fā)布不到2個(gè)月,GPT-4.5即將被淘汰
在發(fā)布GPT-4.1系列模型的同時(shí),OpenAI還宣布將在三個(gè)月后在A(yíng)PI中淘汰GPT-4.5,開(kāi)發(fā)者可繼續(xù)使用至7月14日。
淘汰的其中一大原因是成本太高。
今年2月28日以研究預(yù)覽版發(fā)布的GPT-4.5的API定價(jià)高達(dá)每百萬(wàn)token輸入75美元、每百萬(wàn)token輸出150美元。如此高昂的價(jià)格,使得很多企業(yè)和開(kāi)發(fā)者望而卻步。
而新發(fā)布的GPT-4.1系列在價(jià)格上就要“溫柔”很多。
相較GPT-4o,GPT-4.1在處理普通查詢(xún)時(shí),價(jià)格降低了26%,輸入、輸出分別是每百萬(wàn)token 2美元和8美元。而GPT-4.1 nano是OpenAI迄今為止,價(jià)格最便宜且速度最快的模型,輸入、輸出分別為每百萬(wàn)token 0.1美元和0.4美元。
而且,對(duì)于重復(fù)使用相同上下文查詢(xún)的場(chǎng)景,OpenAI將新模型的提示緩存折扣從先前的50%提升至75%。而對(duì)于長(zhǎng)上下文請(qǐng)求,OpenAI僅按照標(biāo)準(zhǔn)的每token費(fèi)用計(jì)費(fèi),不再額外增收費(fèi)用。

圖片來(lái)源:OpenAI官網(wǎng)
事實(shí)上,GPT-4.5在剛發(fā)布不久,就曾因?yàn)椴桓叩男詢(xún)r(jià)比引發(fā)相當(dāng)大的爭(zhēng)議。
在某些特定測(cè)試中,GPT-4.5甚至表現(xiàn)得不如更便宜的GPT-4o,尤其是在邏輯推理和指令遵循等方面,但是其輸入價(jià)格卻比GPT-4o高出近30倍。
Vizuara AI聯(lián)合創(chuàng)始人拉杰·阿比吉特·丹德卡爾(Raj Abhijit Dandekar)在測(cè)試完GPT-4.5后直呼“非常失望”。他指出,從性能提升幅度來(lái)衡量,GPT-4.5當(dāng)前的定價(jià)明顯不合理。
丹德卡爾進(jìn)一步補(bǔ)充道,當(dāng)整個(gè)行業(yè)向高性能、低成本的開(kāi)源大模型(如DeepSeek)方向發(fā)展時(shí),OpenAI似乎卻在反其道而行之。
海外科技媒體Wire也對(duì)GPT-4.5提出了批評(píng),指出“它(GPT-4.5)非常昂貴,然而其帶來(lái)的僅僅是資深A(yù)I用戶(hù)或許才會(huì)注意到的邊際收益,這與OpenAI早期的模型大相徑庭?!?/p>
Futurism網(wǎng)站也毫不留情地指出,GPT-4.5被過(guò)度炒作了,它嚴(yán)重缺乏能讓ChatGPT成為“現(xiàn)象級(jí)”產(chǎn)品并取得商業(yè)成功的要素。
OpenAI方面也承認(rèn),運(yùn)行GPT-4.5的成本極高。早在2月,OpenAI就表示,公司正在評(píng)估是否通過(guò)API長(zhǎng)期提供GPT-4.5服務(wù),也為此次宣布淘汰GPT-4.5埋下了伏筆。
競(jìng)爭(zhēng)環(huán)境,特別是開(kāi)源模型的進(jìn)步,也被認(rèn)為是促成GPT-4.5淘汰的關(guān)鍵因素之一。
Meta首席人工智能科學(xué)家楊立昆(Yann LeCun)此前直言,“開(kāi)源模型正在超越閉源模型”。
上個(gè)月,Meta就表示其Llama開(kāi)源模型的下載量已經(jīng)超過(guò)10億次。
當(dāng)下,開(kāi)源社區(qū)所釋放出的強(qiáng)大競(jìng)爭(zhēng)壓力,很可能促使OpenAI不斷評(píng)估其閉源模型的成本效益和性能。事實(shí)上,OpenAI首席執(zhí)行官山姆·奧爾特曼在幾天前接受TED采訪(fǎng)時(shí)坦言,“開(kāi)源(在人工智能領(lǐng)域)有著重要地位,而OpenAI在這方面行動(dòng)得有點(diǎn)晚了。”
GPT-4.5價(jià)格高昂,外界批評(píng)聲不斷。相對(duì)于成本更低且性能日益強(qiáng)大的開(kāi)源模型,GPT-4.5在競(jìng)爭(zhēng)中處于明顯劣勢(shì)。開(kāi)發(fā)者往往會(huì)傾向于選擇開(kāi)源方案,而不愿為GPT-4.5這類(lèi)閉源模型支付高額溢價(jià)。
熱門(mén)跟貼