今天,谷歌通過 Gemini API,在 Google AI Studio 和 Vertex AI 預(yù)覽中上線了 Gemini 2.5 Flash 早期版本。
Gemini 2.5 Flash 是谷歌首個(gè)完全混合式推理模型,用戶可以根據(jù)需求選擇是否開啟“思考”功能。該模型還支持開發(fā)者設(shè)置“思考預(yù)算”,用戶可以精細(xì)控制模型在思考階段最多可生成的 token 數(shù)量,找到質(zhì)量、成本與延遲之間的最佳平衡。
Gemini 2.5 Flash 的輸入費(fèi)用是 0.15 美元/百萬token,而輸出費(fèi)用則根據(jù)是否啟用推理差異顯著:
· 關(guān)閉推理時(shí),0.60 美元/百萬 token;
· 啟用推理時(shí),上升至3.50 美元/百萬token。
推理輸出的近六倍價(jià)格差異反映了“思考”過程的計(jì)算強(qiáng)度,其中模型在生成響應(yīng)之前會(huì)評(píng)估多種潛在路徑和考慮因素。
而“思考預(yù)算”可以在 0 到 24,576 個(gè) token 之間調(diào)整,其作用是設(shè)置上限,而非固定分配。模型會(huì)根據(jù)任務(wù)復(fù)雜程度智能決定使用多少預(yù)算。
谷歌稱Gemini 2.5 Flash 在多項(xiàng)關(guān)鍵基準(zhǔn)測試中表現(xiàn)出色。在被稱為“人類最后的考試”測試中,2.5 Flash 取得了 12.1% 的成績,超過了 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),但略低于 OpenAI 最新發(fā)布的 o4-mini(14.3%)。
業(yè)內(nèi)人士指出,測試結(jié)果表明谷歌正在縮小與競爭對手的性能差距,同時(shí)保持價(jià)格優(yōu)勢。這對關(guān)注 AI 預(yù)算的企業(yè)客戶而言,可能極具吸引力。
“Gemini Flash的炒作最少,但根據(jù)我的生產(chǎn)經(jīng)驗(yàn),它具有最佳的性價(jià)比和多模態(tài)工具。谷歌正在默默地贏得人工智能競賽。”有網(wǎng)友稱。
有網(wǎng)友還內(nèi)涵了下OpenAI:“谷歌在其 Flash 2.5 的對比中加入了 o4-mini,真是太棒了。這款型號(hào)昨天才發(fā)布,而有些公司只跟自家的型號(hào)比較。Gemini真不錯(cuò)。”
還有網(wǎng)友道,“就我的體驗(yàn),Gemini 2.5 Pro 進(jìn)步非常顯著,以至于我現(xiàn)在都對谷歌有了改觀。它不僅比我聰明,還不會(huì)一味地迎合我。它會(huì)在適當(dāng)?shù)臅r(shí)候反駁我,而非刻意扭曲自己來迎合我?!?/p>
熱門跟貼