【太平洋科技快訊】近日,谷歌發(fā)布了其新一代AI模型——Gemini 2.5系列。該系列包括Gemini 2.5 Pro和Gemini 2.5 Flash兩款模型,分別在多模態(tài)理解、推理能力、高效能與成本優(yōu)化等方面展現(xiàn)了顯著的優(yōu)勢和特性。

打開網(wǎng)易新聞 查看精彩圖片

短短三個月內(nèi),谷歌發(fā)布了多個大型AI模型,此次發(fā)布的Gemini 2.5系列模型不僅在推理、編碼、數(shù)學(xué)和多模態(tài)理解等方面展現(xiàn)了強大的能力,同時也在高效能和成本優(yōu)化方面做出了重要突破。未來,谷歌計劃將Gemini模型(包括2.5 Flash)引入本地環(huán)境,從第三季度開始實施。

Gemini 2.5 Pro:

Gemini 2.5 Pro被定位為“思考型模型”,能夠在回答問題前進(jìn)行思考分析,從而提供更準(zhǔn)確、更深入的回答。這種推理能力使其在數(shù)學(xué)和編碼任務(wù)上取得了新的突破,在LMArena排行榜上位居第一。此外,Gemini 2.5 Pro實驗版具備強大的多模態(tài)理解能力,能夠處理來自文本、音頻、圖像、視頻和大型數(shù)據(jù)集的輸入,甚至能夠理解整個代碼倉庫的結(jié)構(gòu)和內(nèi)容。

值得一提的是,Gemini 2.5 Pro目前提供100萬token的上下文窗口,并計劃很快擴展到200萬token,使其能夠處理和理解更長、更復(fù)雜的內(nèi)容。該模型已在Google AI Studio和Gemini應(yīng)用程序中向高級用戶提供,并計劃登陸Vertex AI平臺。

Gemini 2.5 Flash:

與Gemini 2.5 Pro不同,Gemini 2.5 Flash主打高效能與成本優(yōu)化。該模型具備“動態(tài)且可控”的計算特性,允許開發(fā)者根據(jù)查詢請求的復(fù)雜程度靈活調(diào)整處理時間。

作為一款“推理”模型,Gemini 2.5 Flash與OpenAI的o3-mini和DeepSeek的R1類似,在回答問題時會花費更多時間進(jìn)行事實核查,以確保答案準(zhǔn)確性。這種特性使其非常適合用于高容量和實時應(yīng)用場景,如客戶服務(wù)和文檔解析。

谷歌表示,Gemini 2.5 Flash特別針對低延遲和降低成本進(jìn)行了優(yōu)化,是響應(yīng)式虛擬助手和實時總結(jié)工具的理想選擇。該模型即將登陸谷歌的AI開發(fā)平臺Vertex AI,預(yù)計將為開發(fā)者提供更靈活且經(jīng)濟的選擇。