4月17日,火山引擎面向企業(yè)市場(chǎng)發(fā)布豆包1.5?深度思考模型,同步升級(jí)文生圖模型 3.0、視覺(jué)理解模型,并推出 OS Agent 解決方案及AI云原生推理套件,幫助企業(yè)更快、更省地構(gòu)建和部署Agent應(yīng)用。
據(jù)火山引擎披露,截至 2025 年 3 月底,豆包大模型日均 tokens 調(diào)用量已達(dá)到12.7萬(wàn)億,較去年5月發(fā)布時(shí)增長(zhǎng)上百倍。火山引擎總裁譚待表示,Agent智能體應(yīng)用發(fā)展將帶動(dòng)大模型進(jìn)一步普及。譚待說(shuō):“深度思考模型是構(gòu)建Agent的基礎(chǔ),模型要有能力做好思考、計(jì)劃和反思,并且一定要支持多模態(tài),就像人類具備視覺(jué)和聽(tīng)覺(jué)一樣,Agent才能更好地處理復(fù)雜任務(wù)。”

豆包深度思考模型開(kāi)放API,具備視覺(jué)推理能力
據(jù)譚待介紹,豆包1.5?深度思考模型在專業(yè)領(lǐng)域的推理任務(wù)中表現(xiàn)出色,數(shù)學(xué)推理AIME 2024 測(cè)試得分追平OpenAI o3-mini-high,編程競(jìng)賽和科學(xué)推理測(cè)試成績(jī)也接近o1。在創(chuàng)意寫(xiě)作、人文知識(shí)問(wèn)答等通用任務(wù)上,模型也展示出優(yōu)秀的泛化能力,能勝任更廣泛的使用場(chǎng)景。
技術(shù)報(bào)告顯示,豆包深度思考模型采用MoE架構(gòu),總參數(shù)為200B,激活參數(shù)僅20B,以較小參數(shù)實(shí)現(xiàn)媲美頂尖模型的效果?;诟咝?a class="keyword-search" >算法和高性能推理系統(tǒng),豆包模型API服務(wù)在保障高并發(fā)的同時(shí),延遲低至20毫秒。
豆包深度思考模型還具備視覺(jué)推理能力,能像人類一樣對(duì)看到的事物進(jìn)行聯(lián)想和思考,極大拓展了智能推理的應(yīng)用邊界。譚待舉例說(shuō)明,“模型可以看懂復(fù)雜的企業(yè)項(xiàng)目管理流程圖表,快速定位到關(guān)鍵信息,并以強(qiáng)大的指令遵循能力,嚴(yán)格按照流程圖,回答客戶的問(wèn)題;分析航拍圖時(shí),能結(jié)合地貌特征判斷區(qū)域開(kāi)發(fā)可行性。有多模態(tài)能力的加持,豆包深度思考模型可以助力企業(yè)在更多場(chǎng)景實(shí)現(xiàn)智能化升級(jí)?!?/p>
此外,豆包文生圖模型Seedream3.0也正式向企業(yè)開(kāi)放。該模型已在即夢(mèng)AI、豆包產(chǎn)品上線,并在近期登上權(quán)威競(jìng)技場(chǎng)Artificial Analysis文生圖榜單第一梯隊(duì)。Seedream3.0支持2K分辨率直出,生圖結(jié)構(gòu)準(zhǔn)確性、小字生成與排版、美感、真實(shí)度等方面具有優(yōu)勢(shì)。
火山引擎為Agent裝上“助推器”
2025年被業(yè)界視為“Agent智能體元年”。譚待認(rèn)為,在多模態(tài)深度思考模型的基礎(chǔ)上,Agent需要良好的架構(gòu)和工具,去操作數(shù)字世界和物理世界。同時(shí),模型的推理成本和延遲要持續(xù)降低,才能推動(dòng)應(yīng)用普惠。
為此,火山引擎宣布推出OS Agent解決方案,并演示了由Agent操作瀏覽器,搜索商品頁(yè),實(shí)現(xiàn)iPhone比價(jià)的任務(wù),甚至由Agent在遠(yuǎn)程計(jì)算機(jī)上用剪映進(jìn)行視頻編輯、配樂(lè)。
據(jù)悉,OS Agent解決方案包含豆包UI-TARS模型,以及veFaaS函數(shù)服務(wù)、云服務(wù)器、云手機(jī)等產(chǎn)品,實(shí)現(xiàn)對(duì)代碼、瀏覽器、電腦、手機(jī)以及其他Agent的操作。其中,豆包UI-TARS模型將屏幕視覺(jué)理解、邏輯推理、界面元素定位和操作整合在一起,突破傳統(tǒng)自動(dòng)化工具依賴預(yù)設(shè)規(guī)則的局限性,為Agent的智能交互提供了更接近人類操作的模型基礎(chǔ)。
好的模型和工具能夠加速Agent的落地,但Agent也會(huì)帶來(lái)更大量的模型推理消耗。面對(duì)大規(guī)模推理需求,火山引擎專門(mén)打造了AI云原生ServingKit 推理套件,讓模型部署更快、推理成本更低,GPU 消耗相比傳統(tǒng)方案降低80%。
IDC發(fā)布的《中國(guó)公有云大模型服務(wù)市場(chǎng)格局分析,1Q25》顯示,火山引擎以46.4%的市場(chǎng)份額位居第一。憑借高性價(jià)比、靈活易用的工具鏈,以及覆蓋全場(chǎng)景的解決方案,火山引擎成為企業(yè)落地大模型的首選平臺(tái)。
熱門(mén)跟貼