每經(jīng)記者:楊昕怡 每經(jīng)編輯:余婷婷
解讀上市公司財(cái)報(bào)、填報(bào)高考志愿、為大家庭推薦露營(yíng)裝備、拿著英文菜單給多人點(diǎn)餐——在4月17日的火山引擎AI創(chuàng)新巡展杭州站現(xiàn)場(chǎng),這些復(fù)雜的工作、生活問(wèn)題被搭載了最新深度思考模型的豆包一一解決。
發(fā)布會(huì)現(xiàn)場(chǎng),火山引擎總裁譚待介紹稱(chēng),豆包1.5·深度思考模型在數(shù)學(xué)、編程、科學(xué)推理等專(zhuān)業(yè)領(lǐng)域及創(chuàng)意寫(xiě)作等通用任務(wù)中表現(xiàn)突出,其中在數(shù)學(xué)推理AIME 2024測(cè)試得分追平了OpenAI o3-mini-high(模型名)。
如同OpenAI o系列最新模型o3和o4-mini(模型名)在多模態(tài)理解上的大力探索,豆包最新模型的多模態(tài)能力也在發(fā)布會(huì)現(xiàn)場(chǎng)被頻頻提及?!澳P鸵心芰ψ龊盟伎肌⒂?jì)劃和反思,并且一定要支持多模態(tài),就像人類(lèi)具備視覺(jué)和聽(tīng)覺(jué)一樣,Agent(智能體)才能更好地處理復(fù)雜任務(wù)?!弊T待表示。
從OpenAI首款全功能Agent Operator到“一碼難求”的Manus(智能體名),AI(人工智能) Agent正在成為2025年業(yè)內(nèi)的最大焦點(diǎn)。英諾天使基金合伙人王晟在今年年初接受《每日經(jīng)濟(jì)新聞》記者專(zhuān)訪時(shí)表示,“AI這一波新技術(shù)的最終應(yīng)用就是Agent,我們今年比較期待AI Agent能取得突破?!?/p>
火山引擎總裁 譚待 圖片來(lái)源:火山引擎公眾號(hào)
為了加速Agent的落地,火山引擎此次還推出了OS Agent解決方案及AI云原生推理套件?!俺掷m(xù)優(yōu)化模型,保持競(jìng)爭(zhēng)力;不斷降低成本、延遲,提高吞吐率;讓產(chǎn)品更易落地,(發(fā)布)像扣子、HiAgent平臺(tái)還有云原生組件OS Agent等——未來(lái)我們會(huì)在這三方面持續(xù)發(fā)力?!痹跁?huì)后的群訪中,譚待向《每日經(jīng)濟(jì)新聞》記者表示。
“多模態(tài)+深度推理”,豆包上線全新模型
對(duì)于一個(gè)新模型而言,其性能自然是外界關(guān)注的首要方面。發(fā)布會(huì)上,譚待介紹稱(chēng),豆包1.5·深度思考模型在數(shù)學(xué)推理AIME 2024測(cè)試的得分追平OpenAI o3-mini-high,編程競(jìng)賽和科學(xué)推理測(cè)試成績(jī)接近o1。同時(shí),在創(chuàng)意寫(xiě)作、人文知識(shí)問(wèn)答等非推理任務(wù)上,該模型也展現(xiàn)出了優(yōu)秀的泛化能力。
技術(shù)報(bào)告顯示,這一新模型采用MoE(專(zhuān)家混合模型)架構(gòu),總參數(shù)為200B,激活參數(shù)僅20B,低于業(yè)界同類(lèi)模型參數(shù)規(guī)模的50%,具備顯著的推理成本優(yōu)勢(shì)。并且,基于高效算法,該模型API服務(wù)能在保障高并發(fā)的同時(shí),實(shí)現(xiàn)20毫秒的極低延遲。
在具體的場(chǎng)景應(yīng)用上,豆包1.5·深度思考模型主要突出了自身具備的邊想邊搜能力和視覺(jué)版的多模態(tài)能力。
“計(jì)劃從北京出發(fā),去日本關(guān)西地區(qū)進(jìn)行為期5天的旅游,希望能看到花火大會(huì)、泡到特色溫泉,請(qǐng)幫我規(guī)劃一下行程?!薄睹咳战?jīng)濟(jì)新聞》記者以上述提示詞實(shí)測(cè)發(fā)現(xiàn),豆包在思考過(guò)程中能自主拆解問(wèn)題,就花火大會(huì)日期、溫泉旅館的預(yù)訂情況和交通券的適用范圍等信息確認(rèn)進(jìn)行了多輪搜索。
“除了邊搜邊想,豆包深度思考模型還具備視覺(jué)推理能力,讓模型像人類(lèi)一樣,不光基于文字思考,更能基于所見(jiàn)畫(huà)面來(lái)思考,更加全面?!弊T待在發(fā)布會(huì)上舉例表示,“豆包深度思考模型可以看懂非常復(fù)雜的企業(yè)項(xiàng)目管理流程圖表,能快速定位到關(guān)鍵信息,并以強(qiáng)大的指令遵循能力,嚴(yán)格按照流程圖,回答客戶的問(wèn)題?!?/p>
北京市社會(huì)科學(xué)院副研究員王鵬接受《每日經(jīng)濟(jì)新聞》記者微信采訪時(shí)表示,具備多模態(tài)能力是未來(lái)推理模型的趨勢(shì),“多模態(tài)能力使模型更全面理解和處理復(fù)雜信息,能廣泛應(yīng)用于金融、智能客服和醫(yī)療等領(lǐng)域。”
截至目前,豆包大模型家族已有15位“成員”,豆包App也成為了國(guó)內(nèi)AI原生App的頭部玩家。據(jù)QuestMobile在4月15日發(fā)布的數(shù)據(jù)顯示,截至2025年2月底,我國(guó)AI原生App用戶規(guī)模達(dá)2.4億,較1月份增長(zhǎng)了1.15億。2025年3月,豆包的月活用戶規(guī)模達(dá)1.16億,僅次于DeepSeek的1.94億。
“Agent是必經(jīng)之路”,火山引擎如何助力?
發(fā)布會(huì)上,譚待還照例公布了豆包大模型的最新使用量:截至2025年3月,豆包大模型日均tokens(詞元)使用量超12.7萬(wàn)億,較發(fā)布之初增長(zhǎng)超106倍。
與此同時(shí),國(guó)際數(shù)據(jù)公司IDC在今年4月發(fā)布的《中國(guó)公有云大模型服務(wù)市場(chǎng)格局分析,1Q25》(注:1Q25指2025年第一季度)顯示,2024年我國(guó)公有云上大模型調(diào)用量達(dá)114.2萬(wàn)億tokens,其中火山引擎以46.4%的市場(chǎng)份額位居第一。
對(duì)于超百倍的增長(zhǎng),譚待向《每日經(jīng)濟(jì)新聞》記者表示,從長(zhǎng)期來(lái)看,火山引擎的大模型token調(diào)用量在未來(lái)仍有百倍甚至更高增長(zhǎng)的可能,“具體需要多久時(shí)間,關(guān)鍵取決于模型是否有重大突破?!?/p>
“去年到今年增長(zhǎng)很快是因?yàn)槟P陀袔状笸黄疲阂皇腔A(chǔ)聊天和信息處理能力的提升及成本下降,二是今年深度思考功能的推出?!弊T待認(rèn)為,之后大模型的迭代還將迎來(lái)多個(gè)關(guān)鍵節(jié)點(diǎn),“例如視覺(jué)推理能否做得更好、Agent相關(guān)技術(shù)能否取得更大進(jìn)展等?!?/p>
在譚待看來(lái),要讓AI真正為各行各業(yè)帶來(lái)變革,Agent是必經(jīng)之路,“關(guān)于Agent的定義,能完成打油詩(shī)、簡(jiǎn)單報(bào)告等任務(wù)的不能稱(chēng)為Agent。從定性角度來(lái)看,Agent應(yīng)該要能完成專(zhuān)業(yè)度較高、耗時(shí)較長(zhǎng)的完整任務(wù);從技術(shù)實(shí)現(xiàn)角度來(lái)看,如果沒(méi)有運(yùn)用思考模型,缺乏反思和規(guī)劃能力,也很難被認(rèn)定為Agent?!?/p>
為了加速Agent的落地,此次發(fā)布會(huì)上,火山引擎宣布了OS Agent解決方案的推出,包含了豆包UI-TARS模型,以及veFaaS函數(shù)服務(wù)、云服務(wù)器、云手機(jī)等產(chǎn)品。
記者注意到,4月17日,豆包大模型團(tuán)隊(duì)發(fā)布并開(kāi)源了基于UI-TARS進(jìn)行增強(qiáng)的UI-TARS-1.5,目前已在7個(gè)典型的GUI(圖形用戶界面)評(píng)測(cè)基準(zhǔn)中取得SOTA(最先進(jìn)的)表現(xiàn),還首次展現(xiàn)了其在游戲中的長(zhǎng)時(shí)推理能力和在開(kāi)放空間中的交互能力。
近期,Claude母公司Anthropic推出的MCP(模型上下文協(xié)議)成為了國(guó)內(nèi)外頭部廠商的一大關(guān)注點(diǎn),阿里云、騰訊云等云廠商紛紛上線MCP服務(wù)。群訪中,譚待表示,火山引擎已經(jīng)支持MCP,“我覺(jué)得協(xié)議統(tǒng)一很重要”,“如果能做到統(tǒng)一協(xié)議,大家的應(yīng)用開(kāi)發(fā)就會(huì)更快,模型調(diào)用也會(huì)更智能?!?/p>
“我們一直致力于成為AI時(shí)代最優(yōu)秀的云廠商?!弊T待表示,“只要保持產(chǎn)品和技術(shù)領(lǐng)先,市場(chǎng)份額自然會(huì)領(lǐng)先。”
熱門(mén)跟貼