“去年12月,豆包大模型的日均tokens調(diào)用量是4萬億。而截至今年3月底,這個數(shù)字已經(jīng)超過12.7萬億,相比豆包大模型剛發(fā)布時,在短短不到一年里,實現(xiàn)了超過106倍的高速增長。這不僅是豆包大模型的速度,也代表了行業(yè)的發(fā)展速度,大模型正在飛速走進工作與生活?!?025年4月17日,在杭州舉辦的火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待表示。

打開網(wǎng)易新聞 查看精彩圖片

圖丨譚待(來源:資料圖)

面向企業(yè)市場發(fā)布豆包1.5·深度思考模型,邊想邊搜和視覺推理能力出色

面向企業(yè)市場發(fā)布豆包1.5·深度思考模型,邊想邊搜和視覺推理能力出色

借助視頻演示,火山引擎在會上展現(xiàn)了豆包1.5·深度思考模型,在推理、思考、多模態(tài)等場景的應(yīng)用??梢钥闯?,該模型具備效果好、低延遲和多模態(tài)三大優(yōu)勢。首先,在專業(yè)領(lǐng)域推理任務(wù)中表現(xiàn)出色,包括數(shù)學(xué)推理、編程競賽等。在創(chuàng)意寫作等非推理任務(wù)中泛化能力優(yōu)秀,能勝任廣泛和復(fù)雜的使用場景。其次,采用混合專家架構(gòu),總參數(shù)為200B,激活參數(shù)為20B,具備訓(xùn)練和推理成本優(yōu)勢。另外,可以被用于各類場景,如解讀上市公司財報、進行高考志愿填報等。

打開網(wǎng)易新聞 查看精彩圖片

(來源:資料圖)

同時,豆包1.5·深度思考模型也具備邊想邊搜的能力。這項能力的開發(fā)靈感來源于,生活中人類思考問題經(jīng)常要借助互聯(lián)網(wǎng),并且可能出現(xiàn)交替多輪的“想一想”和“搜一搜”。比如,如果讓該模型完成購物推薦任務(wù),它會先拆解里面涉及到的預(yù)算、天氣、便攜性等多種注意事項,然后通過多輪搜索獲得完整信息,再基于此給出周全答案。

該模型還上線了多模態(tài)版,具備視覺推理能力,能像人類一樣對看到的事物進行聯(lián)想和思考,極大地拓展了智能推理的應(yīng)用邊界。就拿出國旅游時會面臨的國外點餐任務(wù)來說,大模型只會翻譯菜單還不夠,還需要能直接點菜。而該模型既可以看懂外文菜單,還能兌換貨幣控制預(yù)算,周全考慮老人孩子喜好,幫助用戶圓滿地完成國外點餐。

升級文生圖模型3.0和視覺理解模型,加速企業(yè)打造更有趣的商業(yè)應(yīng)用

升級文生圖模型3.0和視覺理解模型,加速企業(yè)打造更有趣的商業(yè)應(yīng)用

會上,豆包大模型家族還帶來了兩大模型的更新。

首先,推出文生圖模型3.0版本,能實現(xiàn)更好的文字排版表現(xiàn)、實拍級的圖像生成效果,以及2K的高清圖片生成方式。例如,在中文小字和長文本的生成上,不僅較好地解決了小字和長文本的生成難題,還大幅提升了圖片排版的美感。在人像生成上,對于皮膚質(zhì)感、表情走向等細(xì)節(jié)的生成,大幅接近真人表現(xiàn)。

其次,升級視覺理解模型,這主要體現(xiàn)在視覺定位更精準(zhǔn),和對視頻的理解更智能這兩大方面。對于前者,不僅支持多目標(biāo)、小目標(biāo)、通用目標(biāo)的框定位和點定位,還支持定位計數(shù)、描述定位內(nèi)容等,進一步擴展了模型的應(yīng)用場景。對于后者,則在記憶、總結(jié)理解、速度感知、長視頻理解等能力上實現(xiàn)大幅提升,便于企業(yè)打造更有趣的商業(yè)化應(yīng)用。

推出OS Agent解決方案及AI云原生推理套件,讓開發(fā)者無障礙落地Agent

推出OS Agent解決方案及AI云原生推理套件,讓開發(fā)者無障礙落地Agent

火山引擎也推出OS Agent解決方案,助力開發(fā)者構(gòu)建專屬的通用Agent。同時,發(fā)布AI云原生ServingKit推理套件,幫助模型部署更快、推理成本更低。根據(jù)IDC發(fā)布的《中國公有云大模型服務(wù)市場格局分析,1Q25》,火山引擎以46.4%的市場份額位居第一。憑借高性價比、靈活易用的工具鏈,以及覆蓋全場景的解決方案,其成為企業(yè)落地大模型的首選平臺。

打開網(wǎng)易新聞 查看精彩圖片

(來源:資料圖)

今年在很多人眼中是Agent元年,但什么才是真正的Agent?譚待認(rèn)為:“能完成打油詩、簡單報告等任務(wù)的,不能稱之為Agent。Agent應(yīng)能完成專業(yè)度較高、耗時較長的完整任務(wù),這是從定性角度來看。從技術(shù)實現(xiàn)角度,如果沒有運用思考模型,缺乏反思和規(guī)劃能力,也很難被認(rèn)定為Agent。”所以,從技術(shù)層面出發(fā),要想做好Agent,既需要有性能更強大的多模態(tài)模型,又要有更好的架構(gòu)和工具,支持大模型操作數(shù)字和物理世界,還要通過AI云原生,不斷降低模型推理的成本和延遲。

而在實際應(yīng)用中,Agent也存在“應(yīng)用Agent”和“OS Agent”兩個方向。前者具備更強的專業(yè)性,專注于完成特定領(lǐng)域的任務(wù);后者擁有跨場景的通用性和靈活性,能夠完成復(fù)雜任務(wù)。

值得一提的是,在應(yīng)用Agent領(lǐng)域,字節(jié)跳動于前不久發(fā)布AI原生編程工具Trae。相較于傳統(tǒng)的AI插件產(chǎn)品,Trae具備交付化、智能化和協(xié)作化三大特質(zhì),可提供更加智能的開發(fā)體驗。

企業(yè)完成AI轉(zhuǎn)型,豆包大模型發(fā)揮的作用很關(guān)鍵

企業(yè)完成AI轉(zhuǎn)型,豆包大模型發(fā)揮的作用很關(guān)鍵

據(jù)了解,目前已有越來越多的企業(yè),選擇豆包大模型作為自身AI轉(zhuǎn)型的關(guān)鍵。

例如:

金山辦公基于豆包大模型打造了一款A(yù)I智能助手靈犀,用于幫助用戶在文檔智能處理、信息檢索等方面提升效率。

奔馳汽車將豆包大模型作為其智能座艙的核心,并升級了座艙信息檢索能力,讓系統(tǒng)反應(yīng)速度和研發(fā)效率得到顯著提升。據(jù)了解,除奔馳以外,近八成的主流汽車都選擇了豆包作為汽車AI升級的重要伙伴。

浙江大學(xué)基于火山引擎HiAgent平臺和豆包大模型,用一周時間落地“浙大先生”智能體平臺,支持AI科學(xué)家、課堂問答等眾多場景的智能體定制開發(fā),并已服務(wù)5萬多名在校師生。據(jù)譚待介紹,目前C9高校中,已有六所選擇了火山引擎。

杭州銀行聯(lián)合火山引擎打造了業(yè)界首個電商產(chǎn)業(yè)生態(tài)云“百業(yè)云”,能通過豆包大模型為中小商家提供智能客服服務(wù),不僅大幅提升了客服回答的準(zhǔn)確率,還支持全天候不間斷的專業(yè)服務(wù)。

大模型迅猛發(fā)展之際,云廠商的發(fā)展之路將在何方?

大模型迅猛發(fā)展之際,云廠商的發(fā)展之路將在何方?

在大模型迅猛發(fā)展的同時,企業(yè)對于云服務(wù)提供算力的要求也不免發(fā)生轉(zhuǎn)變。云廠商不但要提供更好的模型、更低的成本,也要提供AI應(yīng)用落地時所需的解決方案,還要在強化學(xué)習(xí)框架、安全保障及底層數(shù)據(jù)處理上進一步發(fā)展?;诖?,譚待表示,火山引擎未來計劃圍繞AI云原生,在存儲、計算、數(shù)據(jù)、安全和等方面推出一系列產(chǎn)品。

目前,依托于火山平臺,火山引擎不僅發(fā)展起諸多內(nèi)部業(yè)務(wù),還積極地對外提供支持。這背后體現(xiàn)了怎樣的邏輯?“從成立之初,我們就堅持技術(shù)內(nèi)外統(tǒng)一,這樣既能保障對內(nèi)服務(wù),也能做好對外支持。通過技術(shù)和資源復(fù)用,我們能為內(nèi)外客戶提供性價比更高的服務(wù),像我們的模型即服務(wù)和云服務(wù),性價比優(yōu)勢就源于此。而且實現(xiàn)統(tǒng)一后,無需糾結(jié)資源分配偏向內(nèi)部還是外部,因為技術(shù)需求基本一致?!弊T待說。

打開網(wǎng)易新聞 查看精彩圖片

(來源:資料圖)

事實上,在豆包大模型深入發(fā)展之際,DeepSeek大模型也在緊鑼密鼓地布局中。令人好奇的是,面對這個強勁的開源競爭對手,火山引擎在豆包大模型閉源策略和商業(yè)化上又是如何考慮的?在譚待看來,模型開源或閉源不是關(guān)鍵,模型的優(yōu)劣才是關(guān)鍵?!叭舭旬?dāng)前的AI發(fā)展看作一場馬拉松,可能現(xiàn)在才跑了500米。大家在競爭中相互推動,無論是技術(shù)還是行業(yè)應(yīng)用都能快速發(fā)展,這本身是一件非常好的事情。而且這種競爭的關(guān)鍵在于能否把模型做好,與開源和閉源關(guān)系不大?!彼f。

另外,他也表示,火山引擎作為云服務(wù)廠商秉持開放理念,只要客戶有需求,火山引擎就會去接入。比如,去年已接入Mistral、智譜GLM、月之暗面Kimi等模型,讓客戶自由選擇。“目前雖然沒有公開數(shù)據(jù),但據(jù)我了解,市面上第三方使用DeepSeek時,選擇火山引擎的最多?!彼f。

另據(jù)悉,接下來火山引擎還將在深圳和上海等地舉辦AI創(chuàng)新巡展。