
摘要:盡管研發(fā)模型是當前最緊要的任務,但鳳凰網(wǎng)科技從豆包內(nèi)部人士處了解到,內(nèi)部對應用層的投入同樣巨大,“拿的資源不比模型層少”。
鳳凰網(wǎng)科技 出品
作者|徐珍
編輯|董雨晴
豆包的思考模型終于正式揭開面紗。
4月17日,火山引擎總裁譚待現(xiàn)身杭州,分享近四個月以來字節(jié)豆包大模型的研發(fā)進展。
其中最值得關(guān)注的,是思考模型Doubao-1.5-thinking-pro的正式上線。目前,其已通過火山引擎正式開放體驗接口。
一季度,AI賽道天翻地覆。
DeepSeek最先憑借推理模型震驚海外,大廠的步伐相對滯后,這讓去年AI戰(zhàn)略被打滿分的字節(jié)跳動略顯尷尬。
不過,有行業(yè)人士對鳳凰網(wǎng)科技表示,“豆包的步伐會慢,跟它用戶量級大有關(guān),如何平衡投入產(chǎn)出比是個問題”。
據(jù)譚待表述,豆包大模型在3月底日均tokens使用量已超12.7萬億,是2024年12月的3倍,一年前的106倍。
在基座大模型愈發(fā)呈現(xiàn)寡頭之勢的當下,豆包大模型的一舉一動也備受外界關(guān)注。
根據(jù)官方測評,豆包深度思考模型的人類評估表現(xiàn)超出DeepSeek R1 8%,同時單位推理成本相比DeepSeek R1降低了50%。
在數(shù)學推理、編程競賽、科學推理等專業(yè)任務領域,該模型性能相較OpenAI o3-mini-high、Gemini 2.5 Pro等模型同樣并不遜色。用譚待的話來說,就是“均達到或接近全球第一梯隊”。

圖|Seed-Thinking-v1.5專業(yè)任務性能,圖源/豆包官網(wǎng)
另一亮點是多模態(tài)的能力,畢竟DeepSeek遲遲不支持除文字以外的內(nèi)容。
本次豆包深度思考模型專門打造了一款視覺版,具有原生多模態(tài)深度思考能力,可以一鍵拍圖識別地點、識別外文菜單。
豆包大模型總算是扳回了一局。
目前,在AppStore內(nèi)豆包已重回免費榜第一,DeepSeek目前排名第三,元寶則位于第八。

用多模態(tài)打DeepSeek?
相比元寶赤裸裸的借DeepSeek的東風,豆包的姿態(tài)略顯搖擺。
2月初,火山引擎官方即全面支持DeepSeek系列大模型,但另一邊,豆包自身還在鉚足勁進行模型研發(fā)投入。
當月下旬,字節(jié)跳動旗下AI助手豆包開始小范圍測試深度思考模型的消息,彼時豆包相關(guān)負責人對媒體回應稱,豆包App在測試的是其深度思考模型的不同實驗版本;3月5日,豆包宣布上線深度思考推理模式,并以輸入框的“深度思考”按鈕為功能入口。
不過這些小試牛刀未能濺起多大水花。
直到本次推理模型全面上線,坦誠講,雖然沒有DeepSeek R1出現(xiàn)時的那種驚艷,但大廠全面作戰(zhàn)的能力更強,在產(chǎn)品細節(jié)上的打磨更為細致。
比如基于豆包·深度思考模型,豆包App進行了定向訓練,讓模型具備了“邊想邊搜”的能力。思考過程中,豆包可基于推理,多次調(diào)用工具、搜索信息,提供更加全面、準確的結(jié)果。
除此之外,視覺理解模型解決了DeepSeek R1只能做文字輸入的最大難點。
這一次在發(fā)布現(xiàn)場,譚待演示了一個很好的應用案例:
出國旅游時遇到的最大難題之一——點菜?!爸环g菜單是不夠的,能直接點菜才是完美”。除此之外,模型還要思考如何換算匯率來控制預算,還要弄懂外文菜單的意思,如果有老人、孩子,要照顧他們的喜好,是否過敏等等。根據(jù)譚待現(xiàn)場所舉的例子,豆包深度思考模型首先兌換貨幣控制預算,周全考慮老人孩子喜好,還細致避開過敏菜肴,非常出色地完成了任務。

豆包仍在憋大招
過去一個多月,是豆包團隊緊鑼密鼓的一個月。
人員架構(gòu)上引入新的技術(shù)大拿,最著名的當屬從谷歌加入字節(jié)的、曾參與Gemini開發(fā)的Google follow吳永輝博士。
此后其便領導豆包大模型團隊加足馬力,與此同時朱文佳繼續(xù)負責模型應用相關(guān)工作。
盡管研發(fā)模型是當前的緊要任務,但鳳凰網(wǎng)科技從豆包內(nèi)部人士處了解到,內(nèi)部對應用層的投入同樣不低?!白罱粋€多月,各個產(chǎn)品部門都拉滿了,個別部門還在憋大招?!?/p>
去年5月“豆包大模型家族”正式發(fā)布時驚艷四座,價格屠夫成為字節(jié)在大模型市場的一個新標簽。
今年2月,百度智能云事業(yè)群總裁沈抖還曾在全員會上暗戳戳的表示,“國內(nèi)大模型去年‘惡意’的價格戰(zhàn),導致行業(yè)整體的創(chuàng)收相較于國外差了多個數(shù)量級”。當時,譚待通過朋友圈回應稱,大模型降價是通過技術(shù)創(chuàng)新實現(xiàn)的,大家應像DeepSeek一樣聚焦基本功,少做無端猜測。

不過,本次發(fā)布的Doubao-1.5-thinking-pro模型沒有特別突出它的API價格。
鳳凰網(wǎng)科技在查詢官方后發(fā)現(xiàn),豆包推理模型的輸入、輸出價格分別為0.004元/千token和0.002元/千token,同等級模型,阿里qwen-plus輸入價格可做到0.0008元/千token,輸出價格與豆包模型一樣。DeepSeek R1的API價格在忙時段,輸入和輸出分別可達0.001元/千token和0.016元/千token。
另據(jù)官方表示,豆包深度思考模型采用MoE(混合專家)架構(gòu),總參數(shù)為200B,每次推理時激活的參數(shù)為20B,可以更低延遲。相比之下,DeepSeek-R1總參數(shù)規(guī)模為671B,激活參數(shù)為37B。
在提及本次模型更新中的難點時,譚待表示,整體來說是實現(xiàn)效果好最難?!耙驗橐扔酶鞣N方法達到最好的效果,在這個基礎上再用各種方式去降低成本,這是一個優(yōu)化的過程”。其認為,好效果能帶來更大的突破,解鎖更多的場景,吸引更多的用戶和企業(yè)使用。所以得以預見,豆包推理模型的API價格未來還將處于動態(tài)調(diào)整的過程中。
包括朱嘯虎在內(nèi)的一眾行業(yè)人士均認為,當前國內(nèi)已經(jīng)有很好的開源模型,這使得應用市場出現(xiàn)了顯著的機會。業(yè)內(nèi)越來越多人亦認為大模型的競爭最后只會剩下幾家。
如李開復所言,“中國大模型未來大概率只剩下DeepSeek、阿里和字節(jié)跳動三家”。不過即便如此,相較于DeepSeek和阿里,字節(jié)仍舊需要走出自己的路。
熱門跟貼