文|周鑫雨

編輯|蘇建勛

如今,模型的發(fā)展已經(jīng)成了應用開發(fā)者的一把雙刃劍。一方面,模型能力的增強,給場景落地帶來更多的可能;另一方面,應用的能力,也隨時可能被模型能力本身淘汰。

什么樣的應用不會過時?

2025年4月25日,百度Create大會上,百度集團創(chuàng)始人、董事長兼CEO李彥宏的答案是:“你只要找對場景,選對基礎模型,有時候可能還要學一點調模型的方法,那么在這個基礎上做出來的應用,它是不會過時的,應用才是真正創(chuàng)造價值的。”

在應用層,李彥宏認為2025年以來最令人激動的突破性的應用,是數(shù)字人和Agent。

賣數(shù)字人,是百度布局電商業(yè)務的重要一環(huán)。在會上,李彥宏發(fā)布了最新的數(shù)字人能力:高說服力數(shù)字人。除了更加擬人,“高說服力數(shù)字人”的特點,是可以感知直播間環(huán)境,并智能做出發(fā)紅包、換品等決策。

百度在應用層的另一個布局重點,是Agent。

一年前,李彥宏曾表示,AI Coding是他最看好的應用方向。目前,百度在代碼智能體領域已經(jīng)做了較為完整的布局,有面向專業(yè)工程師的編程工具Comate,面向普通人的無代碼編程工具“秒噠”。

而面向通用場景,前有Manus邀請碼“一碼難求”,百度也快馬跟上,趁Manus收費之際,推出了一款移動端的Agent應用“心響”。

在模型層,DeepSeek是繞不過去的競爭對手。

“DeepSeek不是萬能的?!?/strong>李彥宏開門見山,“DeepSeek不支持多模態(tài)理解,有幻覺,更重要的是,慢和貴。”

對著DeepSeek的“短板”打,百度在Create發(fā)布了新模型:文心大模型4.5 Turbo和X1 Turbo,主打多模態(tài),強推理,低成本。尤其是成本,4.5 Turbo的成本,是DeepSeek V3的40%,X1 Turbo的成本,是DeepSeek的25%。

最后,百度將自己的野心,也放到了AI應用生態(tài)的建立上。

一方面,百度搜索推出了開放平臺,邀請應用開發(fā)者給予搜索生態(tài)開發(fā)AI應用;另一方面,百度對Anthropic發(fā)布的Agent協(xié)議MCP,進行了支持——這意味著,支持MCP的模型、外部工具和數(shù)據(jù)庫之間,將能夠暢通無阻的交互。

百度的“App版Manus”發(fā)布了

2025年3月6日發(fā)布的Agent應用Manus,又讓AI Agent成為各家搶灘的應用高地。

4月22日,大會三天前,百度的首款獨立Agent應用,已經(jīng)上架了安卓應用商店。這款名為“心響”的App,形式可以簡單理解為百度將Manus的移動端版本做了一遍。

用戶只需在“心響”App中輸入自己的需求,Agent就能對任務進行執(zhí)行和交付。

打開網(wǎng)易新聞 查看精彩圖片

“心響”制作繪本。來源:百度

此前,據(jù)百度智能體業(yè)務首席架構師、心響App負責人黃際洲介紹,“心響”的實現(xiàn),背靠的是百度提出的Agent Use協(xié)議。此前,Anthropic提出的Agent協(xié)議MCP,針對的是工具的調用。

而“心響”采用的是對智能體的調用。根據(jù)用戶的需求,“心響”的主智能體,能根據(jù)任務,調度第三方和百度自己的智能體,實現(xiàn)任務的執(zhí)行和交付。

重建用戶心智,在心響App產(chǎn)品經(jīng)理黎宇昕看來,是百度做Agent產(chǎn)品時遇到的最大難點。

在媒體溝通會上,他提到,百度之前用搜索建立的用戶心智,是及時交付。這意味著,AI應用“一定會折損效果,比如通過緩存的方式,去降模型調用的次數(shù)等等”——這也是市面上大多強調及時交付的Agent產(chǎn)品,無法實現(xiàn)高質交付的原因。

黎雨昕認為,“心響”要重新建立的,是托管心智。與Manus的任務可視面板類似,“心響”在任務執(zhí)行過程中,也采用了分析流的形式,將任務執(zhí)行的過程和時間,呈現(xiàn)給用戶。

目前,心響已經(jīng)支持包括200種類型的任務,覆蓋了工作、學習、生活的主要場景,比如試題講解、旅游、相親、問診、法律咨詢。

黃際洲透露,未來,“心響”計劃將支持的任務類型擴展到10萬+以上。與此同時,“心響”PC端也正在研發(fā)中。

會畫畫的新推理模型,成本僅DeepSeek的25%

百度新發(fā)布的模型文心4.5 Turbo和X1 Turbo,相較于DeepSeek V3和R1的優(yōu)勢,除了整體性能的超越,主要在于多模態(tài)能力和低成本。

打開網(wǎng)易新聞 查看精彩圖片

文心4.5 Turbo性能測評。來源:百度

打開網(wǎng)易新聞 查看精彩圖片

文心X1 Turbo性能測評。來源:百度

其中,李彥宏強調了多模態(tài)理解的能力。他認為,多模態(tài)是未來基礎模型的標配,“純文本模型的市場會越來越小,多模態(tài)的市場會越來越大”。

文心4.5 Turbo和X1 Turbo,都對圖像和視頻理解進行了支持。

比如,輸入一張高糊的球賽照片,文心4.5 Turbo能通過周邊的廣告牌、球員動作等元素,識別出這是1986年墨西哥的世界杯足球賽上,阿根廷與英格蘭的決賽。

打開網(wǎng)易新聞 查看精彩圖片

文心4.5 Turbo的圖像理解能力。

除了多模態(tài)理解,兩個模型也支持多模態(tài)生成。

比如,在文心X1 Turbo中輸入“聽說武漢有種東西叫‘蒜鳥’,請你把它畫出來”,X1 Turbo就能根據(jù)聯(lián)網(wǎng)搜索到的信息,生成蒜鳥的卡通形象。

至于價格,文心4.5Turbo價格僅為文心4.5的20%、DeepSeek V3的40%,每百萬token的輸入價格為0.8元,輸出價格3.2元;X1 Turbo的價格僅為DeepSeek-R1的25%,每百萬token輸入價格1元,輸出價格4元。

百度電商,做上游“賣水人”

AI重燃了百度對電商信心。

自2023年5月在百度App上線“百度優(yōu)選”入口以來,百度對電商的定位,不是和淘寶、京東這些規(guī)模化的貨架電商競爭。

百度副總裁、百度電商總經(jīng)理平曉黎表示,百度電商有兩個定位,一方面,是構成百度App服務的一環(huán),滿足搜索用戶的消費需求;另一方面,是用智能工具服務,成為電商的上游“賣水人”。

數(shù)字人,就是百度電商賣的水。此次百度發(fā)布的“高說服力數(shù)字人”,除了在擬人、成本、風格等層面有所優(yōu)化,最重要的是能夠對直播間環(huán)境進行感知,并作出實時的互動,避免了傳統(tǒng)數(shù)字人循環(huán)播放的尷尬局面。

比如,比如滿50萬人觀看,就給觀眾發(fā)紅包;根據(jù)直播間用戶的問題,靈活調度PPT、切換素材。

打開網(wǎng)易新聞 查看精彩圖片

“高說服力數(shù)字人”。來源:百度

實時互動背后的技術,是多智能體調度能力。據(jù)平曉黎介紹,高說服力數(shù)字人背后,有主播專家、運營專家、場控專家等多個角色智能體,能夠根據(jù)直播間實時熱度和轉化情況,靈活調度。

AI月活超9700萬的文庫,想打模型組合拳

整合了百度網(wǎng)盤的文庫,交出了半年答卷:付費用戶數(shù)超4000萬,月活超9700萬。

在百度內部,百度文庫是模型能力應用的尖子生。此前,百度副總裁、百度文庫兼百度網(wǎng)盤負責人王穎告訴《智能涌現(xiàn)》,文庫是最早自研MoE(混合專家模型)架構的AI應用。

當下,采用多模型組合的底座,已經(jīng)成為AI應用的基操。李彥宏認為,應用對模型的組合使用,是普遍的現(xiàn)象,但如何組合、如何調用,仍然是一門技術活。

為此,百度文庫和網(wǎng)盤推出了一個技術底座:滄舟OS。

打開網(wǎng)易新聞 查看精彩圖片

滄舟OS。

為了實現(xiàn)不同模型對不同內容的理解和生成,這個底座,主要分成兩層:

第一層,Chatfile Plus。其能夠對不同模態(tài)、不同形態(tài)、不同格式的內容進行“向量化處理”,也就是將不同內容翻譯成大模型能看得懂的向量化Token,在進行混合生成。

第二層,三庫+三器,也就是“公域知識庫、私域知識庫,記憶庫”,以及“編輯器、閱讀器和播放器”。這一套系統(tǒng),可以根據(jù)用戶的需求,被大模型來組合調用。

基于這一套OS,百度網(wǎng)盤發(fā)布了新功能,AI筆記。

在百度文庫看來,用戶學習的一個痛點,是筆記內容與原始學習資料之間缺乏關聯(lián)。比如用戶根據(jù)筆記復習時,需要再花一番功夫,去尋找文本、視頻、圖片等資料。

AI筆記的核心功能,是時間溯源和多模態(tài)整理。比如,根據(jù)百度網(wǎng)盤中保存的視頻講解,AI筆記可以基于對內容的理解,梳理整個視頻的邏輯結構和行文順序,并生成思維導圖。

導圖中,每個知識點帶的時間戳,都直接溯源到視頻的相應節(jié)點。

打開網(wǎng)易新聞 查看精彩圖片

百度網(wǎng)盤的“AI筆記”功能。

MCP,百度也接上了“AI萬能插座”

MCP,是美國模型廠商Anthropic推出的Agent協(xié)議。

就像秦統(tǒng)一了貨幣,協(xié)議的作用,就是統(tǒng)一了軟件之間的開發(fā)標準。支持MCP協(xié)議的軟件之間,也可以更為靈活的適配、相互調用。比如,不少金融公司采用MCP,讓AI更好地理解金融數(shù)據(jù)的上下文。

支持MCP,也成了廠商吸引更多第三方應用入駐、建立AI生態(tài)的一場“暗戰(zhàn)”。比如,阿里云的AI開發(fā)平臺“百煉”上線了MCP服務,騰訊云也宣布大模型知識引擎支持MCP協(xié)議。

在李彥宏看來,MCP就像給AI裝上了一個萬能插座,能夠提高不同AI軟件適配、開發(fā)、整合維護的效率。對于需要自由調用工具的Agent而言,MCP的出現(xiàn)尤為重要,這意味著Agent可以自由調用支持MCP的第三方工具。

目前,百度智能云大模型平臺“千帆”兼容了MCP,百度搜索也構建了MCP Server的索引平臺,文心快碼、百度電商、地圖、網(wǎng)盤、文庫等應用,也通過MCP Server的形式,對外提供了能力。

歡迎交流!