文|周鑫雨

編輯|蘇建勛

如今,模型的發(fā)展已經(jīng)成了應(yīng)用開發(fā)者的一把雙刃劍。一方面,模型能力的增強(qiáng),給場景落地帶來更多的可能;另一方面,應(yīng)用的能力,也隨時(shí)可能被模型能力本身淘汰。

什么樣的應(yīng)用不會過時(shí)?

2025年4月25日,百度Create大會上,百度集團(tuán)創(chuàng)始人、董事長兼CEO李彥宏的答案是:“你只要找對場景,選對基礎(chǔ)模型,有時(shí)候可能還要學(xué)一點(diǎn)調(diào)模型的方法,那么在這個(gè)基礎(chǔ)上做出來的應(yīng)用,它是不會過時(shí)的,應(yīng)用才是真正創(chuàng)造價(jià)值的?!?/p>

在應(yīng)用層,李彥宏認(rèn)為2025年以來最令人激動的突破性的應(yīng)用,是數(shù)字人和Agent。

賣數(shù)字人,是百度布局電商業(yè)務(wù)的重要一環(huán)。在會上,李彥宏發(fā)布了最新的數(shù)字人能力:高說服力數(shù)字人。除了更加擬人,“高說服力數(shù)字人”的特點(diǎn),是可以感知直播間環(huán)境,并智能做出發(fā)紅包、換品等決策。

百度在應(yīng)用層的另一個(gè)布局重點(diǎn),是Agent。

一年前,李彥宏曾表示,AI Coding是他最看好的應(yīng)用方向。目前,百度在代碼智能體領(lǐng)域已經(jīng)做了較為完整的布局,有面向?qū)I(yè)工程師的編程工具Comate,面向普通人的無代碼編程工具“秒噠”。

而面向通用場景,前有Manus邀請碼“一碼難求”,百度也快馬跟上,趁Manus收費(fèi)之際,推出了一款移動端的Agent應(yīng)用“心響”。

在模型層,DeepSeek是繞不過去的競爭對手。

“DeepSeek不是萬能的?!?/strong>李彥宏開門見山,“DeepSeek不支持多模態(tài)理解,有幻覺,更重要的是,慢和貴?!?/strong>

對著DeepSeek的“短板”打,百度在Create發(fā)布了新模型:文心大模型4.5 Turbo和X1 Turbo,主打多模態(tài),強(qiáng)推理,低成本。尤其是成本,4.5 Turbo的成本,是DeepSeek V3的40%,X1 Turbo的成本,是DeepSeek的25%。

最后,百度將自己的野心,也放到了AI應(yīng)用生態(tài)的建立上。

一方面,百度搜索推出了開放平臺,邀請應(yīng)用開發(fā)者給予搜索生態(tài)開發(fā)AI應(yīng)用;另一方面,百度對Anthropic發(fā)布的Agent協(xié)議MCP,進(jìn)行了支持——這意味著,支持MCP的模型、外部工具和數(shù)據(jù)庫之間,將能夠暢通無阻的交互。

百度的“App版Manus”發(fā)布了

2025年3月6日發(fā)布的Agent應(yīng)用Manus,又讓AI Agent成為各家搶灘的應(yīng)用高地。

4月22日,大會三天前,百度的首款獨(dú)立Agent應(yīng)用,已經(jīng)上架了安卓應(yīng)用商店。這款名為“心響”的App,形式可以簡單理解為百度將Manus的移動端版本做了一遍。

用戶只需在“心響”App中輸入自己的需求,Agent就能對任務(wù)進(jìn)行執(zhí)行和交付。

打開網(wǎng)易新聞 查看精彩圖片

“心響”制作繪本。來源:百度

此前,據(jù)百度智能體業(yè)務(wù)首席架構(gòu)師、心響App負(fù)責(zé)人黃際洲介紹,“心響”的實(shí)現(xiàn),背靠的是百度提出的Agent Use協(xié)議。此前,Anthropic提出的Agent協(xié)議MCP,針對的是工具的調(diào)用。

而“心響”采用的是對智能體的調(diào)用。根據(jù)用戶的需求,“心響”的主智能體,能根據(jù)任務(wù),調(diào)度第三方和百度自己的智能體,實(shí)現(xiàn)任務(wù)的執(zhí)行和交付。

重建用戶心智,在心響App產(chǎn)品經(jīng)理黎宇昕看來,是百度做Agent產(chǎn)品時(shí)遇到的最大難點(diǎn)。

在媒體溝通會上,他提到,百度之前用搜索建立的用戶心智,是及時(shí)交付。這意味著,AI應(yīng)用“一定會折損效果,比如通過緩存的方式,去降模型調(diào)用的次數(shù)等等”——這也是市面上大多強(qiáng)調(diào)及時(shí)交付的Agent產(chǎn)品,無法實(shí)現(xiàn)高質(zhì)交付的原因。

黎雨昕認(rèn)為,“心響”要重新建立的,是托管心智。與Manus的任務(wù)可視面板類似,“心響”在任務(wù)執(zhí)行過程中,也采用了分析流的形式,將任務(wù)執(zhí)行的過程和時(shí)間,呈現(xiàn)給用戶。

目前,心響已經(jīng)支持包括200種類型的任務(wù),覆蓋了工作、學(xué)習(xí)、生活的主要場景,比如試題講解、旅游、相親、問診、法律咨詢。

黃際洲透露,未來,“心響”計(jì)劃將支持的任務(wù)類型擴(kuò)展到10萬+以上。與此同時(shí),“心響”PC端也正在研發(fā)中。

會畫畫的新推理模型,成本僅DeepSeek的25%

百度新發(fā)布的模型文心4.5 Turbo和X1 Turbo,相較于DeepSeek V3和R1的優(yōu)勢,除了整體性能的超越,主要在于多模態(tài)能力和低成本。

打開網(wǎng)易新聞 查看精彩圖片

文心4.5 Turbo性能測評。來源:百度

打開網(wǎng)易新聞 查看精彩圖片

文心X1 Turbo性能測評。來源:百度

其中,李彥宏強(qiáng)調(diào)了多模態(tài)理解的能力。他認(rèn)為,多模態(tài)是未來基礎(chǔ)模型的標(biāo)配,“純文本模型的市場會越來越小,多模態(tài)的市場會越來越大”。

文心4.5 Turbo和X1 Turbo,都對圖像和視頻理解進(jìn)行了支持。

比如,輸入一張高糊的球賽照片,文心4.5 Turbo能通過周邊的廣告牌、球員動作等元素,識別出這是1986年墨西哥的世界杯足球賽上,阿根廷與英格蘭的決賽。

打開網(wǎng)易新聞 查看精彩圖片

文心4.5 Turbo的圖像理解能力。

除了多模態(tài)理解,兩個(gè)模型也支持多模態(tài)生成。

比如,在文心X1 Turbo中輸入“聽說武漢有種東西叫‘蒜鳥’,請你把它畫出來”,X1 Turbo就能根據(jù)聯(lián)網(wǎng)搜索到的信息,生成蒜鳥的卡通形象。

至于價(jià)格,文心4.5Turbo價(jià)格僅為文心4.5的20%、DeepSeek V3的40%,每百萬token的輸入價(jià)格為0.8元,輸出價(jià)格3.2元;X1 Turbo的價(jià)格僅為DeepSeek-R1的25%,每百萬token輸入價(jià)格1元,輸出價(jià)格4元。

百度電商,做上游“賣水人”

AI重燃了百度對電商信心。

自2023年5月在百度App上線“百度優(yōu)選”入口以來,百度對電商的定位,不是和淘寶、京東這些規(guī)模化的貨架電商競爭。

百度副總裁、百度電商總經(jīng)理平曉黎表示,百度電商有兩個(gè)定位,一方面,是構(gòu)成百度App服務(wù)的一環(huán),滿足搜索用戶的消費(fèi)需求;另一方面,是用智能工具服務(wù),成為電商的上游“賣水人”。

數(shù)字人,就是百度電商賣的水。此次百度發(fā)布的“高說服力數(shù)字人”,除了在擬人、成本、風(fēng)格等層面有所優(yōu)化,最重要的是能夠?qū)χ辈ラg環(huán)境進(jìn)行感知,并作出實(shí)時(shí)的互動,避免了傳統(tǒng)數(shù)字人循環(huán)播放的尷尬局面。

比如,比如滿50萬人觀看,就給觀眾發(fā)紅包;根據(jù)直播間用戶的問題,靈活調(diào)度PPT、切換素材。

打開網(wǎng)易新聞 查看精彩圖片

“高說服力數(shù)字人”。來源:百度

實(shí)時(shí)互動背后的技術(shù),是多智能體調(diào)度能力。據(jù)平曉黎介紹,高說服力數(shù)字人背后,有主播專家、運(yùn)營專家、場控專家等多個(gè)角色智能體,能夠根據(jù)直播間實(shí)時(shí)熱度和轉(zhuǎn)化情況,靈活調(diào)度。

AI月活超9700萬的文庫,想打模型組合拳

整合了百度網(wǎng)盤的文庫,交出了半年答卷:付費(fèi)用戶數(shù)超4000萬,月活超9700萬。

在百度內(nèi)部,百度文庫是模型能力應(yīng)用的尖子生。此前,百度副總裁、百度文庫兼百度網(wǎng)盤負(fù)責(zé)人王穎告訴《智能涌現(xiàn)》,文庫是最早自研MoE(混合專家模型)架構(gòu)的AI應(yīng)用。

當(dāng)下,采用多模型組合的底座,已經(jīng)成為AI應(yīng)用的基操。李彥宏認(rèn)為,應(yīng)用對模型的組合使用,是普遍的現(xiàn)象,但如何組合、如何調(diào)用,仍然是一門技術(shù)活。

為此,百度文庫和網(wǎng)盤推出了一個(gè)技術(shù)底座:滄舟OS。

打開網(wǎng)易新聞 查看精彩圖片

滄舟OS。

為了實(shí)現(xiàn)不同模型對不同內(nèi)容的理解和生成,這個(gè)底座,主要分成兩層:

第一層,Chatfile Plus。其能夠?qū)Σ煌B(tài)、不同形態(tài)、不同格式的內(nèi)容進(jìn)行“向量化處理”,也就是將不同內(nèi)容翻譯成大模型能看得懂的向量化Token,在進(jìn)行混合生成。

第二層,三庫+三器,也就是“公域知識庫、私域知識庫,記憶庫”,以及“編輯器、閱讀器和播放器”。這一套系統(tǒng),可以根據(jù)用戶的需求,被大模型來組合調(diào)用。

基于這一套OS,百度網(wǎng)盤發(fā)布了新功能,AI筆記。

在百度文庫看來,用戶學(xué)習(xí)的一個(gè)痛點(diǎn),是筆記內(nèi)容與原始學(xué)習(xí)資料之間缺乏關(guān)聯(lián)。比如用戶根據(jù)筆記復(fù)習(xí)時(shí),需要再花一番功夫,去尋找文本、視頻、圖片等資料。

AI筆記的核心功能,是時(shí)間溯源和多模態(tài)整理。比如,根據(jù)百度網(wǎng)盤中保存的視頻講解,AI筆記可以基于對內(nèi)容的理解,梳理整個(gè)視頻的邏輯結(jié)構(gòu)和行文順序,并生成思維導(dǎo)圖。

導(dǎo)圖中,每個(gè)知識點(diǎn)帶的時(shí)間戳,都直接溯源到視頻的相應(yīng)節(jié)點(diǎn)。

打開網(wǎng)易新聞 查看精彩圖片

百度網(wǎng)盤的“AI筆記”功能。

MCP,百度也接上了“AI萬能插座”

MCP,是美國模型廠商Anthropic推出的Agent協(xié)議。

就像秦統(tǒng)一了貨幣,協(xié)議的作用,就是統(tǒng)一了軟件之間的開發(fā)標(biāo)準(zhǔn)。支持MCP協(xié)議的軟件之間,也可以更為靈活的適配、相互調(diào)用。比如,不少金融公司采用MCP,讓AI更好地理解金融數(shù)據(jù)的上下文。

支持MCP,也成了廠商吸引更多第三方應(yīng)用入駐、建立AI生態(tài)的一場“暗戰(zhàn)”。比如,阿里云的AI開發(fā)平臺“百煉”上線了MCP服務(wù),騰訊云也宣布大模型知識引擎支持MCP協(xié)議。

在李彥宏看來,MCP就像給AI裝上了一個(gè)萬能插座,能夠提高不同AI軟件適配、開發(fā)、整合維護(hù)的效率。對于需要自由調(diào)用工具的Agent而言,MCP的出現(xiàn)尤為重要,這意味著Agent可以自由調(diào)用支持MCP的第三方工具。

目前,百度智能云大模型平臺“千帆”兼容了MCP,百度搜索也構(gòu)建了MCP Server的索引平臺,文心快碼、百度電商、地圖、網(wǎng)盤、文庫等應(yīng)用,也通過MCP Server的形式,對外提供了能力。

歡迎交流!