打開網(wǎng)易新聞 查看精彩圖片

出品|虎嗅科技組

作者|房曉楠

編輯|苗正卿

頭圖|視覺中國

4月25日,在Create2025百度AI開發(fā)者大會上,百度發(fā)布了文心大模型4.5 Turbo和深度思考模型X1 Turbo兩款新模型。較之文心4.5,文心4.5 Turbo速度更快,價格下降80%。

其實此次距離文心4.5和文心X1的發(fā)布才剛剛過去一個多月,模型短期內多次迭代,與之相對應的“應用”價值是否會被覆蓋?創(chuàng)始人李彥宏的看法是,找對場景、選對基礎模型、會調模型,做出來的應用就不會過時。

李彥宏演講中多次提到應用,甚至斷言,“模型有很多,但統(tǒng)治這個世界的是應用?!?/p>

此次,百度也發(fā)布了多款AI應用產(chǎn)品,包括一款官方定位為通用超級智能體的心響App。

據(jù)研發(fā)團隊透露,這款產(chǎn)品是一支95后年輕團隊在30天左右交付的結果,而正式開發(fā)是在3月18日。從時間推斷,這個時間距離Manus亮相過去12天。

智能體來勢洶洶。如果說去年關于大模型的落地應用還是處于懸而未決的試探階段,那3月初Manus的爆火,直接給出了一個明確而具體的答案,應用是未來,AI智能體的喧鬧前奏已經(jīng)響起。

不管是對于大廠,還是初創(chuàng)企業(yè)來說,DeepSeek式的沖擊與帶來的措手不及,一次就好。這次,必須快速響應。像是字節(jié),據(jù)媒體報道,在Manus出現(xiàn)前后,內部大概有7個團隊在開發(fā)不同的智能體產(chǎn)品。

如今,初創(chuàng)企業(yè)中Genpark發(fā)布了Super Agent,大廠中的字節(jié)和百度相繼推出新品,其他玩家也在蓄勢待發(fā)。這一年,注定是AI智能體喧嘩熱鬧的一年。

在心響App正式發(fā)布前,虎嗅等媒體事先進行了產(chǎn)品體驗,同時也與百度智能體業(yè)務首席架構師、心響App負責人黃際洲,心響App產(chǎn)品經(jīng)理黎宇昕進行了交流,他們結合心響App的研發(fā),分享了當下AI智能體行業(yè)發(fā)展的新思考。以下為交流實錄,部分內容略有刪減:

提問:短期組建的團隊要在一個月內做出這一產(chǎn)品,為什么這么著急?是老板給定的deadline,為的是搶占行業(yè)時機節(jié)點?

黃際洲:我們沒有非要趕某個時間節(jié)點,老板也沒有給我們下目標(笑),我們就是想發(fā)一個現(xiàn)貨。

AI智能體的摩爾定律是,每隔7個月AI智能體能完成的最長任務時長會翻番,設想一下如果按部研發(fā)、迭代,那等到呈現(xiàn)給大家用時,已經(jīng)過時了。所以每一個節(jié)點,我們會逼著自己做一個(產(chǎn)品)發(fā)布。

提問:目前心響只有App,將來會出PC端嗎?

黃際洲:會的。PC端在計劃中,包括大家可能想要的上傳文件、輸入Excel表格輸出圖表、做分析、與Word聯(lián)動等功能,都會有的。

提問:據(jù)了解,Manus這一智能體產(chǎn)品也在海外上線了App端,你認為PC端與App端智能體的不同點在哪?

黃際洲:首先,第一個不同也是最大的難點是,不是技術上實現(xiàn)不了,而是手機屏幕實在太小了,如果想讓用戶看清楚某個東西,或者進行快速交互時,不是件容易的事情。反之,PC端的屏幕大,但大也會帶來問題,就是如何高效利用起來,高效交互。

第二是,在PC端可以非常方便地去打開各種生產(chǎn)力工具,比如Excel和Word,但在移動端想傳一個文件難度很大,快速填表、填數(shù)據(jù)等在PC端很容易實現(xiàn)的事情,在移動端不容易實現(xiàn)。

黎宇昕:當然,兩者技術上有更多的相通性,我們可以用多智能體協(xié)同的Pipeline去實現(xiàn)這個功能。PC端更多傾向于辦公場景,比如PPT,我們確實有生成PPT的功能,但是在手機播放PPT也太雞肋了,但在PC端就會相對輕松,文案一鍵編輯、自動改編、填表、寫文檔等都可以。

提問:當前的通用智能體或者超級應用,都是多智能體協(xié)同操作,過程中的技術難點在哪?

黃際洲:首先,最大的問題在于很多時候想去接入很多東西,而MCP協(xié)議的出現(xiàn)解決了這一問題,讓大家能更快地接入。但到目前為止業(yè)界比較大的問題在于,大家都想獲得但很少去做貢獻,免費好用的工具實在太少了??梢运阋粋€數(shù)字,把Tool Use做成MCP給到別人,乘以1000是很小的成本,但如果乘以10萬、100萬、1000萬、1億,那很難扛得住這個成本,所以我們想要構建廣泛的生態(tài),呼吁更多的開發(fā)者一同來做,這是一個所有人都受益的事情。

第二個問題是,要實現(xiàn)多模態(tài)工具間的使用,比如Agent Use,必須要有很強的協(xié)議。舉個例子,平時工作中做(產(chǎn)品)開發(fā)會有PM、PE、FE各種各樣的研發(fā),承擔不同的角色,彼此知識背景、專業(yè)術語不一樣,說的話很難互相理解,頻率不同接收的信息就有折損。智能體也一樣,各個子智能體之間的互動和信息傳遞要盡可能做到無損,所以需要設計很好的協(xié)議和交互方式,能夠把它協(xié)同起來。

第三個問題是大模型產(chǎn)品的“不可能三角”(虎嗅注:“不可能三角”國際經(jīng)濟學的一個著名理論,簡單來說是指如果一件事情同時存在三個要素,三者不可都得),以搜索為例,大家已經(jīng)養(yǎng)成的搜索習慣是輸入一個詞很快就返回答案,這是我們對搜索的心智。而對任務心智來講,你要的是一個精準替你完成任務的管家,智能體產(chǎn)品能幫你完成任務、交付很好的結果。但在當下的技術發(fā)展趨勢下,很難讓它短時間內給到你最終任務結果,所以要做出(時間)犧牲。

提問:目前心響上各個場景中的智能體,都是百度自己開發(fā)的,還是外部接入?

黃際洲:我們很難把智能體開發(fā)得超過很多專業(yè)玩家。比如AI繪本,是接的百度文庫的AI繪本功能,為了做到免費,我們向百度文庫爭取到了最大權益。健康也是如此,引入的是第三方。未來,我們想要構建開放生態(tài),只要是市面上好的體驗、做得比我們好、愿意被我們接入或者愿意接入我們,都可以接進來。

提問:當前越來越多的大廠開始接受MCP,未來智能體可能會變成紅海賽道,競爭激烈。像是前段時間支付寶的百寶箱開了支付MCP Server協(xié)議。那百度在智能體競爭中,想怎么做?

黃際洲:MCP是個通用協(xié)議,只要大家遵循這個協(xié)議,開發(fā)者就不需要為A、B、C、D各開發(fā)一份,省時省力。而對于接入方來講,遵循這一協(xié)議以后,可以很方便地接入,不需要再充分對接。

對我們來講,現(xiàn)在是這樣,如果某一東西(功能)是我們內部開發(fā)的,那有比MCP更高效的協(xié)議,從而保證更快接入(心響)。我們既支持自己獨有的協(xié)議,也會把MCP接進來,這是一個原則。

當前實踐告訴我們,優(yōu)質的MCP是稀缺的,因為算力很貴。我做這么好的服務,不可能免費接入,我要構建起商業(yè)模式。但用戶想白嫖,我們也想白嫖,開發(fā)者就被白嫖死了,無法養(yǎng)家糊口。所以未來是有一個供需之間的GAP存在,而最終生態(tài)的繁榮一定是能把商業(yè)模式跑通的繁榮。開發(fā)者能掙到錢,我們能掙到錢,需求越做越大,給大家提供越來越好的體驗。當前,我們只專注于給用戶提供極致的通用超級智能體產(chǎn)品體驗。

提問:現(xiàn)在大家都在說超級智能體或超級應用,你認為最終的交互方式該是怎樣的?

黃際洲:對于這一問題,我們也一直在思考。

關于交互方式,如果把用戶千奇百怪的輸入和不同的交互方式(語音、文字等)整合在一個產(chǎn)品里,這對于交互的要求超高,在完成不同任務時,也很難。所以我們一直強調一個很簡單的輸入,目標就是消滅復雜的prompt,但這很難一下子做到,所以我們嘗試從極簡化用戶需要輸入的東西開始,比如做城市攻略,用戶輸入“哈爾濱旅游攻略”就足夠了,剩下的事情智能體會一步步幫你細化和完善,最后給出一個成品。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4282325.html?f=wyxwapp