打開網(wǎng)易新聞 查看精彩圖片

往后假期,你也可以為自己開發(fā)一個(gè)專屬AI導(dǎo)游。

文|《中國企業(yè)家》記者 閆俊文

編輯|張曉迪

圖片來源|視覺中國

3月初,一款名為Manus的通用Agent產(chǎn)品火爆網(wǎng)絡(luò),測(cè)試階段,需要的驗(yàn)證碼一碼難求。目前,Manus已經(jīng)在國外上線了APP,訂閱費(fèi)根據(jù)檔次,分別為每月39美元和199美元。這比大部分大模型產(chǎn)品的收費(fèi)都要高,比如Jasper AI,每月費(fèi)用是29美元和59美元,其企業(yè)端收費(fèi)更高一些。

Manus創(chuàng)始人肖弘是一位90后,有消息說,字節(jié)跳動(dòng)曾嘗試收購Manus,但沒有成行。今年4月,Manus背后的公司完成由Benchmark領(lǐng)投的7500萬美元B輪融資,估值躍升至近5億美元,此前,它的投資人還有騰訊、真格基金、紅杉中國。

Agent,意即智能體,意味著AI能處理更復(fù)雜的問題,不僅能聽、能讀、能寫,還能思考與決策,甚至能夠與物理世界交互。

Agent時(shí)代正加速到來。2024年底,Anthropic發(fā)布并開源了MCP,(Model Context Protocol),MCP是一個(gè)開放協(xié)議,旨在標(biāo)準(zhǔn)化大型語言模型與外部數(shù)據(jù)源和工具的交互。它通過客戶端-服務(wù)器架構(gòu),允許AI應(yīng)用通過統(tǒng)一接口訪問各種資源。今年4月,Google也發(fā)布了A2A(Agent to Agent),試圖讓AI智能體能夠相互“通信”。

近期,明勢(shì)創(chuàng)投創(chuàng)始合伙人黃明明在出席《中國企業(yè)家》2025商界木蘭年會(huì)時(shí)表示,Agent對(duì)物理世界的理解、記憶推理以及工具的使用,會(huì)在未來1~2年取得巨大突破,目前還遠(yuǎn)遠(yuǎn)沒有到大家停下來卷成本、卷差異化的地步。

目前,Manus的風(fēng)暴仍在持續(xù),就像它的母公司名字“蝴蝶效應(yīng)”一樣。該公司總部在武漢,但引發(fā)的創(chuàng)業(yè)潮卻在杭州、北京、上海等多地涌動(dòng)。這些創(chuàng)業(yè)者們堅(jiān)信,Agent是比APP更大的機(jī)會(huì),下一個(gè)微信、抖音、小紅書的機(jī)會(huì)就藏在其中。

《中國企業(yè)家》記者在小紅書找到一位Agent創(chuàng)業(yè)者成峰,他今年31歲,生活在杭州,他擁有一個(gè)典型的大廠職業(yè)路徑,他先是在互聯(lián)網(wǎng)中廠、大廠從事產(chǎn)品和運(yùn)營工作,后來跳到創(chuàng)業(yè)公司,最終選擇創(chuàng)業(yè)。

成峰始終覺得公司制的考核體系不能滿足自己對(duì)產(chǎn)品的想象,前者意味著用戶規(guī)模、ROI考核。最終他在2023年底,全職投入了Agent創(chuàng)業(yè)。

目前,成峰在小紅書、B站以及公眾號(hào)上以“AI產(chǎn)品自由”的賬號(hào)公開自己創(chuàng)作Agent的過程,就像一份教程——教別人怎么搭建Agent。他的全網(wǎng)粉絲超過5000人,同時(shí)也有足夠的廣告收入養(yǎng)活自己,但他的最終目標(biāo)還是做Agent產(chǎn)品創(chuàng)業(yè)。這期間,他搭建過很多有趣的Agent:

一個(gè)是,給自己的媽媽搭建了一個(gè)“出行地圖”Agent。他將媽媽出行常用的起點(diǎn)和終點(diǎn)固定成模塊,設(shè)計(jì)成一個(gè)圖標(biāo)放在手機(jī)屏幕上,一點(diǎn)擊,就能自動(dòng)跳躍到高德地圖,自動(dòng)打車以及導(dǎo)航到上車地點(diǎn),而不是需要長輩手動(dòng)搜索。

另一個(gè)是,能讓游客省去數(shù)百元錢的AI導(dǎo)游。他利用高德地圖和MiniMax的MCP做了一個(gè)浙江省博物館的AI導(dǎo)游,讓用戶可以聽AI對(duì)文物的講解。

還有一個(gè)是,他搭建了一款小紅書筆記Agent,這是一款接入了納米AI的小紅書爆款筆記工具。目前,小紅書沒有開放數(shù)據(jù)端口,但這款A(yù)gent像人一樣,搜索,瀏覽與抓取小紅書上的旅游內(nèi)容,最后生成AI旅游攻略。

這些Agent的搭建往往需要數(shù)小時(shí)到幾天不等,相較于APP開發(fā)數(shù)月的周期,大幅縮短了開發(fā)時(shí)間,并且搭建使用的語言不是代碼而是自然語言。

一個(gè)人人皆可設(shè)計(jì)產(chǎn)品的時(shí)代正在到來。

以下是成峰的講述(有刪減):

給媽媽做一個(gè)高德MCP

給媽媽做一個(gè)高德MCP

我開發(fā)MCP的需求,還是從個(gè)人出發(fā),因?yàn)槎际亲约航?jīng)歷的場(chǎng)景,所以就嘗試使用AI去解決問題。

今年“五一”期間,我用了一晚上,做了一個(gè)“高德地圖長輩版”的應(yīng)用,方便長輩們出行打車。

我的老家在溫州,家中長輩需要在溫州和杭州之間往返,他們可能會(huì)有一些交通問題,有時(shí)候還帶著孩子,打車就比較困難,比如用滴滴打車或者高德地圖,他們需要去找收藏,得找半天,因?yàn)檫@些應(yīng)用的收藏按鈕很小,有時(shí)候根本找不到。

后來,我就想把它做成一個(gè)網(wǎng)頁按鈕,放在手機(jī)屏幕上,家里人一點(diǎn)擊,就可以直接調(diào)用出發(fā)和目的地,打開高德地圖,直接打車。

“媽媽出行地圖”Agent的工作流 來源:受訪者
打開網(wǎng)易新聞 查看精彩圖片
“媽媽出行地圖”Agent的工作流 來源:受訪者

其實(shí),對(duì)于大部分人來說,怎樣去溝通一件事情,怎樣去表達(dá),他其實(shí)沒有概念。我們跟大模型一樣,需要通過不斷對(duì)話,去校準(zhǔn)經(jīng)驗(yàn),然后達(dá)到一個(gè)結(jié)果。但是搜索(移動(dòng)互聯(lián)網(wǎng)產(chǎn)品)本身沒有這樣的功能,全靠用戶第一次輸入的準(zhǔn)確性。

在“五一”前一周,我還做了故宮和浙江省博物館AI導(dǎo)游。這源于我去西藏旅游的經(jīng)歷,導(dǎo)游只管自己跑,基本不會(huì)給游客講解,我的體驗(yàn)比較差。我就用MiniMax的MCP加上Cursor(AI代碼編輯器,功能是輸入需求表達(dá),自動(dòng)生成代碼)做了這款產(chǎn)品。

我用最簡單的產(chǎn)品工具去開發(fā),用自然語言表達(dá),不到一周時(shí)間就做出來了。

其實(shí),AI導(dǎo)游這一塊還有一些缺失,因?yàn)樾畔]那么健全,如果博物館開放數(shù)據(jù),做出的產(chǎn)品體驗(yàn)會(huì)更好一點(diǎn)。

有些旅游達(dá)人,他堅(jiān)決不用智能體,全靠自己做攻略。我覺得用戶和用戶之間是不一樣的,有A用戶有B用戶,使用習(xí)慣是不一樣的。

旅游達(dá)人擔(dān)心“刷好評(píng)”以及不真實(shí),其實(shí)還是抓數(shù)據(jù)源的問題,他能不能讓AI抓到差評(píng)的數(shù)據(jù)源。比如,大眾點(diǎn)評(píng)和小紅書比較難去抓,其實(shí)還是AI能力的問題,能力健全以后,AI能夠自己去抓那些評(píng)論,然后把評(píng)論匯總給用戶看的話,它能夠解決蠻多問題的。

這也是當(dāng)前Agent存在的問題,就是產(chǎn)品之間的墻,我想去抓它的數(shù)據(jù),但抓不到?,F(xiàn)在只能說,這一塊的業(yè)務(wù)沒辦法做。如果MCP未來的收益足夠大,肯定會(huì)有第三方或者第四方推動(dòng)這個(gè)問題的解決。

我跟某大廠的內(nèi)部朋友聊過,如果依賴自己去做這件事情,內(nèi)部阻力還蠻大的,因?yàn)樗麄儧]有人敢去下賭注,那些高層領(lǐng)導(dǎo)可能對(duì)AI并沒有那么了解,他們也不愿意腳踏實(shí)地地去用一用。

Manus的忠實(shí)用戶

Manus的忠實(shí)用戶

我在2023年開始接觸AI編程,那時(shí)候GPT-4出來了,我自己寫一些小工具,到了2024年底,開始做一些小程序,到了今年,出現(xiàn)了MCP這個(gè)概念,加上Manus產(chǎn)品,我看到了肖弘,我覺得Agent是一個(gè)比APP更大的市場(chǎng)。

我試用過Manus,的確很流暢,比如你給他一個(gè)任務(wù),首先,它會(huì)分析你的意圖是什么,然后,它就會(huì)有一個(gè)任務(wù)規(guī)劃,它會(huì)給你一個(gè)執(zhí)行表,它每做完一項(xiàng)就去勾一下,最后,它會(huì)用比較好的框架去展示結(jié)果。

來源:視覺中國
打開網(wǎng)易新聞 查看精彩圖片
來源:視覺中國

我對(duì)肖弘團(tuán)隊(duì)印象比較深的是這句話:“AI Should use browser,not in browser,The browser should be in cloud.(AI需要用瀏覽器,但不是在瀏覽器里面用,它應(yīng)該在云端用)?!?/p>

就像我們現(xiàn)在玩手機(jī),其實(shí)都在用我們的眼睛。視覺層面的時(shí)間已經(jīng)給占用很多了,在視覺背后,還有很多空間可以去挖掘,比如,我們以前在看抖音時(shí),背后其實(shí)可以有很多智能體幫我們?nèi)ネ瓿扇蝿?wù),它的背后可以是無限的時(shí)間。

目前,杭州的MCP開發(fā)者是有一個(gè)圈層,但比較小,人數(shù)規(guī)模還比不上扣子(字節(jié)跳動(dòng)的AI Bot開發(fā)平臺(tái),于2024年2月上線)的開發(fā)者,原因在于它能夠商業(yè)化,比如一些企業(yè)已經(jīng)可以用扣子做一些生成圖片、寫文章的任務(wù)。

扣子排行榜前幾個(gè)Agent還挺有意思的,比如抓取一些小紅書的數(shù)據(jù),抓飛書的一些數(shù)據(jù),對(duì)于一些企業(yè)很有用。

目前,MCP或者部分智能體尚未形成成熟的商業(yè)化模式,其實(shí),對(duì)Agent來說,MCP只是其中的一個(gè)點(diǎn),它也不一定能做起來,但目前來看,它屬于其中一個(gè)臺(tái)階,未來可能會(huì)有比MCP更好的產(chǎn)品,但就目前來說,我個(gè)人覺得MCP是里面做得最好的。

我未來會(huì)以智能體為職業(yè)方向,現(xiàn)在商業(yè)化還不成熟,是因?yàn)樯鷳B(tài)不成熟,智能體的方向不會(huì)變,但可能智能體的形式會(huì)變。

未來,對(duì)純智能體的話,它可能還會(huì)面臨幾個(gè)挑戰(zhàn),第一個(gè)就是算力,如果像Manus那樣,它需要一個(gè)非常大的虛擬機(jī),其實(shí)核心還是算力以及算力的成本。第二,就是大模型本身的突破,我本身不會(huì)去看到底哪個(gè)大模型做了什么功能,我始終去抓最好的大模型調(diào)用。

我現(xiàn)在社交媒體做了幾個(gè)賬號(hào),全網(wǎng)粉絲超過了5000人,但我還是希望能做一個(gè)產(chǎn)品。

社交媒體是一個(gè)收集用戶反饋的渠道,在此之前開發(fā)產(chǎn)品,去做用戶訪談成本會(huì)比較高。此外,我們也可以做成一個(gè)賬號(hào),可以用其他方式來盈利,這樣,當(dāng)你未來有一個(gè)新的產(chǎn)品,你相當(dāng)于有一個(gè)宣發(fā)平臺(tái),能給你做冷啟動(dòng)。