本文系基于公開資料撰寫,僅作為信息交流之用,不構成任何投資建議。

打開網易新聞 查看精彩圖片

Manus成為AI頂流,似乎只用了一個晚上,另加一場不那么正式的發(fā)布會。一個邀請碼在某魚已經炒到了5萬。不用想,現在最慌的有兩批人——投資人,以及大廠。

Manus神奇在何處,是虛火炒作,還是貨真價實?

01

它可以做什么?

它可以全自主完成一個針對特斯拉的財報分析報告,也可以幫你生成一個完全可以正常交互的網站,甚至可以做一款可以直接上手玩的RPG游戲——它可以搭建開發(fā)環(huán)境,自行寫代碼,自己debug,自行編譯。

如果你想做一個地區(qū)人口調研報告,Manus還可以自己訪問數據庫和自己搜索決定該用什么數據來完成。

Manus幾乎可以通過一個prompt來完成一個復雜的分析項目。官網顯示,在AI agent的評測標準GAIA benchmark基準下,其表現更是高于OpenAI的 DeepSearch。

筆者分析了用戶在推特和國內社媒上發(fā)布的使用案例,從執(zhí)行過程來看,完全比肩DeepSearch,每個流程的執(zhí)行代碼、產出文件都完全可見,分門別類整理好等待用戶檢閱。就特斯拉和英偉達的財報分析和估值結果來看,不遜色于雪球各種大V。

筆者覺得其中最為驚艷之處是,Manus通過自己搭建的虛擬電腦來執(zhí)行數據獲取、計算、開發(fā)環(huán)境搭建和測試等一系列硬核環(huán)節(jié),這幾乎將用戶從復雜的基礎工作中解放出來,一個新人完全可以零幀起手進入工作。

02

背后的團隊

Manus引發(fā)如此大的聲量,除了其超高質量的產出,作為土生土長的國內團隊作品也是引燃社媒聲量的一個引線。AI領域,國內團隊的步伐和美國集結了全球人才的夢之隊相比,似乎并沒有落后。

我們了解到,Manus是國內AI創(chuàng)業(yè)團隊Monica AI的另一產品。Monica AI是一款AI chatbot產品,不同于國外處于原生狀態(tài)的chatbot,Monica AI 并非僅僅提供一個模型使用入口,而是通過提供大量垂直向可以直接使用的API接口,用戶不需要擔心prompt調優(yōu),上手即可使用。

創(chuàng)始人肖宏在這樣一款模式簡單的chatbot產品上,已經意識到了大模型和用戶之間交互方式的局限性。即,模型是優(yōu)秀的和具備一定“超能力”,可以在一系列陰道調教下,完成一個復雜的項目。

但由于chatbot直接將用戶和大模型對接上,使得要完成某個任務的用戶,只能分批次將任務通過1v1對話讓模型分步驟產出。甚至,用戶可能都無法確認輸入給模型的token是否是這個任務最優(yōu)的方案。

Manus讓人們繼續(xù)在對話框中,一步到位解決更復雜需要更高智能的任務了。站在這個角度考慮,Manus似乎更像是一個多個經過規(guī)劃后的AI 任務集合。

團隊刻意忽略顯示大模型神奇之處,轉而站在用戶角度,思考如何通過發(fā)揮模型的優(yōu)勢來完成日常任務。這是務實又珍貴的探索。

Manus的故事。讓人們看到了連續(xù)創(chuàng)業(yè)者對用戶需求的精準把握能力和團隊的超強執(zhí)行力。至于AI所需要的團隊技術實力如何,我們稍后再講。

03

產品的亮點

通過接近Manus團隊的自媒體《賽博禪心》的文章透露,單條任務的成本在2美金左右是Deep Search的1/10。基于Claude 3.7 Sonet和國內的Qwen模型基礎上,增加了自己的訓練過程,這點是毋庸置疑的,創(chuàng)始人在播客訪談中透露,即使在做Monica的時候,他們也并不是僅僅作為prompt中轉站,直接將用戶的需求扔給模型,而是增加了產品調優(yōu)過程的。

就像一個天賦異稟骨骼清奇的練武奇才,需要經過后天的努力才能成為笑傲江湖。

Manus 任務自主規(guī)劃、思考和完成能力來自其混合模型的架構?;赾laude 和Qwen,并非任務的某一個環(huán)節(jié)基于claude,另一個環(huán)節(jié)基于Qwen,manus打破了模型的“結界”,讓每個模型完成自己擅長的任務環(huán)節(jié)。

多個大模型混合+manus虛擬云端執(zhí)行環(huán)境,實現了讓用戶只需要一次性敲鍵盤就可以完成往常chatbot多輪對話都未必能完成的復雜需求。

關于Mmanus執(zhí)行過程的猜測:

《賽博禪心》在其文章中提到的“工程驅動創(chuàng)新”一詞,猜測Manus的任務執(zhí)行過程中,運用了大量工程手段加模型能力來完成任務。結合多個社媒的案例分享,我們對manus的運行機制做了簡單猜測。

通過大模型(這一步猜測是Qwen)對于輸入進行分析后,首先確定任務類型,manus內部對于輸入應該有一個類目劃分,如編程任務、多模態(tài)內容生成、任務規(guī)劃類、建議咨詢類等等。其次,如輸入語言是英文,猜測可能任務執(zhí)行也以Claude為主。

具體到任務執(zhí)行層面,猜測過程如下:

1.接收到一個輸入后,大模型會首先進行任務分類,決定后續(xù)任務執(zhí)行的模型選擇;

2.之后大模型將輸入拆解成多個帶有層級關系、優(yōu)先級和執(zhí)行順序的子任務;

3.按序執(zhí)行以后,上級任務的輸出,成為下個任務的輸入;

4.多個任務產出合并成一個最終分析結果。

對于每個子節(jié)點選擇什么模型來執(zhí)行,我們猜測,如果是編程任務后面執(zhí)行以Claude為主,如果是中文決策建議類就以Qwen為主;根據子節(jié)點的任務復雜度,執(zhí)行過程中單一任務甚至可能是Qwen和Claude混合,然后再用模型進行效果對比,最終選擇保留效果最佳的一個。

從上述的分析可見,初始需求的輸入質量決定了后續(xù)的任務類型判斷,以及子節(jié)點規(guī)劃和執(zhí)行效率,所以manus對于輸入的質量要求很高,通常需要用戶詳細和完整的描述需求內容(越詳細越好)。

這可能會成為Manus被詬病的一點,畢竟一個輸入的執(zhí)行是漫長的,如果僅僅因為描述不夠清晰詳細而導致時間和算力的浪費,會嚴重影響產品體驗,屬于產品的不成熟,相信未來團隊會改善這一點,畢竟一次任務執(zhí)行就要花費一杯奶茶錢呢。

04

當前的問題

從2022年到2025年,經歷了三年多的大模型風口一輪輪的認知沖擊。人們對于大模型產品的使用體驗,已經基本走過了“AHA Moment”決定產品去留的階段。一個大模型產品,在效果驚人的基礎上,還必須要穩(wěn)定、要快,才能長久抓住用戶。

效果穩(wěn)定性

回頭看manus,鑒于我們的Manus賬號尚在wishlist,從推特和國內社媒的使用者反饋來看,略不同于DeepSeek的眾人交口稱贊,用戶對Mansu的產出穩(wěn)定性很不樂觀,甚至有不少弄錯事實,讓人啼笑皆非的環(huán)節(jié)。

如果執(zhí)行中一個任務的數據或者事實用錯了,就會導致最終產出變得不可信,從而浪費這2美元的成本。

算力

除了效果不穩(wěn)定,單任務執(zhí)行時間過長也是被詬病了另一個點,盡管Manus已經展示出了其任務執(zhí)行邏輯和過程,但留給用戶的仍然有漫長的等待,一個用戶發(fā)推說,自己的任務執(zhí)行了4-5個小時。

這背后是團隊對使用量的低谷,以及Manus本身架構無法產生的大量算力需求。除以意外,用戶已經被各大模型養(yǎng)刁了口味,習慣了分分鐘出結果的體驗,對于長達數小時的等待自然無法容忍。

其實,Manus如果能給用戶一個可預見的完成時間,也許可以減少等待的焦慮。畢竟對于一個復雜的分析任務,即使執(zhí)行時間長達2-3個小時甚至半天的時間,恐怕也比現實中初級員工要快的多。

技術能力

如果說,算力可以通過加卡來完成,那么團隊技術能力可能短時間很難補齊。且不去對比DeepSeek那樣的夢之隊,Manus的技術儲備可能更適合做一款日活百萬級左右的用戶端產品。

連續(xù)創(chuàng)業(yè)者出身的團隊可能優(yōu)勢更在于需求發(fā)現,并在短時間內手搓出一個可以上線使用的產品,但用戶量大了怎么辦?需要技術升級是怎么辦,這些都是需要長時間解決的問題。當前Mansu的用戶吐槽套殼和運行速度太慢,任務卡頓就是這個問題的外在體現(團隊的道歉信中我們也看到他們沒想到這款產品這么出圈)。

Manus有了一個優(yōu)秀的起步基礎,有善于發(fā)現和抓住用戶需求的創(chuàng)始團隊來把我研發(fā)方向,但還需要更多AI人才來讓manus成長的更快更穩(wěn)定。畢竟目前的產品現狀,內行人使用幾次之后就能大概了解產品架構,被大廠拷貝一個出來是沒什么難度的。


05

Manus初步證明AI Agent的另一條路

市面上的Agent產品有2個方向,通用型和垂直應用型。前者中知名度最高的2個產品,是來自2個大模型廠商OpenAI的"Operator"和Anthropic 推出的 “Computer Use”。這個方向可以說是通用型Agent的代表。

Anthropic的Agent軟件是通過一個特殊的API,開發(fā)者可以知道Claude 模型來完成各種計算機基本的輸入、打開文件等基本操作任務;OpenAI則是在此技術上擴大硬件調用范圍允許通過API接口,在個人電腦上完成編程、預定旅行和購物等操作。國內智譜的AutoGLM在運行模式上類似OpenAI的"Operator"。

垂直Agent,典型代表為cursor和devin。這兩款agent產品在程序員中口碑很好,但遺憾的是應用領域窄很難推開來。

Manus創(chuàng)始人肖宏在一則訪談中也表達了垂直和通用相比,顯然后者更具有普世價值,但前者更快走入了應用。從實際情況看,我們周圍不少程序員朋友在用cursor編寫基礎代碼了。

Manus定位為一款通用型AI agent。通過工程手段實現Agent架構創(chuàng)新,將復雜的工作流程封裝在一個云環(huán)境上,融合多個大模型,通過任務規(guī)劃來自動完成子節(jié)點需求處理,產出的是一個往常需要經過多輪人機對話才能完成的復雜任務。

Manus達到了在部分任務上超越OpenAI DeepSearch的效果,代表了Agent的另一條可以選擇的路。

通用型agent產品,不可能依靠單一大模型實現,并且天然就是第三方開發(fā)者的使命。

畢竟OpenAI和Anthropic的agent,幾乎不太可能通過競對的模型來實現,這就決定了他們的產品研發(fā)進度和工程手段無法和第三方相比。

同時Manus的應用范圍相比通用型產品更加落地,相比垂直型有更廣闊的應用領域。通用型agent所宣傳的幫助用戶購票、規(guī)劃形成以及電商購物的一系列操作,用戶自己操作也毫無門檻。但完成一個特斯拉財報分析報告,就需要很高的門檻了。通常有門檻的產品,其商業(yè)價值就更高。

互聯網界一直將AI Agent和通用型AGI鎖定起來,但Manus的出現告訴人們,即使尚未達到AGI,但 who cares,對普通用戶來說能完成任務的同志才是好同志。

05

三重啟示

一,有了AI助力,更需要獨立決策能力

即使今天和不遠的明天Manus仍不能變成廣泛使用的agent產品,我們也能從不斷涌現的類似產品中明白看到一個核心問題,即獨立思考和創(chuàng)新能力未來會是一個人的核心能力。

AI的確能幫人們做很多事,幫你分析實驗結果、做實驗報告,幫你完成案頭材料撰寫等等,但AI不會幫你做實驗,AI不會幫你想一個分析該從哪個點切入才能讓結果看起來更有亮點。

我們毫不懷疑在AI的介入下,人和人的差距會越來越大。

二、第一手消息更換了來源

上個互聯網風口2010年前后,扮演攪動風云角色的是各大科技媒體,除了四大傳統互聯網門戶網站外,垂直領域科技媒體也起了舉足輕重的作用。AI風口前,創(chuàng)業(yè)企業(yè)新的動向往往來自自媒體、而后經過社媒發(fā)酵,再被全民皆知。

“古典”時代,只要和記者保持溝通就不會錯過重要行業(yè)動態(tài),但來到AI時代,投資人經常陷于被動,對突然冒出來的科技新秀一無所知。

不少風投機構通過設立孵化器來自己培養(yǎng)創(chuàng)業(yè)企業(yè),但概率不理想,也很少有爆品產生。如何在一個社媒發(fā)酵模式下,抓住潛在甚至冒尖的機會,是機構面臨的新課題。

三、大廠怎么辦

DeepSeek一枝獨秀的模型效果加開源殺手锏,將字節(jié)、騰訊、百度等大廠從技術潮頭絀落。Manus又邁出了通用型agent走進現實的第一步,又領先了大廠。這里我們都不敢將Manus的研發(fā)成本和大廠成本作對比,恐怕屆時將是對大廠的羞辱。

Agent,跟還是不跟?

參考資料

張小珺Jùn|商業(yè)訪談錄:
https://www.xiaoyuzhoufm.com/episode/67c3d80fb0167b8db9e3ec0fhttps://pan.baidu.com/s/1KkGRdYdkf84vJygkFk2J5Q?pwd=n15q#list/path=%2F

賽博禪心:
實測 Manus:首個真干活 AI,中國造(附50個用例 + 拆解)https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==&mid=2247498251&idx=1&sn=f3a81f0f2a0f54c89ed51b2951b07da2&scene=142

賽博禪心:
關于 Manus 的一些獨家信息

manus使用分享
https://manus.im/share/hRGARE7EBqtDhLHBGISLP7?replay=1