



上周,一款號稱“全球首款真正意義上的通用AI Agent”的軟件Manus迅速走紅互聯(lián)網(wǎng),被稱為是第二個“DeepSeek時刻”。然而在不到一天的時間內(nèi),針對該軟件的評論迅速出現(xiàn)分化,形成三個陣營。
支持者認為,在Manus官網(wǎng)展示的旅途規(guī)劃、股票分析、面試安排等工作,可以自動使用搜索引擎查詢、下載數(shù)據(jù),閱讀PDF文檔,使用Python進行數(shù)據(jù)分析與可視化操作,甚至能夠啟動電子郵件客戶端,撰寫郵件并自動發(fā)送。大語言模型始終離不開它的對話框,而Manus則可以讓AI真正開始干活了,一個全新的AI時代,似乎正以不可阻擋之勢到來。
與此同時,對Manus也不乏質(zhì)疑者,其主要觀點是,Manus的各項技術(shù)并非首創(chuàng)或獨有,更像是一個融合各種技術(shù)的“套殼”軟件。其次,Manus目前并未完全開放,網(wǎng)絡(luò)上的大量報道,只是復(fù)述了官網(wǎng)公開的演示視頻,不能代表Manus在真實環(huán)境下的使用體驗。
亦有少數(shù)用戶號稱拿到了Manus的邀請碼并撰寫了體驗報告,其中可信度較高的是劉潤在其公眾號發(fā)布的一篇文章——《拿到Manus的邀請碼之后,我趕緊問了4個問題》。從劉潤的體驗看,Manus的確具有較強的自動化水平,無論是使用搜索引擎、分析數(shù)據(jù),還是生成PDF都可以有效完成。但是在執(zhí)行過程中,依然存在瑕疵。如當搜索不到指定內(nèi)容時,Manus會生成模擬內(nèi)容來完成任務(wù)(有趣的是Manus會告知用戶,最終結(jié)果是模擬內(nèi)容)。這類用戶對Manus的態(tài)度相對中立,認為其現(xiàn)階段不夠成熟,仍需繼續(xù)發(fā)展。
Manus之所以能夠引爆網(wǎng)絡(luò),原因在于相比于底層的大語言模型,應(yīng)用層的AI智能體可以適配更加豐富的應(yīng)用場景、產(chǎn)生更多創(chuàng)新性的產(chǎn)品。如同在移動互聯(lián)網(wǎng)時代,雖然我們?nèi)狈Φ讓拥陌沧俊OS等操作系統(tǒng),但是在移動App上我們涌現(xiàn)出諸如微信、滴滴、抖音等超級App。雖然有些App的功能并非原創(chuàng),但依靠龐大的國內(nèi)市場需求,以及在商業(yè)模式上的創(chuàng)新,我國在移動App的競爭中不乏優(yōu)勝者。
與移動互聯(lián)網(wǎng)時代類似,AI時代大語言模型注定是寡頭之間的游戲。而對于技術(shù)和資本投入要求相對較低,面向各個領(lǐng)域應(yīng)用的AI智能體,則蘊藏著豐富的創(chuàng)業(yè)機會。美國麻省大學(xué)羅威爾分校孫黎教授,將這種優(yōu)化產(chǎn)品或服務(wù)的效率或成本、結(jié)合場景的創(chuàng)新,稱為可負擔(dān)創(chuàng)新(Affordable Innovations),更適合初創(chuàng)企業(yè)的快速崛起。

AI智能體是什么
批評Manus的觀點之一是,作為一個AI智能體,Manus沒有自己的大語言模型,這意味著它不過是一個“套殼”軟件。針對這一批評,公司聯(lián)合創(chuàng)始人季逸超并不諱言Manus采用了基于Claude和阿里千問(Qwen)的大語言模型技術(shù)。
從AI智能體的定義看——“AI智能體是一種能夠感知環(huán)境、自主決策并執(zhí)行任務(wù)的人工智能系統(tǒng)。它通常被設(shè)計為在特定或多種場景中獨立運行,以實現(xiàn)特定目標或完成復(fù)雜任務(wù)。”與大語言模型只能通過對話交互返回結(jié)果不同,AI智能體可以完成具體的任務(wù),如行程安排,AI智能體不僅能夠制定日程,還能操作App或者登錄網(wǎng)站,直接預(yù)定機票和酒店。通過它編寫程序,則可以直接生成一個編譯好的可執(zhí)行文件。
之所以能夠?qū)崿F(xiàn)上述功能,是因為AI智能體一般包括四個組成部分(圖 1),分別是:
1. 大語言模型(LLM):它是AI 智能體的“大腦”,負責(zé)協(xié)調(diào)決策。它通過任務(wù)進行推理、規(guī)劃行動、選擇適當?shù)墓ぞ撸⒐芾韺崿F(xiàn)目標的必要數(shù)據(jù)的訪問。
2. 規(guī)劃模塊(Planning Modules):規(guī)劃模塊使AI智能體能夠?qū)?fù)雜任務(wù)分解為可作的步驟。
3. 內(nèi)存模塊(Memory Modules):AI智能體依靠內(nèi)存來維護上下文,并適應(yīng)正在進行的或歷史任務(wù)。這是AI智能體能夠持續(xù)運行分解任務(wù)的關(guān)鍵。
4. 工具(Tools):AI代理本身可以用作工具,但它們也可以通過與外部系統(tǒng)集成來擴展其功能,例如:
(1)API:訪問實時數(shù)據(jù)或以編程方式執(zhí)行作。
(2)數(shù)據(jù)庫和RAG管道(RAG pipelines):檢索相關(guān)信息并確保準確的知識庫。
(3)其他AI模型:與其他模型協(xié)作完成專業(yè)任務(wù)。
因此,智能體并不需要擁有一個自有大語言模型,而是整合相關(guān)技術(shù),提供一個完整的解決方案。如果我們以熟悉的汽車行業(yè)的例子類比,大語言模型是發(fā)動機,AI智能體則是整車。

圖 1 AI智能體架構(gòu)及代表產(chǎn)品示意圖

AI智能體,有沒有護城河?
在Manus引爆媒體之后的數(shù)小時內(nèi),另一個AI開發(fā)團隊——MetaGPT,在GitHub上開源了功能與之類似的OpenManus軟件。
這不禁讓人思考,AI智能體有沒有護城河?
護城河理論源自于邁克爾·波特分析企業(yè)面對競爭時的五種力量(圖 2)。

圖 2 波特五力模型
AI智能體的供應(yīng)商主要是大語言模型廠商。從目前的產(chǎn)業(yè)生態(tài)看,雖然以DeepSeek、阿里千問為代表的開源模型性能已取得極大的發(fā)展,但與頭部閉源的大語言模型,如ChatGPT、Claude、Gemini相比,仍有一定的差距。由于大語言模型廠商逐漸呈現(xiàn)寡頭市場的趨勢,相對AI智能體企業(yè),大語言模型廠商的議價能力仍然較強。當前大語言模型廠商主要以API的形式出售Tokens,對于下游廠商,也未使用歧視性的定價策略。對于AI智能體廠商而言,短期內(nèi)成本亦相對可控。
從潛在進入者看,大語言模型廠商最有可能開發(fā)AI智能體。但當前大語言模型廠商的主要精力聚焦在提升大語言模型的智能和性能,尚無暇顧及向下游的AI智能體延伸。從技術(shù)門檻看,大語言模型廠商進入AI智能體市場,對智能體廠商而言可能是降維式的技術(shù)整合優(yōu)勢,如Open AI的Deep Research。與大語言模型深度整合的全功能智能體,可能是普通AI智能體公司最難挑戰(zhàn)的競爭對手。
其次是以微軟、蘋果為代表的操作系統(tǒng)、手機/電腦終端廠商,它們雖然沒有自有大語言模型,但掌握著系統(tǒng)級的入口,憑借與操作系統(tǒng)或終端設(shè)備系統(tǒng)級的整合,在通用智能體或個人助理類智能體領(lǐng)域(如微軟的Copilot),可能有擁有較為明顯的優(yōu)勢。
從用戶(買方)端看,AI智能體還沒有大型廠商出現(xiàn),用戶選擇余地較多,議價空間大。而且用戶長期養(yǎng)成了免費使用互聯(lián)網(wǎng)產(chǎn)品的習(xí)慣,除非AI智能體能為用戶帶來極為明顯的價值增加,否則很難向用戶收費。
在替代品方面,AI智能體尚處于發(fā)展早期,在技術(shù)未出現(xiàn)明顯變革的情況下,暫時沒有替代品的威脅。但由于AI智能體開發(fā)的技術(shù)難度并不高,行業(yè)內(nèi)的同質(zhì)化競爭預(yù)計會非常激烈。

互聯(lián)網(wǎng)的經(jīng)營思維,可能不適用于AI智能體
從產(chǎn)業(yè)角度看,AI智能體很難形成自己的護城河。那么互聯(lián)網(wǎng)時代所推崇的數(shù)據(jù),能否構(gòu)成AI智能體的護城河呢?
數(shù)據(jù)之所以能成為互聯(lián)網(wǎng)公司的護城河,原因在于數(shù)據(jù)能夠為公司帶來用戶增長。吉姆·柯林斯將這種增長模式稱為“飛輪效應(yīng)”。如圖 3是一個典型的互聯(lián)網(wǎng)企業(yè)(Uber)的增長飛輪。如圖所示,Uber上注冊的司機越多,接單速度就越快,這會刺激更多的用戶注冊為Uber會員,帶來更大的需求。需求的擴大,會刺激更多的司機加入平臺,Uber則可以覆蓋更多的服務(wù)面積。而同時Uber擁有更多的數(shù)據(jù),可以用來改進車輛調(diào)度算法,進一步提升平臺的效率,用戶等待時間更短、價格更實惠,這會刺激更多用戶的加入,需求的擴大又再次吸引司機加入,形成一個不斷增長的飛輪。

圖 3 Uber的增長飛輪
由此可見,增長飛輪的生效,需要企業(yè)處于雙邊市場,即一方(買方或賣方)參與者的收益,取決于該平臺另一方參與者的數(shù)量。企業(yè)只需要刺激一方參與者的數(shù)量增加,就會帶動整個平臺的繁榮。
但AI智能體不屬于雙邊市場,用戶在一個AI智能體使用的時長越多,這個智能體會越懂用戶,帶來單個用戶的使用時長的增加,但對其他用戶并不會帶來更好的價值。因此數(shù)據(jù)不會為AI智能體企業(yè)帶來用戶數(shù)量的增長,增長飛輪無法跑通。
盡管有所爭議,但不可否認,運用互聯(lián)網(wǎng)思維的確誕生了一批高增長企業(yè)?;ヂ?lián)網(wǎng)思維的核心是盡可能擴大企業(yè)規(guī)模,實現(xiàn)網(wǎng)絡(luò)效應(yīng),即便早期虧損,企業(yè)通常也在所不惜。在互聯(lián)網(wǎng)思維中起到根本作用的是網(wǎng)絡(luò)效應(yīng),即網(wǎng)絡(luò)價值與網(wǎng)絡(luò)節(jié)點數(shù)量的平方成正比。網(wǎng)絡(luò)效應(yīng)發(fā)揮作用的前提是,網(wǎng)絡(luò)上的各個節(jié)點能夠互動。最典型的例子就是社交網(wǎng)絡(luò)。但AI智能體的用戶,似乎并不存在交流互動,網(wǎng)絡(luò)效應(yīng)難以發(fā)揮作用。
所以我們看到目前AI智能體,甚至大語言模型都是基于銷售Tokens的模式,與傳統(tǒng)貨品銷售并無本質(zhì)上的區(qū)別。當前AI智能體的Tokens消耗量較高,要實現(xiàn)盈利,非??简灩旧虡I(yè)模式的設(shè)計能力。據(jù)智東西3月7日報道,一位用戶測試使用Open Manus回答“杭州哪些醫(yī)院支持異地醫(yī)保直接結(jié)算?”這一問題,消耗Claude 3.7模型的Tokens約為24萬,大約相當于36萬~48萬個中文字符,花費3.6美元。如果按照這個成本定價,對AI智能體企業(yè)而言,產(chǎn)品使用費用將非常高昂,預(yù)計很難吸引到用戶付費使用。如何設(shè)計企業(yè)的盈利模式,可能是擺在AI智能體企業(yè)面前的一道難題。

to B還是to C?
一般而言,企業(yè)通常愿意為服務(wù)付費,to B業(yè)務(wù)能夠讓創(chuàng)業(yè)企業(yè)獲得較為穩(wěn)定的現(xiàn)金流。但是to B業(yè)務(wù)一般不會出現(xiàn)爆發(fā)式的增長,追求高成長的AI智能體企業(yè),可能會選擇to C的業(yè)務(wù)模式。
AI智能體的創(chuàng)業(yè)者,選擇面向企業(yè)的to B業(yè)務(wù),還是選擇面向個人的to C業(yè)務(wù)?
在回答此問題之前,我們不妨先看Manus的一個演示案例。筆者選取了Manus官網(wǎng)上,分析特斯拉股票這個示例操作。與通常部署在用戶本地的開源AI智能體不同,Manus采用了在云端虛擬機運行的方式。圖 4展示了部分分析過程,我們可以看到操作過程主要是在基于Ubuntu的Linux虛擬機中建立相應(yīng)文件,編寫Python程序執(zhí)行分析等。

圖 4 Manus分析特斯拉股票的部分操作步驟
Manus采用云端虛擬機的方式,可能是因為,目前智能體執(zhí)行操作大量依賴臨時生成的Python程序文件,這對用戶操作系統(tǒng)和開發(fā)環(huán)境有較高的要求。筆者嘗試在本地部署開源的Open Manus,在生成Python程序時遇到多次報錯,通過手動排錯才使工作流順利完成。當前大語言模型的能力,還不足以一次性生成可用的程序,直接部署到用戶端,難以保證執(zhí)行效果。Manus提供的虛擬機,則可以由公司事先配置好虛擬機的操作系統(tǒng)和各類開發(fā)環(huán)境,以保障任務(wù)能夠得以正確的執(zhí)行。
但是這種模式下,企業(yè)的算力負擔(dān)很重,虛擬機需要大量的硬件資源開銷。根據(jù)少量獲得邀請碼的用戶測試,即便很簡單的任務(wù),Manus依然需要數(shù)小時才能完成。因此從當前的技術(shù)需求看,to C的智能體,無論是新增用戶,還是收費模式,都有較大的挑戰(zhàn),如果沒有龐大資金的支持,to C智能體在盈利之前,就因耗盡資金而失敗。
而對企業(yè)來說,則更愿意為服務(wù)付費。這可以類比開源軟件公司RedHat,雖然公司的產(chǎn)品Linux系統(tǒng)本身免費,但公司通過銷售軟件服務(wù),在2016年成為全球第一家銷售額超過20億美元的開源軟件公司。2018年IBM以340億收購RedHat公司,是截至該年度美國科技史上的第三大交易。
因此,從短期內(nèi)看,面向企業(yè)端的AI智能體似乎更容易生存。
盡管當前AI智能體仍處于早期發(fā)展階段,但如同移動互聯(lián)網(wǎng)的時代一樣,我們無法預(yù)測Uber、滴滴、微信這樣的原生商業(yè)模式;也未曾預(yù)測到誕生在PC時代的淘寶,以“All in無線”創(chuàng)造增長神話。
無論Manus是否曇花一現(xiàn),它的出現(xiàn)至少將AI智能體引入大眾視野,引起了投資人、企業(yè)家的關(guān)注。移動互聯(lián)時代,我們誕生了一批比肩世界的超級App,AI時代會產(chǎn)生哪些創(chuàng)新,我們將拭目以待。
資料來源鏈接:
圖1: https://www.madrona.com/ai-agent-infrastructure-three-layers-tools-data-orchestration/
圖3: https://www.woshipm.com/share
/5987614.html
圖4: Manus官網(wǎng)



熱門跟貼