文 | 大模型之家

“未來(lái)數(shù)年,數(shù)以百萬(wàn)計(jì)的AI智能體(AI Agent)將構(gòu)建全新經(jīng)濟(jì)生態(tài),推動(dòng)全球產(chǎn)業(yè)格局進(jìn)入‘智能體密度競(jìng)爭(zhēng)’時(shí)代”,這一預(yù)言在2025年正在加速照進(jìn)現(xiàn)實(shí)。

大模型之家注意到,自今年1月24日OpenAI發(fā)布全球首個(gè)AI智能體?Operator,到智譜?推出智能體框架?GLM-PC 1.1?;再到Monica團(tuán)隊(duì)推出通用AI智能體??Manus,字節(jié)跳動(dòng)正式發(fā)布“扣子空間”(Coze Space)。

AI智能體,作為AI技術(shù)落地的核心形態(tài),正迅速滲透到各類(lèi)生活場(chǎng)景中。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

圖:想讓“扣子空間”生成的封面圖,結(jié)果它沒(méi)做并丟了兩個(gè)網(wǎng)站

其中,最讓打工人心動(dòng)的,莫過(guò)于交給用戶(hù)一條口令,AI智能體就能夠根據(jù)要求完成用戶(hù)所需要的工作,仿佛AI智能體成為了“打工人福音”。

那么,現(xiàn)階段AI智能體,真的能成為打工人福音嗎?

為此,大模型之家主要是對(duì)號(hào)稱(chēng)“辦公室數(shù)字牛馬”的字節(jié)跳動(dòng)“扣子空間”進(jìn)行了全面評(píng)測(cè)。從內(nèi)容領(lǐng)域以及產(chǎn)品性能等方面,扣子空間到底表現(xiàn)如何?

辦公場(chǎng)景應(yīng)用:文檔撰寫(xiě)與表格生成

作為“辦公室數(shù)字牛馬”,第一件事,必須是文檔撰寫(xiě)能力。

大模型之家提出了:撰寫(xiě)一篇關(guān)于上海茶飲行業(yè)近幾年的發(fā)展情況以及投資機(jī)會(huì)分析的研究報(bào)告,并指定輸出格式,它就能自動(dòng)分解任務(wù),按步完成。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

最終“扣子空間”不僅能生成符合要求的 Markdown 文件,還能生成圖文并茂、有數(shù)據(jù)有論述的網(wǎng)頁(yè)文件。此外,它還支持生成 Office文檔、PDF、飛書(shū)文檔等多種格式,滿(mǎn)足不同辦公場(chǎng)景的需求。

在生成飛書(shū)文檔時(shí),系統(tǒng)會(huì)先從文字報(bào)告生成網(wǎng)頁(yè),然后提示用戶(hù)將網(wǎng)頁(yè)內(nèi)容復(fù)制到飛書(shū);而生成 PDF文件或幻燈片 PPT文件時(shí),系統(tǒng)會(huì)直接給出文件下載。

而另外一個(gè)辦公室最常用的“數(shù)據(jù)處理與表格生成”,大模型之家要求“生成包含上證50指數(shù)成分股及其最新收盤(pán)價(jià)的表格”,默認(rèn)情況下,表格會(huì)顯示在網(wǎng)頁(yè)上,同時(shí)系統(tǒng)還會(huì)給出一個(gè)CSV文件供下載。如果需要完備的電子表格功能,用戶(hù)可以將 CSV 文件導(dǎo)入電子表格軟件進(jìn)行進(jìn)一步處理。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

生活場(chǎng)景應(yīng)用測(cè)試:未來(lái)將不存在專(zhuān)業(yè)壁壘

作為一款A(yù)I智能體,功能當(dāng)然不會(huì)只能用來(lái)AI辦公,在一些個(gè)性化服務(wù)上,大模型之家通過(guò)“導(dǎo)入商品信息和用戶(hù)畫(huà)像,結(jié)合購(gòu)買(mǎi)記錄和自然語(yǔ)言訴求”,扣子空間還可以抓取電商平臺(tái)信息推送相關(guān)產(chǎn)品。

在推送的內(nèi)容中,還會(huì)展示產(chǎn)品的基本信息,電商平臺(tái)的用戶(hù)評(píng)價(jià),并提煉總結(jié)給出購(gòu)買(mǎi)建議。省去了之前要跨多個(gè)平臺(tái)進(jìn)行產(chǎn)品比價(jià),以及做攻略的步驟。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

由于MCP擴(kuò)展中大模型之家加入了像“高德地圖”、“墨跡天氣”、“語(yǔ)音合成”等應(yīng)用,所以扣子空間還可以獲取位置、天氣、新聞等信息,生成主播腳本并進(jìn)行音頻合成,為用戶(hù)打造個(gè)性化播客系統(tǒng)。

最讓大模型之家意外的是,在學(xué)習(xí)和娛樂(lè)方面,扣子空間不僅可以生成互動(dòng)式的學(xué)習(xí)網(wǎng)站,幫助用戶(hù)學(xué)習(xí)CSS的oklch 顏色函數(shù);用戶(hù)通過(guò)簡(jiǎn)單的指令即可讓它生成網(wǎng)頁(yè)游戲,滿(mǎn)足娛樂(lè)需求。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

此前像這種需要UI設(shè)計(jì),然后必須懂網(wǎng)頁(yè)代碼才能做出來(lái)的網(wǎng)頁(yè)游戲,如今通過(guò)簡(jiǎn)單的指令,AI智能體3分鐘左右就幫你生成了一個(gè)可以玩的“貪吃蛇游戲”。

此前大家常說(shuō)的“專(zhuān)業(yè)的事交給專(zhuān)業(yè)的人”,可能隨著AI智能體的發(fā)展,會(huì)變成“專(zhuān)業(yè)的事情交給專(zhuān)業(yè)的Agent”。

產(chǎn)品性能評(píng)測(cè):可以實(shí)現(xiàn)全鏈路任務(wù)自動(dòng)化

在產(chǎn)品性能方面,扣子空間基于深度學(xué)習(xí)和 NLP 技術(shù),可自主完成需求解析、工具選擇到結(jié)果輸出的全流程。用戶(hù)僅需提出需求,即可獲得網(wǎng)頁(yè)、PPT、飛書(shū)文檔等完整成果。

其任務(wù)拆解能力支持調(diào)用瀏覽器、代碼編輯器等工具,避免了手動(dòng)配置插件或提示詞工程的繁瑣。例如,在制作采購(gòu)規(guī)劃時(shí),用戶(hù)只需輸入“小米電視 85 – 100 寸的產(chǎn)品,有哪些在售的,幫我整理出一份對(duì)照網(wǎng)頁(yè),重點(diǎn)在尺寸、參數(shù)和價(jià)格,要好看”,大約五分鐘后就能獲得符合需求的結(jié)果,體驗(yàn)流暢。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

大模型之家評(píng)測(cè)發(fā)現(xiàn),扣子空間還獨(dú)創(chuàng)了探索模式與規(guī)劃模式雙軌機(jī)制。探索模式支持快速迭代的輕量級(jí)任務(wù),AI自主動(dòng)態(tài)探索,速度較快,適合時(shí)效性強(qiáng)的任務(wù),如文檔生成。

規(guī)劃模式則針對(duì)多步驟復(fù)雜場(chǎng)景,通過(guò)200B參數(shù)的MoE架構(gòu)模型實(shí)現(xiàn)深度思考與實(shí)時(shí)搜索結(jié)合,AI 會(huì)先進(jìn)行步驟拆解,在用戶(hù)確認(rèn)或修改后,才進(jìn)入分步執(zhí)行,適合需要精細(xì)控制的高難度任務(wù),如行業(yè)報(bào)告撰寫(xiě)。例如,在制作精釀啤酒的多維表格時(shí),使用規(guī)劃模式可以讓用戶(hù)更好地控制任務(wù)執(zhí)行過(guò)程,確保結(jié)果符合需求。

另外,扣子空間構(gòu)建了“通用實(shí)習(xí)生 + 領(lǐng)域?qū)<摇彪p軌服務(wù)矩陣?;A(chǔ)層的通用型AI助手可以處理日常事務(wù),而專(zhuān)業(yè)層的專(zhuān)家Agent則能提供更深入的專(zhuān)業(yè)服務(wù)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

目前,內(nèi)置了“華泰 A 股觀察助手”和“用戶(hù)研究專(zhuān)家”兩個(gè)專(zhuān)家 Agent?!叭A泰 A 股觀察助手”可生成投研日?qǐng)?bào),針對(duì)股票分析具體問(wèn)題進(jìn)行答疑解惑;“用戶(hù)研究專(zhuān)家”可實(shí)現(xiàn)問(wèn)卷交叉分析與訪談紀(jì)要智能整理。不過(guò),專(zhuān)業(yè) Agent 標(biāo)注“限時(shí)免費(fèi)”,暗示未來(lái)可能采用訂閱制商業(yè)模式。

技術(shù)突破與生態(tài)擴(kuò)展:開(kāi)放式架構(gòu)使智能體可無(wú)限擴(kuò)展技能

MCP作為AI能力的“標(biāo)準(zhǔn)USB接口”,首批集成了飛書(shū)多維表格、高德地圖等平臺(tái),未來(lái)支持開(kāi)發(fā)者通過(guò)扣子開(kāi)發(fā)平臺(tái)發(fā)布自定義插件。

大模型之家認(rèn)為,這種開(kāi)放式架構(gòu)使智能體可無(wú)限擴(kuò)展技能,例如調(diào)用圖像工具生成穿搭推薦圖,或通過(guò)語(yǔ)音合成輸出會(huì)議紀(jì)要音頻??圩涌臻g通過(guò)簡(jiǎn)化MCP調(diào)用流程,如支持飛書(shū)表格直接導(dǎo)入、一鍵接入第三方插件,將原本需代碼開(kāi)發(fā)的功能平民化,降低了使用門(mén)檻。

平臺(tái)集成了MCP(模塊化能力組件)擴(kuò)展體系,內(nèi)測(cè)首期已支持飛書(shū)多維表格、高德地圖、圖像工具等高頻辦公組件接入。

字節(jié)跳動(dòng)官方表示,在未來(lái),扣子將支持“扣子開(kāi)發(fā)平臺(tái)”發(fā)布MCP至“扣子空間”,持續(xù)拓展Agent能力邊界。用戶(hù)可以根據(jù)自己的需求添加相應(yīng)的MCP擴(kuò)展,以實(shí)現(xiàn)更多功能。

實(shí)測(cè)效能與行業(yè)對(duì)比:各有優(yōu)略

在簡(jiǎn)單任務(wù)方面,扣子空間表現(xiàn)出色,如5分鐘就能完成含預(yù)算參考的5天旅行攻略。但在復(fù)雜場(chǎng)景下,如用戶(hù)研究報(bào)告生成耗時(shí)約40分鐘,且存在Python腳本調(diào)用失敗等問(wèn)題。對(duì)比測(cè)試顯示,其文檔生成速度較DeepSeek慢23%,但內(nèi)容豐富度提升37%。

與競(jìng)品Manus相比,扣子空間具有開(kāi)放性,支持用戶(hù)自定義MCP插件,而Manus是封閉式工具集成。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

扣子空間采用雙模式動(dòng)態(tài)切換,而Manus是單一深度規(guī)劃;扣子空間復(fù)雜任務(wù)成功率為 81%,Manus任務(wù)成功率為92%。不過(guò),扣子空間在跨平臺(tái)協(xié)作(如飛書(shū)文檔自動(dòng)同步)和可視化工作流搭建方面具有顯著優(yōu)勢(shì)。

產(chǎn)品操作體驗(yàn):簡(jiǎn)單易懂 確實(shí)好用

扣子空間的界面簡(jiǎn)單易懂,左側(cè)是任務(wù)列表,右側(cè)是一個(gè)對(duì)話(huà)框,用來(lái)輸入新任務(wù)。執(zhí)行任務(wù)要求時(shí),默認(rèn)是“探索模式”,AI自動(dòng)完成各個(gè)步驟,速度較快;用戶(hù)也可以改成“規(guī)劃模式”,顯示AI思考的中間步驟,便于隨時(shí)調(diào)整。除此以外,就沒(méi)有需要設(shè)置的地方了,很符合直覺(jué)。用戶(hù)還可以通過(guò)上傳本地文件或鏈接,文本描述輸入需要扣子空間完成的任務(wù),它會(huì)進(jìn)行自動(dòng)應(yīng)用開(kāi)發(fā)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

而且扣子空間打破了傳統(tǒng)AI的“黑盒”模式,用戶(hù)可以通過(guò)規(guī)劃模式實(shí)時(shí)查看任務(wù)拆解、工具調(diào)用、中間結(jié)果及最終交付物。

例如,在整理“國(guó)內(nèi)AI行業(yè)對(duì)Agent的共識(shí)”任務(wù)中,扣子空間不僅列出思維導(dǎo)圖框架,還標(biāo)注了數(shù)據(jù)來(lái)源(如知乎、行業(yè)白皮書(shū)、學(xué)術(shù)論文)和分析邏輯,甚至允許用戶(hù)中途修正關(guān)鍵詞權(quán)重。在規(guī)劃模式中,用戶(hù)可隨時(shí)暫停任務(wù)、調(diào)整參數(shù),避免“一步錯(cuò)步步錯(cuò)”,這種設(shè)計(jì)將 AI 從“自動(dòng)駕駛”降級(jí)為“副駕駛”,賦予用戶(hù)更強(qiáng)的控制感。

存在的問(wèn)題與挑戰(zhàn):幻覺(jué)仍然存在 依賴(lài)用戶(hù)AI素養(yǎng)

在處理復(fù)雜任務(wù)時(shí),扣子空間的穩(wěn)定性有待提高。如調(diào)用Python腳本分析股票數(shù)據(jù)時(shí),常因API權(quán)限或數(shù)據(jù)源問(wèn)題失?。辉谏陕糜斡?jì)劃時(shí),也可能出現(xiàn)高德地圖顯示不成功的情況。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

AI普遍存在的“幻覺(jué)”問(wèn)題在扣子空間上也有所體現(xiàn)。例如,在生成的行業(yè)報(bào)告中,部分技術(shù)趨勢(shì)描述與實(shí)際情況存在偏差(如誤判 GPT-5 發(fā)布時(shí)間);在生成的 AI 資訊頁(yè)面中,提到的一些信息也與實(shí)際情況不符。

盡管扣子空間降低了操作門(mén)檻,但如何精準(zhǔn)定義任務(wù)需求(如區(qū)分“整理觀點(diǎn)”與“提煉共識(shí)”)、選擇合適的Agent類(lèi)型(通用vs專(zhuān)家),仍依賴(lài)用戶(hù)的AI素養(yǎng)。用戶(hù)需要一定的時(shí)間來(lái)熟悉和掌握扣子空間的功能和使用方法,才能更好地發(fā)揮其優(yōu)勢(shì)。

扣子空間的推出標(biāo)志著字節(jié)跳動(dòng)在AI協(xié)同辦公領(lǐng)域邁出了重要一步。它以其獨(dú)特的功能和創(chuàng)新的設(shè)計(jì),為用戶(hù)提供了高效、便捷的 AI 協(xié)作體驗(yàn),在辦公和生活場(chǎng)景中都具有廣泛的應(yīng)用前景。其開(kāi)放式 MCP 架構(gòu)和雙模式協(xié)作機(jī)制,正在重塑 AI 協(xié)同辦公的價(jià)值范式。隨著 2000 萬(wàn)開(kāi)發(fā)者生態(tài)的培育,該平臺(tái)有望成為企業(yè)智能化轉(zhuǎn)型的基礎(chǔ)設(shè)施級(jí)入口。

然而,作為一款內(nèi)測(cè)產(chǎn)品,扣子空間仍存在一些問(wèn)題和挑戰(zhàn),如技術(shù)穩(wěn)定性不足、幻覺(jué)問(wèn)題以及用戶(hù)認(rèn)知門(mén)檻等。未來(lái),需要不斷優(yōu)化和改進(jìn),提高產(chǎn)品的性能和穩(wěn)定性,豐富專(zhuān)家 Agent生態(tài),吸引更多高質(zhì)量的MCP擴(kuò)展應(yīng)用,以滿(mǎn)足用戶(hù)日益增長(zhǎng)的需求。同時(shí),也需要探索合適的商業(yè)化路徑,實(shí)現(xiàn)可持續(xù)發(fā)展。