打開網(wǎng)易新聞 查看精彩圖片

Agent(智能體)和 MCP(模型上下文協(xié)議)是 2025 上半年 AI 領(lǐng)域最熱門的趨勢。

前幾天字節(jié)的 Agent 產(chǎn)品「扣子空間」,也正式開啟了內(nèi)測。

在人山人海的 agent 產(chǎn)品中,扣子空間第一次提供了「規(guī)劃模式」——能夠和用戶分步協(xié)作,在關(guān)鍵步驟節(jié)點暫停確認(rèn)、允許用戶實時修正路線的 agent 能力。

打開網(wǎng)易新聞 查看精彩圖片

扣子團隊官方認(rèn)為,人和 agent 協(xié)作起來,將會是一種更加絲滑的工作模式。

扣子空間內(nèi)測申請

官方網(wǎng)站

愛范兒也第一時間拿到扣子空間邀請碼,試跑了一些腦洞微開的任務(wù)。

我們扮演了 「老師好我叫何同學(xué)」 的公關(guān)負(fù)責(zé)人,要求實習(xí)生扣子對近期輿情事件進行分析,生成輿情報告,進一步給出對策建議,然后再撰寫一份回應(yīng)聲明:

Prompt:我是‘老師好我叫何同學(xué)’團隊的公關(guān)負(fù)責(zé)人。近期我們的品牌遭遇了輿情事故,請你搜集資料,評估該事件的影響程度,了解網(wǎng)友的吐槽內(nèi)容,從中分析提煉出網(wǎng)友認(rèn)為我們所犯的錯誤以及改進方向。你可以利用你認(rèn)為合適的網(wǎng)站和互聯(lián)網(wǎng)平臺來搜索資料。然后,為我生成一份輿情報告,全面展示此次輿情事故的時間線、發(fā)展脈絡(luò)、網(wǎng)友反應(yīng)與吐槽,以及應(yīng)對策略。這份報告需要做得深入一點,特別是在應(yīng)對策略方面要提供多種不同的角度。此外,我還需要你依據(jù)應(yīng)對策略,生成一篇態(tài)度誠懇、不逃避責(zé)任且改進措施切實可行的回應(yīng)聲明。你需要把輿情報告生成一個網(wǎng)頁和一個 pdf 文件,把回應(yīng)聲明生成為常規(guī)文檔。

這個任務(wù)看起來比較簡單,主要動作是搜索和文本生成,但同時對報告制作者的輿情分析的專業(yè)知識,以及將媒體報道和社媒貼文提煉、格式化成嚴(yán)肅報告的文稿能力,要求都不低——這些,都是一個 agent 產(chǎn)品在大模型方面的能力。

除了大模型能力之外,在 browser/computer use、代碼、MCP 等能力上,這個任務(wù)也能讓扣子空間「小試牛刀」。

和工作水準(zhǔn)。這是第一次生成的輿情報告的數(shù)據(jù)分析部分:

打開網(wǎng)易新聞 查看精彩圖片

這是 AI 實習(xí)生編寫的應(yīng)對策略:

打開網(wǎng)易新聞 查看精彩圖片

作為「初稿」,這次交付無論從輿情報告的詳實程度,邏輯拆解,分析的專業(yè)性,還是回應(yīng)聲明的格式上,都算是達標(biāo)了。具體細(xì)節(jié)不一定適用于真實場景,但至少生成結(jié)果提供了可以用于下一步行動的指導(dǎo)方向。

值得注意的是,由于輸入任務(wù)時提到了「時間線」的概念,生成的結(jié)果似乎把更多篇幅提到了「開源項目抄襲」、「會自己打字的鍵盤」等前序事件上。而這并非我們的任務(wù)意圖。

顯然,在工作場合中,同事之間目標(biāo)對齊還是很重要的。

我們正好可以通過扣子空間的規(guī)劃模式,來與這個 AI 實習(xí)生對齊:

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

經(jīng)過對齊后,不僅內(nèi)容目標(biāo)正確,還可以看到輿情報告的數(shù)據(jù)部分直接把粉絲量、「三連率」、完播率的對比展示了出來,數(shù)據(jù)的說明力和代表性有所增強:

打開網(wǎng)易新聞 查看精彩圖片

你也可以訪問這個鏈接查看任務(wù)完整回放。

停下來、慢一點:AI 工作搭子要學(xué)會自己「對齊」

從愛范兒的測試結(jié)果來看,扣子空間和傳統(tǒng)智能體/MCP 產(chǎn)品最大的不同之處,就在于這個能夠「停下來、慢一點」的規(guī)劃模式。

簡單來說,交給 MCP 一個任務(wù)之后,它會自動分解任務(wù)指定規(guī)劃然后開始跑任務(wù),最終生成結(jié)果。但這難免出現(xiàn)「一步錯,步步錯」的情況。

而扣子空間開啟規(guī)劃模式后,可以在執(zhí)行復(fù)雜任務(wù)的關(guān)鍵節(jié)點上「停下腳步」和用戶對齊,讓用戶可以實時糾錯和糾偏,優(yōu)化執(zhí)行邏輯。

這種方式尤為適合不具備提示工程能力的小白用戶。第一次提交任務(wù)的時候,簡單扼要表達你的意圖就行了。

「規(guī)劃模式」的觸發(fā)條件有兩種:

  • 一種是 agent 出于各種原因(比如查不到相關(guān)資料,或者不能準(zhǔn)確理解用戶的意圖),導(dǎo)致無法完成當(dāng)前步驟,或者結(jié)果的置信度不夠高——它會自己停下來。當(dāng)任務(wù)暫停時,扣子空間會彈出通知,提醒用戶進行下一步操作。

打開網(wǎng)易新聞 查看精彩圖片

  • 另一種是用戶可以主動按下「暫停鍵」:智能體的分步執(zhí)行任務(wù)過程中,會把分步結(jié)果寫成 .md 文檔,用于構(gòu)建知識庫和輔助下一步執(zhí)行??圩涌臻g也是如此,用戶如果發(fā)現(xiàn)分步文檔有誤或者偏差,就可以自己暫停修正。

打開網(wǎng)易新聞 查看精彩圖片

這種協(xié)作式的智能體工作流程,使得智能體避免因為「一上來就分析錯了」,以及思考和 token 不斷輸出中產(chǎn)生的幻覺等各種原因,導(dǎo)致偏離既定目標(biāo)。

可以這么理解:如果說傳統(tǒng)大模型/智能體是「自動駕駛」,那么扣子空間其實是讓用戶來扮演 AI 的「copilot」(副駕駛)。用戶一旦發(fā)覺偏離,可以立刻踩一腳剎車,手動扶正方向盤。

如果換成實習(xí)生的比喻,扣子空間就是一個能夠做到「不懂隨時問」,然后依據(jù)即時反饋來靈活調(diào)整工作方向的 AI 實習(xí)生。

實際上還不止一個 AI 實習(xí)生,而是可以有很多個:

  • 對于常規(guī)型任務(wù),比如文本處理、制圖制表、簡單分析等,扣子空間自己就是一個通用實習(xí)生,算是一個能力比較全面,但不強調(diào)專深領(lǐng)域的「小六邊形戰(zhàn)士」;
  • 至于深度專業(yè)領(lǐng)域的任務(wù),比如用戶調(diào)研、金融行研等,就需要「領(lǐng)域?qū)<摇怪悄荏w出面了。

無論是通用型還是專家型智能體,都通過「扣子空間」來一站式調(diào)度。

不僅如此,如果現(xiàn)有的專家型智能體還不夠用,開發(fā)者也可以充分利用扣子團隊同步推出的扣子開發(fā)平臺(零基礎(chǔ)開發(fā)智能體)、扣子羅盤(智能體 DevOps 調(diào)優(yōu)工具)、Eino(Go 語言智能體開發(fā)框架),來快速開發(fā)并上架自己的專家 Agent。

打開網(wǎng)易新聞 查看精彩圖片

AI 實習(xí)生,終于長腦子了

當(dāng)然,在愛范兒的大部分測試中,扣子空間都能比較準(zhǔn)確地理解意圖,生成優(yōu)質(zhì)的結(jié)果。

最近關(guān)稅戰(zhàn)十分熱鬧,我們也讓它來試試這個難題:跟蹤美國在主要對華進口品類上的關(guān)稅水平。

Prompt: 近期美國政府關(guān)稅政策一天一變,我需要你制作一個能夠?qū)崟r更新的在線表格,來追蹤自從 4 月1 號以來關(guān)稅變化。你需要追蹤中國向美國出口的最主要產(chǎn)品的稅率,比如消費電子設(shè)備、針管、玩具等等,具體有哪些產(chǎn)品你自己去查,查不出來就隨時停下來問我。注意有一些關(guān)稅類別是近期新增的,但一些關(guān)稅類別是在 2025 年以前就有的,你需要在表格中體現(xiàn)不同關(guān)稅類別是如何疊加的,不明白隨時問我。

先來看一下生成的結(jié)果:

打開網(wǎng)易新聞 查看精彩圖片

愛范兒觀察了一下思考過程,發(fā)現(xiàn)它對于「關(guān)稅」這樣的復(fù)雜概念已經(jīng)有充分的理解,而這和可能和背后所使用的大模型有關(guān)。

最近一個多月里我們其實用過很多智能體/MCP 類工具,特別是有些具備 deep research 能力,標(biāo)榜能夠代替用戶執(zhí)行復(fù)雜任務(wù)的產(chǎn)品——處理相同的任務(wù)時,卻需要做數(shù)十輪搜索,似乎很用力地在理解用戶到底在說什么,給人一種用力過猛的感覺,結(jié)果卻也并不理想。

扣子空間總共只進行了六輪思考,其中只有四輪真正用來搜索和了解關(guān)稅種類(剩下的兩輪分別是任務(wù)開始的規(guī)劃分配,以及任務(wù)結(jié)尾的網(wǎng)頁生成。)

生成的結(jié)果,從視覺觀感上還是很有說服力的。

而且能看出來這個 AI 實習(xí)生并不是指哪打哪,而是多少動了點腦子,做了一些并不在初始任務(wù)要求內(nèi),但它認(rèn)為會有幫助的數(shù)據(jù)分析。比如列出了今年以來關(guān)稅增減的時間線:

打開網(wǎng)易新聞 查看精彩圖片

做了短中長期分別的影響分析:

打開網(wǎng)易新聞 查看精彩圖片

還有圖表與文字結(jié)合,結(jié)構(gòu)化的呈現(xiàn)方式:

打開網(wǎng)易新聞 查看精彩圖片

以及最讓我驚艷之處:它把 25 年前基準(zhǔn)、「自由日」、「對等」等不同關(guān)稅名目的區(qū)別和疊加情況,給抓住了。

打開網(wǎng)易新聞 查看精彩圖片

但錯誤也非常容易發(fā)現(xiàn),比如大部分類別里的稅率完全算錯了。至于錯誤的原因,我的理解是這個實習(xí)生采用純搜索新聞的方式,容易被錯誤和不及時的信息帶偏,而非直接到美國政府網(wǎng)站抓取數(shù)據(jù)。

當(dāng)然,就算是真人實習(xí)生,恐怕也會這么干。進出口從業(yè)人士以及關(guān)稅方面專家才知道獲取最及時、準(zhǔn)確數(shù)值的方法,這個任務(wù)需要的專業(yè)知識和經(jīng)驗遠(yuǎn)超實習(xí)生水平。

但這并不代表扣子空間不能化解這個難題:我們可以在開啟「規(guī)劃模式」后,在糾偏的時候給它明確的數(shù)據(jù)源定義,并且讓它主動調(diào)用 python/MySQL 或其他代碼能力,去爬取最準(zhǔn)確、真實的數(shù)據(jù);或者,我們也可以從權(quán)威來源手動下載格式和內(nèi)容未優(yōu)化的報告,然后再通過官方支持的多維表格擴展插件,來生成任務(wù)需要的知識庫。

扣子空間支持調(diào)用外部 MCP 工具(正式版),目前已經(jīng)支持了十多個字節(jié)跳動內(nèi)部以及外部(例如墨跡天氣、高德地圖等)的 MCP 擴展。所以理論上,進出口行業(yè)專業(yè)數(shù)據(jù)庫提供商也可以開發(fā)自己的 MCP 擴展,整合到扣子空間里。這樣再復(fù)雜、再無厘頭的關(guān)稅進展,也難不倒實習(xí)生了。

在線查看關(guān)稅任務(wù)重放

再來個純代碼的小任務(wù),可能有點大材小用了。讓扣子空間來做一個 hello world printer,并且中途修改需求。

還不會寫代碼的領(lǐng)導(dǎo)們,終于不用怕員工跑路了:你也可以讓 AI 實習(xí)生教你寫代碼。

打開網(wǎng)易新聞 查看精彩圖片

在線查看代碼任務(wù)重放

前面這些測試的都還是扣子空間默認(rèn)激活的「通用實習(xí)生」。

而在首頁還有「專家 Agent」的入口,目前 beta 階段開放了兩個可用專家,分別是用戶研究專家(扣子官方開發(fā))和華泰A股觀察助手(華泰證券和扣子共同開發(fā))。

以A股觀察助手為例,它的進入界面和通用實習(xí)生略微不同,允許用戶基于自選股和板塊定制日報,也支持一對一咨詢功能,將智能體變成用戶可以獨享的證券分析師。

打開網(wǎng)易新聞 查看精彩圖片

這兩個專家 Agent,也是扣子空間的 MCP 擴展能力的直接體現(xiàn)。它可以將扣子的大模型與第三方服務(wù)提供商的大模型能力放在同一個上下文里,實現(xiàn) MCP server 之間的「協(xié)作」。

當(dāng) AI 從 「工具」 變成 「搭子」:人機不分工,而是共生進化

傳統(tǒng)大模型產(chǎn)品和工具的能力天花板,決定了它們的主要用途是處理事務(wù)性工作,替代重復(fù)性勞動(例:文本生成、數(shù)據(jù)整理和格式化、基礎(chǔ)規(guī)劃等);而正如前面提到,智能體/MCP 整合深度思考、任務(wù)拆解與規(guī)劃、按步驟自動化執(zhí)行任務(wù)的能力,但這種「全自動」的方式仍然存在弊端。

與前兩者相比,扣子空間提出一種新的思路:在全流程得到真人用戶實時監(jiān)督的環(huán)境下,讓 AI 深度參與到解決問題的完整工作流中,實現(xiàn)人和智能體的有機協(xié)同工作。

「AI 實習(xí)生」確實是一個挺有趣的類比,它一邊和你協(xié)同工作,一邊從你身上學(xué)習(xí),逐漸熟悉你的工作習(xí)慣和要求,掌握你的目的動機和思維邏輯——每一個優(yōu)秀的 mentor 都希望自己的實習(xí)生能夠成長為獨當(dāng)一面的全職員工,而這種成長,需要通過聰明的工作方式,和一次又一次的成果交付,才能逐漸獲得。

工具不斷推陳出新,工作方式也因為 AI 變得很酷。但歸根結(jié)底,高效穩(wěn)定地交付成果,才是王道。

從另一角度來看,當(dāng) AI 工具的能力和服從性同步提升,每個職場打工人都能隨時召喚自己的 AI 實習(xí)生,愈發(fā)復(fù)雜困難的任務(wù)也能夠被輕松化解,打工人自己又將何去何從?

或許這既是一次警鐘,也是一次契機,提醒我們應(yīng)該將自身的精力和時間,轉(zhuǎn)移到以下兩個方面:一是提高自己操控 AI 工具的能力;二是專注于那些永遠(yuǎn)無法被 AI 所取代的創(chuàng)造性和思考性工作。

畢竟,在職場上,稀缺的永遠(yuǎn)不是辦事的能力,而是獨到的思考。

當(dāng)然,那樣的未來還需要時間去實現(xiàn)?,F(xiàn)在不妨申請扣子空間體驗資格,讓你的 AI 實習(xí)生 / 數(shù)字職場好搭子先 「上崗」 試試。

或許,你的工作方式,以及職場生活質(zhì)量,將迎來巨大的改變。