文章轉(zhuǎn)載自「INDIGO 科技加速站」

打開網(wǎng)易新聞 查看精彩圖片

Anthropic 工程師 Barry Zhang 在 AI Engineer 工作坊上的一個分享 “如何構(gòu)建有效的 Agent”,其中印象最深的一個觀點:Don't build agents for everything,反過來理解就是別做什么都能干的 Agent,那是我們大模型要干的事情

打開網(wǎng)易新聞 查看精彩圖片

構(gòu)建有效 Agent 的三大要點:

  1. 明智選擇應(yīng)用場景,并非所有任務(wù)都需要 Agent

  2. 找到合適的用例后,盡可能長時間地保持系統(tǒng)簡單

  3. 在迭代過程中,嘗試從 Agent 的視角思考,理解其局限并提供幫助

Barry 主要負責(zé) Agentic System,演講內(nèi)容基于他和 Eric 合著的一篇博文,下面詳細總結(jié)他們的核心觀點,以及對 Agent 系統(tǒng)的演進和未來的思考。

Agent 系統(tǒng)的演進

  1. 簡單功能(Simple Features):起初是簡單的任務(wù),如摘要、分類、提取,這些在幾年前看似神奇,現(xiàn)在已成為基礎(chǔ)。

  2. 工作流(Workflows):隨著模型和產(chǎn)品成熟,開始編排多個模型調(diào)用,形成預(yù)定義的控制流,以犧牲成本和延遲換取更好性能。這被認為是 Agent 系統(tǒng)的前身。

  3. Agent:當(dāng)前階段,模型能力更強,領(lǐng)域特定的 Agent 開始出現(xiàn)。與工作流不同,Agent 可以根據(jù)環(huán)境反饋自主決定行動路徑,幾乎獨立運作。

  4. 未來(猜測):可能是更通用的單一 Agent,或多 Agent 協(xié)作。趨勢是賦予系統(tǒng)更多自主權(quán),使其更強大有用,但也伴隨著更高的成本、延遲和錯誤后果。

打開網(wǎng)易新聞 查看精彩圖片

Founder Park 正在搭建開發(fā)者社群,邀請積極嘗試、測試新模型、新技術(shù)的開發(fā)者、創(chuàng)業(yè)者們加入,請掃碼詳細填寫你的產(chǎn)品/項目信息,通過審核后工作人員會拉你入群~

進群之后,你有機會得到:

  • 高濃度的主流模型(如 DeepSeek 等)開發(fā)交流;

  • 資源對接,與 API、云廠商、模型廠商直接交流反饋的機會;

  • 好用、有趣的產(chǎn)品/案例,F(xiàn)ounder Park 會主動做宣傳。

01并非所有場景都適合構(gòu)建 Agent(Don't build agents for everything)

打開網(wǎng)易新聞 查看精彩圖片

Agent 主要用于擴展復(fù)雜且有價值的任務(wù),它們成本高、延遲高,不應(yīng)作為所有用例的直接升級。對于可以清晰映射決策樹的任務(wù),顯式構(gòu)建工作流(Workflow)更具成本效益和可控性。

何時構(gòu)建 Agent 的檢查清單:

  1. 任務(wù)復(fù)雜度 (Complexity):Agent 擅長處理模糊的問題空間。如果決策路徑清晰,應(yīng)優(yōu)先選擇工作流。

  2. 任務(wù)價值 (Value):Agent 的探索性行為會消耗大量 token,任務(wù)的價值必須能證明其成本。對于預(yù)算有限(如每任務(wù) 10 美分)或高容量(如客服)場景,工作流可能更合適。

  3. 關(guān)鍵能力的可行性 (Derisk Critical Capabilities):需確保 Agent 在關(guān)鍵環(huán)節(jié)(如編碼 Agent 的編寫、調(diào)試、錯誤恢復(fù)能力)不存在嚴(yán)重瓶頸,否則會顯著增加成本和延遲。如有瓶頸,應(yīng)簡化任務(wù)范圍。

  4. 錯誤成本與發(fā)現(xiàn)難度 (Cost of Error & Error Discovery):如果錯誤代價高昂且難以發(fā)現(xiàn),就很難信任 Agent 自主行動??梢酝ㄟ^限制范圍(如只讀權(quán)限、增加人工干預(yù))來緩解,但這也會限制其擴展性。

編碼(Coding)是一個很好的 Agent 用例,因為它任務(wù)復(fù)雜(從設(shè)計文檔到 PR)、價值高、現(xiàn)有模型(如 Claude)在許多環(huán)節(jié)表現(xiàn)良好,且結(jié)果易于驗證(單元測試、CI)。

打開網(wǎng)易新聞 查看精彩圖片

02保持簡單 (Keep it simple)

Agent 的核心結(jié)構(gòu):

模型(Model)+ 工具(Tools)+ 循環(huán)(Loop)在一個環(huán)境(Environment)中運作。

三個關(guān)鍵組成部分:
1.環(huán)境 (Environment):Agent 操作所在的系統(tǒng)。
2.工具集 (Tools):Agent 采取行動和獲取反饋的接口。
3.系統(tǒng)提示 (System Prompt):定義 Agent 的目標(biāo)、約束和理想行為。

迭代方法:

優(yōu)先構(gòu)建和迭代這三個基本組件,能獲得最高的投資回報率。避免一開始就過度復(fù)雜化,這會扼殺迭代速度。優(yōu)化(如緩存軌跡、并行化工具調(diào)用、改進用戶界面以增強信任)應(yīng)在基本行為確定后再進行。

一致性:

盡管不同 Agent 應(yīng)用(編碼、搜索、計算機使用)在產(chǎn)品層面、范圍和能力上看起來不同,但它們共享幾乎相同的簡單后端架構(gòu)。

03像 Agent 一樣思考(Think like your agents)

問題:
開發(fā)者常從自身角度出發(fā),難以理解 Agent 為何會犯看似反常的錯誤。

解決方法:
將自己置于 Agent 的“上下文窗口”中。Agent 在每一步的決策都基于有限的上下文信息(如 10k-20k token)。

換位思考練習(xí):
嘗試從 Agent 的視角完成任務(wù),體驗其局限性(例如,只能看到靜態(tài)截圖,在推理和工具執(zhí)行期間如同“閉眼”操作)。這有助于發(fā)現(xiàn) Agent 真正需要哪些信息(如屏幕分辨率、推薦操作、限制條件)以避免不必要的探索。

利用模型自身:
可以直接詢問模型(如 Claude):指令是否模糊?是否理解工具描述?為什么做出某個決策?如何幫助它做出更好的決策?這有助于彌合開發(fā)者與 Agent 之間的理解差距。

04個人思考與未來展望

1. 預(yù)算感知 Agent (Budget-aware Agents):

需要更好地控制 Agent 的成本和延遲,定義和強制執(zhí)行時間、金錢、token 預(yù)算,以便在生產(chǎn)環(huán)境中更廣泛地部署。

2. 自進化工具 (Self-evolving Tools):

Agent 或許能設(shè)計和改進自己的工具(元工具),使其更具通用性,能適應(yīng)不同用例的需求。

3. 多 Agent 協(xié)作 (Multi-agent Collaboration):

預(yù)計今年年底將在生產(chǎn)中看到更多多 Agent 系統(tǒng)。其優(yōu)勢包括并行化、關(guān)注點分離、保護主 Agent 上下文窗口等。關(guān)鍵挑戰(zhàn)在于 Agent 間的通信方式,如何實現(xiàn)異步通信,超越當(dāng)前的用戶-助手輪流模式。

引用鏈接:

[1]How We Built Effective Agents: Barry Zhang, Anthropic: https://youtu.be/D7_ipDqhtwk?si=atqYQAuvl0xWwrcH

打開網(wǎng)易新聞 查看精彩圖片

轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker