国产精品18久久久久久久网站,97久久国产精品热8,а√天堂官网在线,99久高清在线视频观看,久久亚洲天堂

文章轉(zhuǎn)載自「INDIGO 科技加速站」

Anthropic 工程師 Barry Zhang 在 AI Engineer 工作坊上的一個分享 “如何構(gòu)建有效的 Agent”，其中印象最深的一個觀點：Don't build agents for everything，反過來理解就是別做什么都能干的 Agent，那是我們大模型要干的事情

構(gòu)建有效 Agent 的三大要點：

明智選擇應(yīng)用場景，并非所有任務(wù)都需要 Agent
找到合適的用例后，盡可能長時間地保持系統(tǒng)簡單
在迭代過程中，嘗試從 Agent 的視角思考，理解其局限并提供幫助

Barry 主要負責(zé) Agentic System，演講內(nèi)容基于他和 Eric 合著的一篇博文，下面詳細總結(jié)他們的核心觀點，以及對 Agent 系統(tǒng)的演進和未來的思考。

Agent 系統(tǒng)的演進

簡單功能（Simple Features）：起初是簡單的任務(wù)，如摘要、分類、提取，這些在幾年前看似神奇，現(xiàn)在已成為基礎(chǔ)。
工作流（Workflows）：隨著模型和產(chǎn)品成熟，開始編排多個模型調(diào)用，形成預(yù)定義的控制流，以犧牲成本和延遲換取更好性能。這被認為是 Agent 系統(tǒng)的前身。
Agent：當(dāng)前階段，模型能力更強，領(lǐng)域特定的 Agent 開始出現(xiàn)。與工作流不同，Agent 可以根據(jù)環(huán)境反饋自主決定行動路徑，幾乎獨立運作。
未來（猜測）：可能是更通用的單一 Agent，或多 Agent 協(xié)作。趨勢是賦予系統(tǒng)更多自主權(quán)，使其更強大有用，但也伴隨著更高的成本、延遲和錯誤后果。

Founder Park 正在搭建開發(fā)者社群，邀請積極嘗試、測試新模型、新技術(shù)的開發(fā)者、創(chuàng)業(yè)者們加入，請掃碼詳細填寫你的產(chǎn)品/項目信息，通過審核后工作人員會拉你入群～

進群之后，你有機會得到：

高濃度的主流模型（如 DeepSeek 等）開發(fā)交流；
資源對接，與 API、云廠商、模型廠商直接交流反饋的機會；
好用、有趣的產(chǎn)品/案例，F(xiàn)ounder Park 會主動做宣傳。

01并非所有場景都適合構(gòu)建 Agent(Don't build agents for everything)

Agent 主要用于擴展復(fù)雜且有價值的任務(wù)，它們成本高、延遲高，不應(yīng)作為所有用例的直接升級。對于可以清晰映射決策樹的任務(wù)，顯式構(gòu)建工作流（Workflow）更具成本效益和可控性。

何時構(gòu)建 Agent 的檢查清單：

任務(wù)復(fù)雜度 (Complexity)：Agent 擅長處理模糊的問題空間。如果決策路徑清晰，應(yīng)優(yōu)先選擇工作流。
任務(wù)價值 (Value)：Agent 的探索性行為會消耗大量 token，任務(wù)的價值必須能證明其成本。對于預(yù)算有限（如每任務(wù) 10 美分）或高容量（如客服）場景，工作流可能更合適。
關(guān)鍵能力的可行性 (Derisk Critical Capabilities)：需確保 Agent 在關(guān)鍵環(huán)節(jié)（如編碼 Agent 的編寫、調(diào)試、錯誤恢復(fù)能力）不存在嚴(yán)重瓶頸，否則會顯著增加成本和延遲。如有瓶頸，應(yīng)簡化任務(wù)范圍。
錯誤成本與發(fā)現(xiàn)難度 (Cost of Error & Error Discovery)：如果錯誤代價高昂且難以發(fā)現(xiàn)，就很難信任 Agent 自主行動?？梢酝ㄟ^限制范圍（如只讀權(quán)限、增加人工干預(yù)）來緩解，但這也會限制其擴展性。

編碼（Coding）是一個很好的 Agent 用例，因為它任務(wù)復(fù)雜（從設(shè)計文檔到 PR）、價值高、現(xiàn)有模型（如 Claude）在許多環(huán)節(jié)表現(xiàn)良好，且結(jié)果易于驗證（單元測試、CI）。

02保持簡單 (Keep it simple)

Agent 的核心結(jié)構(gòu)：

模型（Model）+ 工具（Tools）+ 循環(huán)（Loop）在一個環(huán)境（Environment）中運作。

三個關(guān)鍵組成部分：
1.環(huán)境 (Environment)：Agent 操作所在的系統(tǒng)。
2.工具集 (Tools)：Agent 采取行動和獲取反饋的接口。
3.系統(tǒng)提示 (System Prompt)：定義 Agent 的目標(biāo)、約束和理想行為。

迭代方法：

優(yōu)先構(gòu)建和迭代這三個基本組件，能獲得最高的投資回報率。避免一開始就過度復(fù)雜化，這會扼殺迭代速度。優(yōu)化（如緩存軌跡、并行化工具調(diào)用、改進用戶界面以增強信任）應(yīng)在基本行為確定后再進行。

一致性：

盡管不同 Agent 應(yīng)用（編碼、搜索、計算機使用）在產(chǎn)品層面、范圍和能力上看起來不同，但它們共享幾乎相同的簡單后端架構(gòu)。

03像 Agent 一樣思考(Think like your agents)

問題：
開發(fā)者常從自身角度出發(fā)，難以理解 Agent 為何會犯看似反常的錯誤。

解決方法：
將自己置于 Agent 的“上下文窗口”中。Agent 在每一步的決策都基于有限的上下文信息（如 10k-20k token）。

換位思考練習(xí)：
嘗試從 Agent 的視角完成任務(wù)，體驗其局限性（例如，只能看到靜態(tài)截圖，在推理和工具執(zhí)行期間如同“閉眼”操作）。這有助于發(fā)現(xiàn) Agent 真正需要哪些信息（如屏幕分辨率、推薦操作、限制條件）以避免不必要的探索。

利用模型自身：
可以直接詢問模型（如 Claude）：指令是否模糊？是否理解工具描述？為什么做出某個決策？如何幫助它做出更好的決策？這有助于彌合開發(fā)者與 Agent 之間的理解差距。

04個人思考與未來展望

1. 預(yù)算感知 Agent (Budget-aware Agents)：

需要更好地控制 Agent 的成本和延遲，定義和強制執(zhí)行時間、金錢、token 預(yù)算，以便在生產(chǎn)環(huán)境中更廣泛地部署。

2. 自進化工具 (Self-evolving Tools)：

Agent 或許能設(shè)計和改進自己的工具（元工具），使其更具通用性，能適應(yīng)不同用例的需求。

3. 多 Agent 協(xié)作 (Multi-agent Collaboration)：

預(yù)計今年年底將在生產(chǎn)中看到更多多 Agent 系統(tǒng)。其優(yōu)勢包括并行化、關(guān)注點分離、保護主 Agent 上下文窗口等。關(guān)鍵挑戰(zhàn)在于 Agent 間的通信方式，如何實現(xiàn)異步通信，超越當(dāng)前的用戶-助手輪流模式。

引用鏈接:

[1]How We Built Effective Agents: Barry Zhang, Anthropic: https://youtu.be/D7_ipDqhtwk?si=atqYQAuvl0xWwrcH