昨天晚上,Google發(fā)了一個關(guān)于Agent的新開放協(xié)議。

叫Agent2Agent,簡稱A2A。

打開網(wǎng)易新聞 查看精彩圖片

包括昨天阿里云百煉也官宣搞MCP了。

這些本來沒打算寫的,因?yàn)樘夹g(shù)了,也是感覺離普通人還是有很大距離。

但是有好幾個朋友都在群里說。。。

打開網(wǎng)易新聞 查看精彩圖片

那還是來聊聊吧,正好也用我自己的理解,來做個小科普,讓大家一片文章看懂,A2A、MCP,到底是個啥。

正好最近特朗普對等關(guān)稅這事,非?;?。

搞得全世界雞犬不寧,每個國家之間的隔閡,好像又重新出現(xiàn)了。

我就用國與國之間的外交,來去解釋這兩個協(xié)議。不要以為八竿子打不著,其實(shí)真的非常的像。

我們現(xiàn)在,假設(shè)每個AI智能體(Agent)就是一個小國家,它們各自有自己的語言和規(guī)矩。

打開網(wǎng)易新聞 查看精彩圖片

現(xiàn)在,這些國家的大使館分布在同一棟大樓里,試圖互相溝通、做生意、交換情報。

理想情況是,各國之間關(guān)系和睦,大家都有一套明晰的外交規(guī)則,只要大家坐在圓桌前,就能順暢地交流、簽署協(xié)議、并合作進(jìn)行國際項目。

但現(xiàn)實(shí)卻是,每個國家的大使館互不統(tǒng)屬,協(xié)議各異,有的只認(rèn)英制度量衡,有的只收歐元貨幣,有的說談判必須用法語,有的則堅持任何通信都要用自家加密算法……

結(jié)果,你想跟A國談一個簡單的貿(mào)易合作,得先備齊對方要求的一大堆條文、證明、翻譯、特殊密鑰。如果你還想同時跟B國、C國合作,那就得重復(fù)N遍相似的流程。

這種臨時的、分散的、多頭的各國各自為政,讓所有人的溝通成本居高不下,每次對話都要額外繳一份信息關(guān)稅。

過去,AI世界里的Agent想要合作,都面臨一樣的窘境。

舉個例子,你可能有一個自動幫你幫你回郵件的Agent,還有一個內(nèi)置在日歷應(yīng)用里的Agent,能幫你安排日程。

但這兩個AI很難直接對話,必須得你充當(dāng)翻譯在中間手動復(fù)制粘貼信息,或者依賴開發(fā)者定制的接口。賊惡心。

結(jié)果就是,AI智能體各據(jù)山頭,互操作性極差,這種碎片化現(xiàn)狀讓很多用戶頭疼,因?yàn)樾枰诙鄠€AI應(yīng)用間來回切換,也限制了AI的潛力發(fā)揮,很多本可以多Agent協(xié)同完成的復(fù)雜任務(wù),被人為隔斷在各自的小圈子里。

這種局面下,就有點(diǎn)像二戰(zhàn)后世界的狀態(tài):每個AI智能體各自為政,缺乏統(tǒng)一規(guī)則,互通有壁壘。

當(dāng)年二戰(zhàn)后,也就是 1940年代,美國尋求建立一套戰(zhàn)后多邊機(jī)構(gòu),其中之一將致力于重建世界貿(mào)易,搞了很多輪的談判。

打開網(wǎng)易新聞 查看精彩圖片

最后,歷經(jīng)50年,終于1995 年1月1日正式開始運(yùn)作,依據(jù) 1994年馬拉喀什協(xié)議 ,取代了1948 年建立的關(guān)稅與貿(mào)易總協(xié)定。

我們有了人類歷史上也是非常偉大的組織:

WTO,世界貿(mào)易組織。

而現(xiàn)在AI世界的生態(tài),就有點(diǎn)像二戰(zhàn)后的廢墟,WTO成立的前夕,你調(diào)用我的功能要按我的接口來,我訪問你的數(shù)據(jù)也得敲你定的門路。

沒有標(biāo)準(zhǔn),意味著每增加一種合作關(guān)系,都要付出額外“關(guān)稅”(開發(fā)成本和溝通成本)。

AI生態(tài)因此變得割裂且低效。

人人設(shè)墻,自掃門前雪。

但是還好,在AI圈里也出現(xiàn)了想要制定通用規(guī)則的勢力,就想大家在貿(mào)易混戰(zhàn)中渴望一個WTO那樣。

AI行業(yè)開始探討能否有一套大家都認(rèn)可的協(xié)議,讓智能體之間、智能體與工具之間互相對接更加順暢。

這時候,Google和Anthropic分別站了出來,各自拋出了一個方案,也就是我們今天的主角:A2A協(xié)議和MCP協(xié)議。

一. A2A協(xié)議

先來看Google發(fā)布的A2A協(xié)議。

A2A(Agent-to-Agent)協(xié)議,顧名思義,就是讓AI代理彼此直接對話、協(xié)同工作的協(xié)議。

打開網(wǎng)易新聞 查看精彩圖片

這次Google得到了包括Salesforce、SAP、ServiceNow、MongoDB等在內(nèi)的50多家科技公司的支持參與。

打開網(wǎng)易新聞 查看精彩圖片

A2A協(xié)議的設(shè)計初衷很簡單:

不同來源、不同廠商的Agent能夠互相理解、協(xié)作。就像WTO旨在消減各國間的關(guān)稅壁壘一樣。

一旦采用A2A,不同供應(yīng)商和框架的Agent就像一個個的小國家,加入了一個自由貿(mào)易區(qū),能夠用共同語言交流、無縫協(xié)作,聯(lián)手完成單個Agent難以獨(dú)立完成的復(fù)雜工作流程。

至于A2A是如何運(yùn)作的,我盡量用現(xiàn)實(shí)類比來通俗易懂的解釋下 :

1. Agent = 國家外交官

每個Agent其實(shí)就像一個國家大使館的外交官。他的名牌上寫著自己能干啥、隸屬于哪家企業(yè),聯(lián)絡(luò)方式如何等。A2A要做的,就是制定一個統(tǒng)一的外交禮儀和溝通流程

過去,A國外交官只會說法語,B國外交官只用西里爾字母寫文件,C國外交官要求面談時必須使用古老的云紋金箔信件。。。而A2A的出現(xiàn),就是讓大家在同一個會議室開會時,都能說一套約定好的通用語言,用相同格式提交文件,讓商議好的結(jié)果可以被各方理解并執(zhí)行。

2. Agent Card(代理卡) = 外交國書 / 大使名片

在A2A規(guī)范中,每個Agent都要公開一份“Agent Card”,相當(dāng)于其外交官的身份名片。

包含以下內(nèi)容:Agent名稱、版本、能力描述、支持什么“語言或格式”等等。

現(xiàn)實(shí)中,外交官的身份名片讓對方知道他是誰,代表哪個國家,有哪些職權(quán)。同理,在A2A里,Agent Card列舉了“我(這個Agent)能執(zhí)行哪些技能”、“我的認(rèn)證方式是什么”、“輸入輸出格式有哪些”等等。

這樣,其他外交官想跟你合作就能很快找到你、理解你的能力,省去了大量溝通障礙。

3. Task(任務(wù))= 雙邊或多邊外交項目

A2A中最核心的概念之一是Task。

當(dāng)一個Agent想委托另一個Agent去完成什么事情,就像對外發(fā)布一份“合作項目意向書”。對方同意接單后,雙方會記錄一個Task ID,追蹤項目進(jìn)度、交換資料、直到該Task完成為止。

現(xiàn)實(shí)外交中,某國家就可能向某兔提議:“我們想合作修一條跨境高鐵,麻煩你們派工程隊來。”

這就對應(yīng)A2A的Task:由發(fā)起方提出需求(TaskSend),遠(yuǎn)程Agent表示接受(Task狀態(tài)變更),然后雙方在整個項目過程中隨時更新任務(wù)進(jìn)度

里面還有個Artifacts(成果物),就相當(dāng)于這個項目最后落地的“合同文本、建設(shè)成果”。在AI里可能是生成的一份報告、一張圖片或任意形式的輸出。而在A2A語言里,用 Artifact 表示最終生成的成果。

Message(消息),則是項目前期或中期的各種來回溝通。它可能包含對任務(wù)細(xì)節(jié)的補(bǔ)充說明、要對方再確認(rèn)某些條件等。這與現(xiàn)實(shí)外交中的電報、照會、使節(jié)往來是一模一樣的。

4. Push Notifications(推送通知)= 外交使館快報

在A2A里,如果一個Task是長期項目,遠(yuǎn)程Agent需要花很久時間才能完成,比如DeepResearch動輒十幾分鐘,某些復(fù)雜的Agent動輒一小時,它就可以通過推送通知機(jī)制向發(fā)起方更新進(jìn)度。

就像在外交中,如果一個跨國基建項目周期很長,甲國會定期給乙國發(fā)通報:“進(jìn)度到哪兒了?有什么問題需要協(xié)調(diào)?”

這樣能大幅提升異步協(xié)作的能力。過去很多AI系統(tǒng)比較原始,只能用同步的“請求-響應(yīng)”模式,就像放一個人在那24小時監(jiān)控,一旦響應(yīng)超時就中斷。

A2A允許設(shè)置回調(diào)接口、服務(wù)器端事件(SSE)等方式,把漫長的任務(wù)分段匯報,讓溝通保持流暢。

5. 身份認(rèn)證與安全= 外交特權(quán)與協(xié)議

A2A采用企業(yè)級的認(rèn)證策略,要求通信雙方先驗(yàn)證對方的身份憑證。例如在現(xiàn)實(shí)外交中,不是誰都能隨意闖進(jìn)某國大使館,必須持有相應(yīng)的外交護(hù)照、獲得許可。

這就是為了防范“冒名頂替”或“惡意竊聽”。

在A2A里,“認(rèn)證頭信息”“token”“簽名”等一系列安全手段,就相當(dāng)于外交通行證或蓋了公章的外事批準(zhǔn)文書,確保你跟我談判時是真的代表“你所在的國家”,而不是一個假冒的第三方。

這大概,就是A2A的機(jī)制,其實(shí)你看,跟國與國的外交,或者跟企業(yè)與企業(yè)之間的協(xié)同,沒有任何本質(zhì)的區(qū)別。

二. MCP協(xié)議

再來看MCP協(xié)議,全稱Model Context Protocol。

這就是Claude的母公司Anthropic在2024年11月推出并開源的一套標(biāo)準(zhǔn)。

A2A解決了AI外交官之間的交流流程問題,但是還有一個棘手的現(xiàn)實(shí),再能言善辯的外交官或者企業(yè)商務(wù),要是沒有 任何可靠的信息來源,對國際局勢和資源配置就兩眼一抹黑,根本就沒法干活。

更何況,在現(xiàn)代社會,外交官往往需要調(diào)用種種外部工具,比如簽證系統(tǒng)、國際結(jié)算系統(tǒng)、情報數(shù)據(jù)庫等等,才能完成任務(wù)。

同理,一個Agent若想承擔(dān)真正的復(fù)雜職責(zé),也需要能連上各種數(shù)據(jù)庫、文檔系統(tǒng)、企業(yè)應(yīng)用,甚至是硬件設(shè)備。

這就像給外交官建立完備的情報局,并授權(quán)他們使用某些工具處理事物。

過去,Agent要接入外部資源,常常得各自開發(fā)專用插件,與不同工具做深度整合,勞心勞力。

但是,我們現(xiàn)在有MCP了。

MCP致力于標(biāo)準(zhǔn)化大型語言模型(LLM)與外部數(shù)據(jù)源、工具之間的交互方式。 Anthropic的官方比喻很形象:MCP就像AI應(yīng)用程序的USB-C端口。

打開網(wǎng)易新聞 查看精彩圖片

USB-C是如今設(shè)備通用的接口,不管充電、傳數(shù)據(jù)都是一個口搞定。

MCP的野心也是這樣的,搞一個AI領(lǐng)域的萬能接口,讓各種模型和外部系統(tǒng)接駁都用同一個協(xié)議,而不是每次另寫一套集成方案。

以后AI模型要連數(shù)據(jù)庫、連搜索引擎、連第三方應(yīng)用,不用每家各訂各的協(xié)議,只要都支持MCP就能對上話。

它大概是客戶端-服務(wù)器架構(gòu)的思路:

1. MCP服務(wù)器= 整合的情報局

企業(yè)或個人可以把自己的數(shù)據(jù)庫、文件系統(tǒng)、日歷、甚至第三方服務(wù)封裝成一個個“MCP Server”,這些Server符合MCP協(xié)議,向外暴露統(tǒng)一格式的訪問端點(diǎn),任何Agent只要符合MCP客戶端標(biāo)準(zhǔn),就能發(fā)送請求、檢索信息或執(zhí)行操作。

比如高德就把自己的一些API,封裝成了MCP,只要你有高德的API Key,你就可以在Agent上調(diào)用高德。

打開網(wǎng)易新聞 查看精彩圖片

2. MCP客戶端 = 外交官實(shí)際使用的終端設(shè)備

就像一個Agent外交官帶著專用的終端設(shè)備,可以輸入各種指令:“幫我查一下財務(wù)系統(tǒng)里庫存數(shù)據(jù)”、“幫我向某個API提交請求”,“把某份PDF拿來我看看”。

過去,如果沒有MCP,你得針對各種系統(tǒng)寫不同的訪問代碼,整合起來極其麻煩;但是用了MCP后,只要客戶端支持協(xié)議,就能輕松切換到不同的MCP服務(wù)器。

調(diào)用不同的信息,隨時獲取情報、做業(yè)務(wù)流程。

這大概,就是MCP的機(jī)制。

三. A2A和MCP的不同

抽象講了很多,可能很多人,還是有點(diǎn)云里霧里。

別急,我們通過一個故事化的場景來把A2A和MCP的區(qū)別與合作說明白。

比如我們現(xiàn)在,有一個世界版的國際峰會。

各國首腦其實(shí)是各家公司的Agent代表,比如谷歌代表是小G,Anthropic派出了小A,OpenAI來了個小O,國內(nèi)的阿里派出小Q,騰訊派小T等等。大家齊聚一堂,要合作完成一項跨國任務(wù),比如聯(lián)合寫一份全球經(jīng)濟(jì)分析報告。

在沒有通用協(xié)議之前,這會基本開不起來,因?yàn)槊總€代表講自家語言,互相聽不懂。

但現(xiàn)在好了,有了A2A協(xié)議這套外交標(biāo)準(zhǔn),所有代表進(jìn)入會場前都簽了《A2A維也納外交公約》:發(fā)言必須用統(tǒng)一格式,說話先報身份、標(biāo)明意圖,回應(yīng)要引用之前的發(fā)言ID等等。

于是,小G可以正式地用A2A格式發(fā)消息給小O,小O收到后依樣畫葫蘆地回復(fù)一個A2A消息。這樣,不同公司的AI首次實(shí)現(xiàn)了無障礙對話。

二對話進(jìn)行中,各位AI代表難免需要查閱資料或使用工具幫助分析。

這時候Anthropic的小A說:“各位,如果需要外部數(shù)據(jù)或工具的支持,可以通過MCP系統(tǒng)獲取?!?/p>

原來,會場邊上還架設(shè)了一套“MCP同聲傳譯室”。里面坐著各種專家(對應(yīng)不同的MCP服務(wù)器)。

有谷歌Drive資料館管理員、有Slack聊天記錄管家、有GitHub代碼管家,甚至還有Postgres數(shù)據(jù)庫管理員…只要通過MCP提請求,他們就能用統(tǒng)一語言回應(yīng)。

比如,小Q(阿里云代表)想調(diào)自家云端數(shù)據(jù)庫算點(diǎn)東西,如果按老辦法,他得派人打個飛的回國去拿。

現(xiàn)在他直接在會上發(fā)送一個MCP請求(這請求其實(shí)也是按MCP定義的JSON格式發(fā)給對應(yīng)的MCP Server):

“我要查詢X數(shù)據(jù)庫里的Y數(shù)據(jù)”。

MCP數(shù)據(jù)庫管家翻譯室收到請求,立刻查庫拿到結(jié)果,用MCP語言回復(fù)給小Q。

整個過程對其他Agent來說是透明的,他們也聽懂了小Q引用的這份數(shù)據(jù),因?yàn)镸CP翻譯過來的格式大家都認(rèn)識。

繼續(xù)寫報告過程中,小G(谷歌)和小A(Anthropic)發(fā)現(xiàn)需要把各自部分內(nèi)容對接起來分析。

小G擅長數(shù)值分析,小A擅長語言總結(jié),那就協(xié)作:

小G通過A2A對小A說“我這邊算完GDP增速了,數(shù)據(jù)如下”,小A收到后,在自己這邊通過MCP又連了一下Excel表格插件,驗(yàn)證了數(shù)據(jù)趨勢,然后再用A2A回復(fù)小G一個總結(jié)段落……

一來二去,A2A讓Agent彼此溝通任務(wù),MCP讓每個智能體方便地調(diào)用外部工具補(bǔ)充信息,兩套協(xié)議配合默契,報告很快完工。

這個故事中,大家可以清楚地看到:

A2A更像外交部專線,解決的是Agent直接對話的問題。

MCP更像同聲傳譯與資源共享系統(tǒng),解決的是智能體對接外部信息的問題。

兩者配合起來,就是為AI版聯(lián)合國量身打造的溝通協(xié)定。有了它們,AI Agents可以各展所長又緊密合作,真正形成一個互聯(lián)互通的AI生態(tài)體系。

當(dāng)A2A和MCP這樣的開放協(xié)議逐漸統(tǒng)一標(biāo)準(zhǔn)之后,我們有理由暢想一個全新的AI Agent生態(tài)。

無數(shù)AI Agent像網(wǎng)站一樣部署在各處,它們通過A2A協(xié)議彼此發(fā)現(xiàn)、通信,通過MCP協(xié)議調(diào)動資源、分享知識。

我們作為用戶,就像當(dāng)年瀏覽網(wǎng)頁一樣,可以無感知地使用這些智能體的協(xié)同服務(wù)。比如,你的個人AI助理Agent接受了你的復(fù)雜委托:

“幫我計劃一次歐洲旅行,順便寫一篇游記稿件?!?/strong>

它不會單打獨(dú)斗,而是迅速通過A2A喊來各路好手:旅行規(guī)劃Agent、航班預(yù)訂Agent、翻譯Agent、文案Agent……

大家分工合作,各顯其能。

正如我們希望國家間少打貿(mào)易戰(zhàn)、多訂規(guī)則,AI領(lǐng)域我們也樂見各家少搞閉關(guān)鎖國,多推行兼容協(xié)議。

A2A和MCP的崛起,意味著AI產(chǎn)業(yè)已經(jīng)在朝著協(xié)作而非對抗的方向進(jìn)化。

現(xiàn)實(shí)世界,和AI世界,明明是一體,確實(shí)兩種趨勢。

真是諷刺。

最后,希望這篇文章,對你有一些幫助。

以上,既然看到這里了,如果覺得不錯,隨手點(diǎn)個贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標(biāo)?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克

>/ 投稿或爆料,請聯(lián)系郵箱:wzglyay@virxact.com