作者:周雅

現(xiàn)在AI助手越來越多,但它們之間卻像是生活在平行世界,完全不能交流,現(xiàn)在谷歌也坐不住了,要來解決這個痛點。

過去幾個月,至少有兩個AI助手互操作標(biāo)準(zhǔn)出現(xiàn):先是Anthropic推出了“模型上下文協(xié)議(MCP)”,然后思科帶頭搞了個叫做“AGNTCY”的聯(lián)盟標(biāo)準(zhǔn)。這是因為大家越來越認識到,讓不同公司開發(fā)的AI助手能夠“互相說話”非常重要。想象一下,財務(wù)部的AI、人事部的AI和銷售部的AI如果能無縫合作,效率會提高多少!

正是看到這個趨勢,現(xiàn)在谷歌也來湊熱鬧了,最新推出“Agent2Agent”(簡稱A2A)協(xié)議。

打開網(wǎng)易新聞 查看精彩圖片

這次谷歌可沒單打獨斗,而是聯(lián)合了50多家大廠一起上,包括Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG和Workday等公司。看這陣仗,A2A協(xié)議旨在成為AI助手和AI應(yīng)用之間的互操作語言。

打開網(wǎng)易新聞 查看精彩圖片

谷歌云業(yè)務(wù)應(yīng)用平臺副總裁兼總經(jīng)理Rao Surapaneni在獨家采訪中表示,A2A讓具有不同專長和數(shù)據(jù)節(jié)點的助手更容易獲取所需上下文。

“每個AI系統(tǒng)都有特定專長,因為它們擁有數(shù)據(jù)節(jié)點或邏輯節(jié)點,或者當(dāng)前用戶群專注于特定任務(wù),這些框架預(yù)計會圍繞非常專業(yè)的焦點發(fā)展。作為客戶,如果我部署了這些多平臺和多框架,我不希望在它們之間來回切換。”他后面還補了一句:“谷歌與50多個合作伙伴和客戶合作的部分原因是為了構(gòu)建A2A,使其具有「以企業(yè)級、安全和可信方式進行互操作的能力」?!?/p>

什么是A2A協(xié)議?

這個A2A協(xié)議到底是什么?

簡單來說,A2A協(xié)議主要是讓兩種AI助手互相交流:一種叫「客戶端助手」,另一種叫「遠程助手」。

這就像餐廳里的服務(wù)員和廚師的關(guān)系:服務(wù)員(客戶端助手)接收你的點餐并傳達給廚師,而廚師(遠程助手)則負責(zé)根據(jù)這些要求烹飪美食。比如你問自家AI一個財務(wù)問題,它如果不懂,就可以去請教專門的財務(wù)AI,然后把答案告訴你,全程你不用操心。

谷歌在最新一篇博文中寫道,A2A協(xié)議主要包括四項功能:

功能一,能力發(fā)現(xiàn):助手可以通過JSON格式的“助手卡片”(技術(shù)上叫Agent Card)來展示它有什么能力,就像我們?nèi)祟愑袀€人簡歷一樣,這樣客戶端助手就能確定最適合完成任務(wù)的遠程助手。比如你問:“我想了解今年的稅收政策變化”,你的個人助手可能對稅務(wù)不精通,但它知道誰是稅務(wù)專家,于是就會找到稅務(wù)助手來合作。

功能二,任務(wù)管理:確保助手間的對話都是圍繞完成任務(wù)展開的,并定義任務(wù)的生命周期。對于耗時較長的任務(wù),兩個助手會保持聯(lián)系,互相更新最新進度。任務(wù)的最終結(jié)果被稱為“工件(artifact)”。這就像你點了一道復(fù)雜的菜,廚師會不時告訴服務(wù)員:“已經(jīng)開始準(zhǔn)備食材了”、“馬上就好了”,最后才端出成品。

功能三,協(xié)作功能:助手們可以互相發(fā)送消息,傳遞上下文、回復(fù)、工件或用戶指令。就像服務(wù)員可能會告訴廚師:“客人對海鮮過敏”或“客人喜歡微辣口味”,AI助手之間也會分享這類重要信息,確保最終結(jié)果符合你的需求。

功能四,用戶體驗協(xié)商:每條消息都包含“一部分”內(nèi)容,比如生成的圖像。每個部分都有特定的內(nèi)容類型,這樣客戶端和遠程助手就能協(xié)商出正確的格式,并明確包括用戶界面能力的協(xié)商:比如是否支持嵌入框架、視頻、網(wǎng)頁表單等等。這就像服務(wù)員知道,你是坐在高腳凳上還是在包廂里,從而決定如何最好地為你上菜。

總結(jié)而言,A2A就像是給AI助手們創(chuàng)造了一種“通用語言”,讓它們能夠無障礙交流,共同為用戶提供更全面、更智能的服務(wù)。

最重要的是,谷歌把A2A設(shè)計成了開源協(xié)議,整個AI社區(qū)都可以來貢獻代碼和更新。Surapaneni強調(diào):“我們希望這真正成為一個社區(qū)驅(qū)動的開源項目,有一個專門的治理委員會,但核心是要保持開放且由社區(qū)驅(qū)動?!?/p>

在開發(fā)A2A過程中,谷歌團隊特別注重讓AI助手們能用“自然、非結(jié)構(gòu)化”的方式交流,即使它們沒有共享的記憶、工具和上下文也沒問題。而且A2A基于HTTP和JSON這些現(xiàn)成標(biāo)準(zhǔn)構(gòu)建,所以更容易與現(xiàn)有技術(shù)棧集成,安全性也有保障。

真實案例:A2A如何革新招聘流程?

為了讓大家更直觀看到A2A協(xié)議的能力,谷歌還特別用了一個真實案例,主打一個全面。

谷歌在最新博文中寫道:有了A2A,招聘一名軟件工程師的過程可以變得很輕松:在Agentspace這樣的統(tǒng)一界面中,招聘經(jīng)理只需告訴自己的AI助手:“幫我找符合這個職位描述、在這個地區(qū)、具備這些技能的候選人?!?/p>

接下來,神奇的事情發(fā)生了:

· 你的AI助手會自動聯(lián)系其他專門的招聘AI助手;

· 這些專業(yè)助手會幫你篩選潛在候選人;

· 你收到建議名單后,只需動動手指,就能指示助手安排面試;

· 面試結(jié)束后,另一個專門的AI助手還能幫你完成背景調(diào)查。

整個候選人尋找過程變得流暢無比。

AI圈的“通用語言”之爭:互操作協(xié)議的崛起

當(dāng)然,A2A只是AI助手“通用語言”大戰(zhàn)的最新一幕,讓AI助手互相聽懂對方說話這件事,現(xiàn)在可熱鬧了,各大科技巨頭都在搶灘布局。

除了谷歌的A2A,市場上還有思科聯(lián)合LangChain、Galileo、LlamaIndex和Glean組成的AGNTCY聯(lián)盟,目標(biāo)是為AI助手間創(chuàng)建標(biāo)準(zhǔn)通信方式;同時參與A2A的LangChain還單獨開發(fā)了Agent Protocol;微軟也升級了AutoGen框架,都是為了讓AI助手們能順暢交流。

有意思的是,微軟等很多公司已經(jīng)擁抱了Anthropic的MCP協(xié)議,就連谷歌自己也通過新的Agent Development Kit支持MCP。面對這種情況,谷歌云Surapaneni趕緊澄清:A2A和MCP不是競爭關(guān)系,而是互補的。

“我們把MCP和A2A看作互補能力,”他解釋道,“A2A處于更高層次的抽象,讓應(yīng)用和助手互相交流。你可以把它想象成分層架構(gòu),MCP負責(zé)在底層與LLM、工具和數(shù)據(jù)交互?!?/p>

谷歌明顯不想把自己孤立起來,Surapaneni沒有排除與其他互操作協(xié)議聯(lián)盟合作的可能。他表示A2A隨時歡迎新成員加入,協(xié)議會根據(jù)社區(qū)建議和需求不斷更新,是一個“活著的代碼”——“我們會考慮如何與所有協(xié)議保持一致,總會有一些協(xié)議帶來好點子,我們希望把所有好想法都吸收進來?!?/p>

為什么互操作性需求突然爆發(fā)?

各大組織和AI公司都認同一個觀點:未來的世界不會只有一個AI模型稱霸,而是多模型并存。這意味著AI助手也會基于不同的語言和框架構(gòu)建,這很合理。

但要實現(xiàn)一個完整的助手生態(tài)系統(tǒng),就必須讓各家公司的助手能夠互相交流。這說起來容易做起來難!行業(yè)標(biāo)準(zhǔn)通常需要時間才能確立,還需要大部分公司的認可和支持。

無論是A2A、MCP還是AGNTCY,如果希望成功創(chuàng)建一種標(biāo)準(zhǔn)方式讓所有AI助手都能使用,不管它們是誰構(gòu)建的或基于哪種框架,都必須實現(xiàn)大規(guī)模采用和部署。

Surapaneni也坦率承認,即使有50多個合作伙伴在研發(fā)A2A,目前的采用率仍未達到臨界點。“所有這些協(xié)議都會不斷發(fā)展,特別是在AI快速變化的環(huán)境下,我們會發(fā)現(xiàn)新的用例和場景需要解決,所以它會繼續(xù)成長,”他說道。