打開網(wǎng)易新聞 查看精彩圖片

作者 | 趙鈺瑩

4 月 9 日,阿里云在北京召開了 AI 勢能大會(huì)。在大會(huì)現(xiàn)場,阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光現(xiàn)場宣布百煉上線業(yè)界首個(gè)全生命周期 MCP 服務(wù),無需用戶管理資源、開發(fā)部署、工程運(yùn)維等工作,5 分鐘即可快速搭建一個(gè)連接 MCP 服務(wù)的 Agent(智能體)。百煉平臺(tái)首批上線了高德、無影、Fetch、Notion 等 50 多款阿里巴巴集團(tuán)和三方 MCP 服務(wù),覆蓋生活信息、瀏覽器、信息處理、內(nèi)容生成等領(lǐng)域,可滿足不同場景的 Agent 應(yīng)用開發(fā)需求(體驗(yàn)可點(diǎn)擊:https://bailian.console.aliyun.com/?spm=5176.29619931.J__Z58Z6CX7MY__Ll8p1ZOR.1.74cd521ccuvANG&tab=mcp#/mcp-market)。

打開網(wǎng)易新聞 查看精彩圖片

又是 MCP!這個(gè)最近頻繁被關(guān)注、被討論的協(xié)議。

MCP 的英文全稱是 Model Context Protocol(模型上下文協(xié)議),這是由 Claude 的母公司 Anthropic 推出的一項(xiàng)開放標(biāo)準(zhǔn)協(xié)議。官方解釋是“其目標(biāo)是為大型語言模型提供一種開放、標(biāo)準(zhǔn)化的方式,以便與外部數(shù)據(jù)源、工具和服務(wù)進(jìn)行連接?!焙唵卫斫?,MCP 相當(dāng)于大模型領(lǐng)域的“HTTP 協(xié)議”,其并不綁定任何大模型,這意味著用戶可以在支持 MCP 的工具中,用任何大模型調(diào)用 MCP 服務(wù)。

在 MCP 爆火之前,F(xiàn)unction Call 函數(shù)調(diào)用模式也被眾多開發(fā)者廣泛采納。由于不同廠商對(duì)于 Function Call 的標(biāo)準(zhǔn)、優(yōu)化方式和迭代路徑均不統(tǒng)一,開發(fā)者可根據(jù)規(guī)則自由定義函數(shù)和 API 調(diào)用方式,這其中就會(huì)出現(xiàn)不通用的問題,導(dǎo)致普及困難且需要重復(fù)開發(fā),這再次凸顯了 MCP 標(biāo)準(zhǔn)化的重要性。即便是不支持 Function call 的模型,開發(fā)者都能夠通過 MCP 協(xié)議的方式來調(diào)用任何一個(gè)服務(wù),而這也讓我們進(jìn)入了工具使用的平權(quán)時(shí)代。

1 MCP 爆火:其最大的價(jià)值之一是讓工具使用平權(quán)化

DeepSeek 的爆火被很多媒體認(rèn)為是開啟了“AI 平權(quán)”的新篇章,MCP 的出現(xiàn)則給我們帶來了工具使用的平權(quán)化。以阿里的 Qwen 系列為代表的開源模型,其表現(xiàn)出來的深度推理能力越來越強(qiáng),這也讓模型逐漸具備使用復(fù)雜工具的能力。在 Function call 時(shí)代,不同模型的插件 Function call 使用是閉源的,MCP 則解決了這一問題。

對(duì)于工具提供者來說,一個(gè)工具通過 MCP 協(xié)議可以被更廣泛的集成,這極大提升了工具的供應(yīng)范圍。對(duì)于模型提供商來說,其上的工具 / 應(yīng)用生態(tài)會(huì)極大繁榮,用戶可以利用這些工具 / 應(yīng)用來解決更復(fù)雜的問題。

隨著 OpenAI、阿里云接連宣布在產(chǎn)品中集成 MCP 協(xié)議,我們可以預(yù)見未來將會(huì)有更多廠商加入。那么,工具平權(quán)之后,這些廠商彼此之間的差異性會(huì)體現(xiàn)在哪里呢?

從應(yīng)用視角出發(fā),我們可以將 MCP 理解為相對(duì)底層的服務(wù),其下就是云服務(wù),其上就是模型層。模型層有一個(gè)很重要的工具是模型選擇工具,其結(jié)合用戶請(qǐng)求選擇 MCP 并將其運(yùn)行完成,再通過加工處理的方式給到用戶結(jié)果。最上面一層就是目前大家現(xiàn)在常說的 Agent。在 MCP 之前,由于每家產(chǎn)品的 API 集成都千差萬別,這意味著 Agent 的開發(fā)者需要做大量的定制集成工作,MCP 的出現(xiàn)也讓我們看到了 Agent 生態(tài)越來越繁榮的可能性。

如果結(jié)合上述分層來看,除 MCP 之外的每層都是可能出現(xiàn)差異性的。在媒體采訪環(huán)節(jié),阿里云百煉高級(jí)產(chǎn)品專家徐志遠(yuǎn)表示,Agent+MCP 落地有兩個(gè)非常關(guān)鍵的問題:一是模型本身的能力是否足夠,比如是否支持深度推理,是否能對(duì)復(fù)雜的任務(wù)和工具進(jìn)行調(diào)度;二是 MCP 的服務(wù)是否能穩(wěn)定、可用、高效的提供。

基于此,MCP 服務(wù)本質(zhì)上映射的是各軟件廠商、工程廠商以及工具提供商的 API 服務(wù),所謂的 API 服務(wù)最基礎(chǔ)是 host 在云上,因此阿里云未來會(huì)提供更堅(jiān)實(shí)的云基礎(chǔ)能力和彈性化的 MCP 能力,讓所有軟件廠商提供的 MCP 均可以實(shí)現(xiàn)高效供給。此外,阿里云將通過彈性、按量計(jì)算和出色的調(diào)度能力讓用戶實(shí)現(xiàn)“即點(diǎn)即用的 MCP 服務(wù)供給”,大幅降低供給成本。

有供給就會(huì)有消費(fèi),MCP 也是一個(gè)雙端的故事。這里的消費(fèi)就是 Agent,阿里云百煉平臺(tái)為用戶提供了端到端的 Agent 構(gòu)建能力,可以幫助用戶快速將應(yīng)用轉(zhuǎn)化成 Agent 的方式,相當(dāng)于將 MCP 的應(yīng)用搭建的完整流程在阿里云的平臺(tái)內(nèi)實(shí)現(xiàn)了閉環(huán),來幫助 MCP 服務(wù)最終落地。

2 MCP 很火,為什么很多軟件的 API 接口依舊沒有 MCP 化?

既然 MCP 聽起來是一個(gè)很不錯(cuò)的故事,為什么還是有很多軟件的 API 接口沒有 MCP 化呢?

在今天,我們與各類 AI 工具交互時(shí)最喜歡的方式是什么?我相信大部分人都會(huì)選擇自然語言的方式,只需要輸入文字指令,AI 工具就可以自動(dòng)流轉(zhuǎn),這是對(duì)用戶而言最簡便的方式,但過去的很多 API 接口只是接口,并沒有轉(zhuǎn)換成容易被理解的文本形式。比如,我們告知模型,“當(dāng)用戶查詢天氣時(shí)調(diào)用 A 接口”和“這個(gè)接口可以查詢天氣,你可以通過三種方式完成天氣的查詢,繼而完成 x 項(xiàng)任務(wù)”這兩種表述模式存在很大區(qū)別。

怎么理解這種區(qū)別呢?作為一個(gè) APP,高德比較常用的方式是地圖導(dǎo)航、打車等。當(dāng)高德 MCP 化之后,用戶不需要繁雜的資源部署和運(yùn)維工作,且無需編寫代碼讓大模型調(diào)用和接管工具,直接在百煉平臺(tái)上選擇通義千問大模型和高德 MCP 服務(wù),即可快速搭建一個(gè)具備城市旅游美食規(guī)劃的 Agent 應(yīng)用。該 Agent 不僅能完成基礎(chǔ)的地圖信息查詢?nèi)蝿?wù),它可根據(jù)用戶需求查詢目的地天氣、規(guī)劃一日游行程、搜索美食店鋪推薦、導(dǎo)航或打車到對(duì)應(yīng)店鋪等,真正意義上實(shí)現(xiàn)了 AI 和真實(shí)世界的交互。

因此,當(dāng)軟件進(jìn)行 MCP 化時(shí),第一個(gè)難點(diǎn)就是判斷清楚其 API 接口和服務(wù)對(duì)于模型的價(jià)值如何更好地表述出來,用戶從模型視角會(huì)如何使用這項(xiàng)服務(wù),這也是 Software for AI 的設(shè)計(jì)思路。第二是如何 MCP 化,包括但不限于語言化以及更多清晰的 schema 定義?;诖?,MCP 化是需要一定時(shí)間來實(shí)現(xiàn)的。

3 多 Agent 當(dāng)前的問題不能寄希望于 MCP

隨著用戶對(duì) Agent 逐漸產(chǎn)生感知,多 Agent 協(xié)作也成為大家十分關(guān)心的問題。坦白來講,多 Agent 和 MCP 其實(shí)是兩個(gè)方向的事情,多 Agent 目前要解決的并不是通信問題,而是規(guī)劃的有效性問題。如果大家了解 Manus 的任務(wù)執(zhí)行過程(不了解的用戶可以查看 AI 前線往期試用視頻:https://www.infoq.cn/video/grceDHIRrLJBWjvMw4v2),其虛擬機(jī)呈現(xiàn)出來的就是每個(gè)任務(wù)的規(guī)劃步驟,這個(gè)步驟的合理性、有效性是很關(guān)鍵的。

即便這個(gè)規(guī)劃過程沒問題,在后續(xù)執(zhí)行過程中大家會(huì)發(fā)現(xiàn)該任務(wù)需要訪問用戶的私域賬號(hào)才可以進(jìn)一步查看信息(AI 前線的試用視頻也體現(xiàn)了這一過程,此處不展開),當(dāng)前的 Agent 產(chǎn)品大多無法與人類產(chǎn)生協(xié)同,無法詢問用戶是否可以用賬號(hào)登錄某平臺(tái)查看信息。當(dāng)然,我們可以選擇放棄所有私域的內(nèi)容,但很多時(shí)候私域的內(nèi)容往往更有價(jià)值。MCP 讓 Agent 可以更好地訪問各類軟件,但并沒有解決規(guī)劃路徑和執(zhí)行策略中的問題。

4 結(jié)語

總結(jié)來看,MCP 帶來的核心改變是讓很多基于人來設(shè)計(jì)的 API 接口逐漸變?yōu)椤澳P陀押谩钡姆绞剑琒oftware for AI 會(huì)成為一個(gè)非常重要的趨勢,Agent 生態(tài)會(huì)基于此進(jìn)入快速發(fā)展?fàn)顟B(tài)。底層云平臺(tái)的能力、模型的能力以及 Agent 構(gòu)建能力都將成為差異化競爭的重要部分。阿里云以及百煉平臺(tái)已經(jīng)將整個(gè)服務(wù)搭建完善,實(shí)現(xiàn)了端到端的完整閉環(huán),這也是阿里云致力于讓千行百業(yè)都建立起生產(chǎn)級(jí) AI 應(yīng)用的重要一步。