
給企業(yè)落地大模型打造基礎(chǔ)設(shè)施。
隨著大模型迭代加速,AI 應(yīng)用生態(tài)正面臨前所未有的壓力:越來越多的垂類應(yīng)用被更強(qiáng)、更通用的模型 “吞噬”。開發(fā)者的焦慮感在加劇,企業(yè)也開始重新評估開發(fā) AI 應(yīng)用的投入產(chǎn)出比。
4 月 25 日在武漢舉辦的 Create 2025 百度 AI 開發(fā)者大會上,百度創(chuàng)始人李彥宏回應(yīng)了這股 “模型焦慮”:大模型快速迭代不會吞掉所有 AI 應(yīng)用,“只要找對場景,選對基礎(chǔ)模型,有時(shí)候還要學(xué)一點(diǎn)調(diào)模型的方法,在此基礎(chǔ)上做出來的應(yīng)用不會過時(shí)?!?/p>
李彥宏展示了百度智能云在交通信控、鋼鐵行業(yè)中的 AI 應(yīng)用案例,稱通用大模型再怎么升級,也不能獨(dú)立完成 “檢測高速公路上各種安全事件” 或者 “檢測熱軋帶鋼表面的缺陷” 等精細(xì)任務(wù),它們與小模型協(xié)同才能產(chǎn)生更好的解決方案。
他認(rèn)為,大模型能力提升會讓這些 AI 應(yīng)用護(hù)城河更深、價(jià)值更高,“這樣的機(jī)會,在千行百業(yè)里比比皆是”。市場調(diào)研機(jī)構(gòu) Gartner 估算,到 2029 年,中國 60% 的企業(yè)將把 AI 融入主要產(chǎn)品和服務(wù),而這些 AI 功能也會成為企業(yè)收入增長的主要?jiǎng)恿Α?/p>
幫企業(yè)客戶開發(fā)大模型應(yīng)用,是百度智能云近年來收入增長的動力。2024 年,百度智能云收入達(dá)到 219 億元人民幣,同比增長 17 %,是百度增速最快的業(yè)務(wù)線。據(jù)統(tǒng)計(jì),今年一季度,百度智能云繼續(xù)位居國內(nèi)的大模型中標(biāo)項(xiàng)目數(shù)量和金額第一。
2023 年開始內(nèi)測的千帆,是百度智能云推動大模型落地企業(yè)的核心產(chǎn)品。這次 AI 開發(fā)者大會上,百度智能云再次升級千帆大模型平臺:
模型開發(fā)平臺更加多維開放,支持上百個(gè)模型服務(wù);新增多模態(tài)、深度思考模型工具鏈,并且成為國內(nèi)首個(gè)把 RFT、GRPO 等領(lǐng)先強(qiáng)化學(xué)習(xí)方法產(chǎn)品化的平臺;“一鍵蒸餾” 功能,讓企業(yè)客戶更方便地用小參數(shù)模型 “學(xué)” 到大參數(shù)模型,解決特定問題的推理能力,降低推理成本。
數(shù)據(jù)智能平臺上線,讓企業(yè)把原來散落在各個(gè)部門、流程中的數(shù)據(jù)統(tǒng)一管理和治理,挖掘數(shù)據(jù)價(jià)值,實(shí)現(xiàn)數(shù)據(jù)變現(xiàn),以及提升業(yè)務(wù)決策效率。
應(yīng)用開發(fā)平臺增加 “智能體 Pro”,讓企業(yè)客戶可以批量開發(fā)嵌入到工作場景中的大模型應(yīng)用,尤其是當(dāng)前行業(yè)中的熱門產(chǎn)品形態(tài) Agent,讓各行各業(yè)定制自己的企業(yè)專屬智能體;發(fā)布完整的 MCP(Model Context Protocol)服務(wù),支持客戶和開發(fā)者將 MCP Server 接入大模型應(yīng)用,推出低代碼創(chuàng)建 MCP Server 的工具,提供免費(fèi)托管服務(wù),以及組建聚集上千個(gè) MCP Server 的廣場。
MCP 是 Anthropic 在 2024 年提出的協(xié)議,用統(tǒng)一的方式,把現(xiàn)有軟件變成大模型可以直接調(diào)用的 “工具”?!癕CP 讓 AI 更懂外部世界,更容易獲得信息,更自由地調(diào)用工具,是 AI 發(fā)展的一大步?!?李彥宏說,“現(xiàn)在基于 MCP 開發(fā) Agent ,就像 2010 年開發(fā)移動 App?!?/p>
百度各業(yè)務(wù)線也全面支持 MCP,將搜索、地圖、文庫、電商、網(wǎng)盤等產(chǎn)品能力做成 MCP Server。企業(yè)和開發(fā)者在千帆平臺中可以把它們接入自己的 Agent。
2023 年 3 月,百度在國內(nèi)率先發(fā)布對標(biāo) ChatGPT 的文心一言,并推動公司全面向大模型轉(zhuǎn)型。如今,百度正進(jìn)一步整合內(nèi)部資源,抓住企業(yè)落地大模型的機(jī)會。云平臺間的大模型企業(yè)服務(wù)競爭,已從單點(diǎn)技術(shù)比拼走向體系化能力角逐。
三個(gè)平臺,覆蓋企業(yè)落地大模型的不同環(huán)節(jié)
兩年迭代,百度智能云逐步認(rèn)識到如何開發(fā)一款好的企業(yè)大模型開發(fā)平臺:“門檻要足夠低,低到人人可用;天花板要足夠高,必須有能力服務(wù)那些最嚴(yán)肅、要求最苛刻的企業(yè)場景。”
這是百度智能云千帆平臺的升級目標(biāo)?!按蠹矣锌赡苡玫氖峭瑯拥幕A(chǔ)模型,要做出差異化的體驗(yàn),靠的是工程能力?!?百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖說,企業(yè)可以利用千帆 “快速完成從數(shù)據(jù)處理到模型定制、應(yīng)用開發(fā)的一整套工作,開發(fā)出效果更好的產(chǎn)品?!?/p>
模型開發(fā)平臺已上線超過 100 款基礎(chǔ)模型,涵蓋百度新發(fā)布的原生多模態(tài)模型文心 4.5 Turbo、深度思考模型文心 X1 Turbo,以及 DeepSeek、阿里等公司開源模型,跨越原生多模態(tài)、文本生成、深度推理、圖像 / 視頻生成、語音大模型等方向。企業(yè)客戶可通過 API 調(diào)用這些模型。
這只是千帆的基礎(chǔ)能力。他們還開發(fā)了模型工具鏈,覆蓋數(shù)據(jù)管理、模型精調(diào)、評估優(yōu)化與部署。“雖然從 0 到 1 訓(xùn)練大模型的需求沒有那么多了,但企業(yè)定制專、精模型的需求還在增長?!?沈抖說。
更新后的模型開發(fā)平臺上,企業(yè)可以拿自己收集的數(shù)據(jù)集精調(diào)平臺上的基礎(chǔ)模型,讓它更好地解決特定場景的問題,也可以用新上線的 “蒸餾” 功能,把大尺寸模型解決特定任務(wù)的能力遷移到小模型上。

蒸餾并不是一個(gè)全新的功能。百度智能云 AI 與大模型平臺總經(jīng)理忻舟說,在 DeepSeek 推出 R1 前,千帆就可以支持企業(yè)用蒸餾的方式開發(fā)模型,“一直在做”,R1 加深市場認(rèn)知,也驗(yàn)證了千帆的判斷,加上公司內(nèi)部業(yè)務(wù)有需求,蒸餾的價(jià)值提升,就推出了 “模型蒸餾樣板間標(biāo)品化產(chǎn)品”。
比如智聯(lián)招聘使用千帆模型開發(fā)平臺的模型蒸餾功能,把 6000 多億參數(shù)的 DeepSeek-R1 作為 “教師模型”,蒸餾出它回答 “人崗匹配” 問題的數(shù)據(jù)集,清理后用它精調(diào)百億參數(shù)的 ERNIE Speed 模型,保留效果的同時(shí),將模型使用成本壓縮至原來的三成。
忻舟說,這個(gè)平臺也是一個(gè)可以迭代的模型開發(fā)體系。很多的 C 端用戶使用大模型,不能為廠商提供直接有效的數(shù)據(jù),促進(jìn)基礎(chǔ)大模型能力的提升,這個(gè)在行業(yè)已經(jīng)形成共識。比如 DeepSeek 發(fā)布 R1 前并沒有積累太多的用戶。
不過企業(yè)真實(shí)應(yīng)用場景上,調(diào)用大模型解決的都是特定場景問題,所以模型使用反饋對模型的價(jià)值都非常大?!扒ХP烷_發(fā)平臺可以幫企業(yè)利用這些有效反饋,做模型精調(diào)并持續(xù)改善模型效果,讓企業(yè)的應(yīng)用效果越來越好?!?他說。
他們給模型開發(fā)平臺設(shè)計(jì)了多種使用模式,以兼容不同的用戶。針對開發(fā)能力強(qiáng)的企業(yè)和開發(fā)者,他們提供集成接口,支持本地、云端 IDE,或者命令行使用,并兼容 Python、Go、JS、Java 等多種編程語言。為了進(jìn)一步降低門檻,他們會提供精調(diào)好的行業(yè)模型或者提供模型 “樣板間”。
企業(yè)推動大模型落地的過程中,開發(fā)應(yīng)用是最耗時(shí)的環(huán)節(jié)。百度智能云應(yīng)用平臺部總經(jīng)理朱廣翔說,他們調(diào)研發(fā)現(xiàn),許多企業(yè)將 90% 的 AI 項(xiàng)目時(shí)間花在了應(yīng)用開發(fā)上。
尤其是 DeepSeek-R1、文心 X1 等深度思考模型出現(xiàn),讓 Agent 解決復(fù)雜問題的能力增強(qiáng),但開發(fā)難度也跟著上升。
在開發(fā)者大會上,沈抖用 “大工程” 形容 Agent 開發(fā)過程。他們調(diào)研發(fā)現(xiàn),企業(yè)想要做好 Agent 要具備以下能力:
結(jié)合企業(yè)自己的私域數(shù)據(jù)、企業(yè)知識庫,讓 Agent 學(xué)習(xí)企業(yè)多年沉淀的行業(yè)經(jīng)驗(yàn),理解業(yè)務(wù)場景。
準(zhǔn)確匹配到企業(yè)的標(biāo)準(zhǔn) SOP,能根據(jù)企業(yè)規(guī)范編排業(yè)務(wù)流程、執(zhí)行任務(wù)。
調(diào)用各種工具,解決復(fù)雜問題;同時(shí)還得達(dá)到企業(yè)級服務(wù)要求的安全性、穩(wěn)定性、可控性。
千帆應(yīng)用開發(fā)平臺推出了智能體 Pro,用戶只需要輸入提示詞,上傳需要調(diào)用的知識庫,選擇特定的組件,比如 Deep Research,就能迅速創(chuàng)建一個(gè)像行業(yè)內(nèi) Deep Research 應(yīng)用那樣的 Agent。而且它不僅可以像其他的 Deep Research 那樣搜索公開資料,也可以調(diào)用企業(yè)內(nèi)部的數(shù)據(jù)庫,整合后生成報(bào)告。
企業(yè)和開發(fā)者過去常用 RAG(檢索增強(qiáng)生成)功能,讓大模型根據(jù)特定的知識庫回答問題,從而提高解題能力。隨著智能體 Pro 推出,千帆也把它升級成 Agentic RAG。
朱廣翔舉例,銷售要去找游樂園談合作,想用公司開發(fā)的 Agent 推薦方案,傳統(tǒng)的 RAG 會把關(guān)鍵詞做向量化,然后用這些特征匹配知識庫,如果公司沒有跟游樂園合作過,可能什么都沒有;而 Agentic RAG 具備思考能力,它會先拆解用戶的需求,知識庫中沒有完全匹配項(xiàng),它也會找相似的方案,然后整合出一個(gè)答案。

用智能體 Pro 降低企業(yè)開發(fā)大模型應(yīng)用門檻的同時(shí),千帆也全面支持 MCP,提升 Agent 價(jià)值。朱廣翔說,百度智能云是第一家支持 MCP 的云平臺,從 3 月到現(xiàn)在搭建起了一套完整的 MCP 服務(wù),支持企業(yè)的 Agent 接入 MCP,還開發(fā)低代碼制作 MCP Server 的工具,提供免費(fèi)托管服務(wù)。
他們收集整理了行業(yè)內(nèi)公開的優(yōu)質(zhì) MCP Server,與百度開發(fā)的圖像識別、OCR、語音識別、語音合成等 AI 工具,百度智能云長期積累的能源電力、智能交通等垂直行業(yè)的工具,以及百度 AI 搜索、地圖、電商、網(wǎng)盤、百科等核心業(yè)務(wù)聚集到一起,組建超過上千個(gè) MCP Server 廣場。他說,利用這些 MCP 組件,企業(yè)可以不斷給 Agent 增加各種技能,讓它們持續(xù)成長,變成一個(gè)個(gè)行業(yè)專家。
與模型開發(fā)平臺類似,千帆的應(yīng)用開發(fā)平臺也準(zhǔn)備了 “樣板間”,降低企業(yè)的使用門檻。他們也把新功能與無代碼開發(fā)工具 “秒噠” 打通,讓企業(yè)一站式開發(fā) AI 產(chǎn)品。
數(shù)據(jù)智能平臺是千帆新上線的服務(wù)。百度智能云數(shù)據(jù)平臺部總經(jīng)理劉斌說,他們調(diào)查發(fā)現(xiàn),企業(yè)訓(xùn)練模型、開發(fā)應(yīng)用的過程中,50~80% 時(shí)間都花在了在數(shù)據(jù)治理上。
尤其在多模態(tài)模型能力不斷增強(qiáng)的當(dāng)下,企業(yè)同時(shí)面臨文本、圖像、語音、視頻等多模態(tài)數(shù)據(jù)的治理難題,而現(xiàn)有工具和流程仍以人工為主,協(xié)作復(fù)雜、自動化程度低,安全也難以保障。
“拉高的不只是機(jī)器和人力成本,還有機(jī)會成本,這對企業(yè)來說損失更大?!?劉斌說,企業(yè)用好大模型,數(shù)據(jù)工程是與算力、模型同樣重要的基礎(chǔ)設(shè)施,“但多模態(tài)數(shù)據(jù)治理還停留在農(nóng)耕時(shí)代”。
據(jù)介紹,數(shù)據(jù)智能平臺具備多模態(tài)數(shù)據(jù)管理、多模態(tài)數(shù)據(jù)處理、彈性 AI 計(jì)算、統(tǒng)一在線協(xié)同開發(fā)四項(xiàng)核心能力:5 大類算子 100+,支持抽取、清洗、過濾、去重、嵌入等數(shù)據(jù)處理主要環(huán)節(jié),覆蓋文檔、圖像、語音、音頻等所有模態(tài),大部分場景下只需通過少量配置,就可完成數(shù)據(jù)處理;很好支持 GPU+CPU 的混合計(jì)算,強(qiáng)彈性可以用來高效處理不同規(guī)模的數(shù)據(jù);跨團(tuán)隊(duì)協(xié)作能力讓大規(guī)模開發(fā)變成可能。

這一平臺的首位客戶,正是百度自己。劉斌說,數(shù)據(jù)智能平臺是百度內(nèi)部長期使用的數(shù)據(jù)工具的產(chǎn)品化版本,支撐了文心 4.5 及其升級版 Turbo 的訓(xùn)練,解決了數(shù)據(jù)冗余、不一致、精細(xì)管理缺失等難題,讓數(shù)據(jù)生產(chǎn)效率提升六倍,算力成本節(jié)省 30%,而且 “數(shù)據(jù)安全可共享、可審計(jì)”。
在百度智能云看來,隨著大模型與 AI 原生應(yīng)用加速滲透產(chǎn)業(yè)核心場景,企業(yè)在數(shù)據(jù)管理方面的需求會持續(xù)增長,數(shù)據(jù)工程也會越來越重要。“未來多模態(tài)的數(shù)據(jù)體量會有 10 倍以上增長空間?!?劉斌說,“這是政企客戶的剛需?!?/p>
云平臺的大模型應(yīng)用競爭,比拼的是體系能力
千帆的誕生和迭代,是百度全面轉(zhuǎn)型大模型的產(chǎn)物。
朱廣翔說,大模型浪潮到來后,百度的各個(gè)業(yè)務(wù)快速接入大模型,“開發(fā)了一大堆應(yīng)用”,覆蓋問答、客服、創(chuàng)作、代碼執(zhí)行等各種場景,他們從中提煉不同團(tuán)隊(duì)開發(fā)大模型應(yīng)用或功能的共性,做出千帆應(yīng)用開發(fā)平臺——模型開發(fā)平臺也是類似的過程。
把公司內(nèi)部技術(shù)對外開放,是大型云計(jì)算平臺開發(fā)產(chǎn)品的慣用邏輯。AWS 的第一款產(chǎn)品是亞馬遜電商網(wǎng)站的商品數(shù)據(jù)庫,火山引擎早期最成功的產(chǎn)品是字節(jié)的推薦算法服務(wù)。
在忻舟看來,基于公司內(nèi)部的技術(shù)積累迅速推出新產(chǎn)品,“只是短期優(yōu)勢”。傳統(tǒng)的企業(yè)客戶,業(yè)務(wù)流程相對穩(wěn)定,沒有那么容易接納新技術(shù),“效果只是企業(yè)考慮的因素之一,他們同樣在意性能和成本”。
想抓住企業(yè)落地大模型的機(jī)會,云平臺不僅要有各種類型的領(lǐng)先模型,還要理解企業(yè)的真實(shí)需求,并提供低成本的方案。
百度云計(jì)算業(yè)務(wù)從 2015 年正式對外運(yùn)營,后更名為 “百度智能云”,一直有著 AI 云的鮮明標(biāo)簽。據(jù)市場調(diào)研機(jī)構(gòu) IDC 統(tǒng)計(jì),截至 2023 年,百度智能云在中國 AI 公有云市場的份額連續(xù) 5 年保持第一。
在此期間,百度智能云積累一批愿意嘗試用 AI 技術(shù)改造業(yè)務(wù)的客戶,和 AI 在產(chǎn)業(yè)中落地的經(jīng)驗(yàn)。對于云計(jì)算公司來說,客戶和服務(wù)經(jīng)驗(yàn)都是優(yōu)質(zhì)資產(chǎn)。一旦某個(gè)企業(yè)選定公有云服務(wù)商,都會在數(shù)據(jù)和業(yè)務(wù)層面深入綁定,遷移成本會持續(xù)升高。在新技術(shù)到來時(shí),這些客戶往往會愿意在原有的云計(jì)算平臺上繼續(xù)探索。
百度智能云介紹,千帆已經(jīng)服務(wù)超過 40 萬客戶,在央企滲透率超過 60%,精調(diào)了 4.5 萬個(gè)模型,開發(fā)了超 100 萬個(gè)應(yīng)用。這幫助百度智能云更好地理解用戶需求,持續(xù)迭代千帆大模型平臺。
企業(yè)客戶在意的性能、成本,比拼的是云平臺的技術(shù)系統(tǒng)實(shí)力。百度智能云在 2 月初上架 DeepSeek V3 和 R1 模型,API 調(diào)用價(jià)格比 DeepSeek 官方刊例價(jià)還低,當(dāng)天就吸引 1.5 萬客戶使用。
“這不是大額補(bǔ)貼的結(jié)果?!?忻舟說,這是百度智能云在大模型推理性能優(yōu)化方向的技術(shù)積累,他們聯(lián)合百度智能云異構(gòu)計(jì)算平臺百舸、基礎(chǔ)架構(gòu)部等團(tuán)隊(duì),針對 DeepSeek 的模型架構(gòu)做了深入優(yōu)化,比如將模型推理的 Prefill(處理提示詞)和 Decode(生成內(nèi)容) 兩個(gè)階段分離,使其能在不同的 GPU 上并行處理,從而降低了算力成本。
這次 AI 開發(fā)者大會上,百度又為千帆大模型平臺增加更多能力,把公司各個(gè)業(yè)務(wù)開發(fā)的核心產(chǎn)品轉(zhuǎn)換成 MCP Server 大規(guī)模對外提供。這樣的開放程度,在全球大型公司中都很罕見,大多數(shù)公司支持 MCP 都只是為了利用生態(tài)增強(qiáng)實(shí)力。
“企業(yè)現(xiàn)在甚至可以用千帆,快速開發(fā)出類似 Perplexity 或 Manus 的產(chǎn)品?!?朱廣翔說,接下來千帆也會兼容 Google 推出的 A2A 多智能體協(xié)作協(xié)議,讓企業(yè)開發(fā)的 Agent 與全世界的 Agent 交互,提高產(chǎn)品價(jià)值。
數(shù)據(jù)智能平臺則讓千帆體系變得更完整。據(jù)市場調(diào)研機(jī)構(gòu) Gartner 估算,到 2028 年,中國企業(yè)處理 AI 數(shù)據(jù)的投資將達(dá)到 2024 年的 20 倍。
“數(shù)據(jù)平臺有機(jī)會在更多場景發(fā)揮價(jià)值,推動企業(yè)的數(shù)據(jù)治理從農(nóng)耕時(shí)代邁入工業(yè)時(shí)代?!?劉斌說,無論是模型能力的演進(jìn)還是 Agent 應(yīng)用的擴(kuò)展,數(shù)據(jù)始終是基礎(chǔ)。
“我們其實(shí)不存在 ‘Stay on the table’ 的問題,因?yàn)槲覀兪畮啄昵熬鸵呀?jīng)上了 ‘table’?!?李彥宏在去年底的內(nèi)部會上說,“百度絕不可能下這個(gè) ‘table’。”
千帆的體系化升級,是百度給出的最新證明。
題圖來源:《人生切割術(shù)》
熱門跟貼