打開網(wǎng)易新聞 查看精彩圖片

出品 | CSDN(ID:CSDNnews)

2025 年是 Agent 爆發(fā)之年已成共識(shí),由 Agent 和推理模型帶來的強(qiáng)調(diào)應(yīng)用智能程度的 Agentic AI(自主式 AI)大行其道。

北京時(shí)間 3 月 31 日,近期幾度融資的智譜在中關(guān)村論壇上正式發(fā)布「AutoGLM 沉思」—— 一個(gè)能探究開放式問題,并根據(jù)結(jié)果執(zhí)行操作的自主智能體(AI Agent)。它能夠模擬人類的思維過程,完成從數(shù)據(jù)檢索、分析到生成報(bào)告。

打開網(wǎng)易新聞 查看精彩圖片

值得關(guān)注的是,AutoGLM 沉思不僅具備深度研究能力(Deep Research),還能實(shí)現(xiàn)實(shí)際操作(Operator),真正推動(dòng) AI Agent 進(jìn)入“邊想邊干”的階段。并且免費(fèi)、不限量,在智譜清言 PC 客戶端已經(jīng)上線,可以直接體驗(yàn)其研究能力和操作能力。

智譜 CEO 張鵬表示,此次發(fā)布的為 preview 版本,核心支持 research 場(chǎng)景;在未來兩周,將進(jìn)一步擴(kuò)展更多智能體執(zhí)行能力。包括推出“虛擬機(jī)”版本,進(jìn)一步增強(qiáng) AI Agent 的實(shí)際落地能力。

打開網(wǎng)易新聞 查看精彩圖片

除此之外,他還預(yù)告:2025 是智譜開源年,在 4 月 14 日,智譜的基座模型GLM-4-Air、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination 均將開源。

當(dāng) AI 學(xué)會(huì)自己搞錢

在發(fā)布現(xiàn)場(chǎng),張鵬首先以 Demo 展示了 AutoGLM 沉思的效果,頗引人關(guān)注。

14 天前智譜秘密開展了一項(xiàng)測(cè)試:注冊(cè)一個(gè)小紅書賬號(hào),專注于生活科普。用新的 Agent 生成了筆記,比如怎么選咖啡壺、怎么做化妝品成分對(duì)比等。有些任務(wù)可真不簡單,像化妝品成分對(duì)比,要調(diào)查 2025 年最火的三大抗老成分,比對(duì)它們的作用、用法、優(yōu)劣勢(shì),最后還要做嚴(yán)謹(jǐn)?shù)谋葘?duì)分析。

打開網(wǎng)易新聞 查看精彩圖片

最終,這個(gè)小紅書賬號(hào)收獲了相當(dāng)令人艷羨的成績:“兩周時(shí)間我們收獲了 5000 粉絲,接到多條商單邀請(qǐng),昨天,我們發(fā)出了第一個(gè)商單,賺了 500 塊錢?!?/p>

其背后依賴于 AutoGLM 沉思的三個(gè)關(guān)鍵技術(shù):

  • 深度思考:能夠模擬人在面對(duì)復(fù)雜問題時(shí)的自主決策過程。

  • 感知世界:能夠像人一樣獲取并理解環(huán)境信息。

  • 工具使用:能夠像人一樣調(diào)用和操作工具,完成復(fù)雜任務(wù)。

AutoGLM 沉思背后的模型,是智譜全新推出的 Agent 大腦——沉思模型,即通過強(qiáng)化學(xué)習(xí),讓模型學(xué)會(huì)自我批評(píng)、反思、甚至沉思,并通過更長的深度思考時(shí)間換取更優(yōu)的效果。

沉思突破了實(shí)時(shí)聯(lián)網(wǎng)搜索、動(dòng)態(tài)工具調(diào)用、深度分析和自我驗(yàn)證,實(shí)現(xiàn)真正的長程推理和任務(wù)執(zhí)行。

AutoGLM 沉思的技術(shù)演進(jìn)

張鵬對(duì)AutoGLM 沉思的技術(shù)演進(jìn)路徑進(jìn)行了披露,包括:在 GLM-4-Air 基座模型的基礎(chǔ)上,訓(xùn)練出推理模型 GLM-Z1-Air,基于 Z1 模型,結(jié)合工具使用和完成長程推理能力,訓(xùn)練出沉思模型,來作為 AutoGLM 沉思的大腦。最后集成了智譜自研的智能體技術(shù) AutoGLM,成為 AutoGLM 沉思的手腳。

其中推理模型 GLM-Z1-Air 擁有比肩 DeepSeek R1 的推理性能,極速版的速度有 8 倍提升,而價(jià)格僅需 R1 的 1/30。

而基座模型 GLM-4-Air 在預(yù)訓(xùn)練階段,加入了更多的代碼類、推理類數(shù)據(jù);并在對(duì)齊階段,針對(duì) Agent 能力進(jìn)行了對(duì)齊,使其更擅長工具調(diào)用、聯(lián)網(wǎng)搜索等 Agent 任務(wù)。這款模型只有 32B 的參數(shù)量,能力卻比肩更大參數(shù)量的國內(nèi)外主流模型。

大模型的預(yù)訓(xùn)練和后訓(xùn)練存在 Scaling Law。然而,不只是大模型推理滿足這一規(guī)律,智譜發(fā)現(xiàn),Agent 也存在類似的 Scaling Law。

打開網(wǎng)易新聞 查看精彩圖片

對(duì)于 Agent,通過擴(kuò)展訓(xùn)練時(shí)的 inference compute,智譜模型團(tuán)隊(duì)觀察到 Agent 展現(xiàn)出了更強(qiáng)的性能。

這一 Agent Scaling Law 的背后,是智譜的自進(jìn)化在線課程強(qiáng)化學(xué)習(xí)算法框架——WebRL。通過設(shè)計(jì)由易到難的任務(wù)序列,逐步引導(dǎo)模型從簡單場(chǎng)景向復(fù)雜場(chǎng)景過渡學(xué)習(xí),從而提升訓(xùn)練效率和最終性能。這種方法模擬人類學(xué)習(xí)過程,通過動(dòng)態(tài)調(diào)整任務(wù)難度,幫助模型積累基礎(chǔ)能力后再挑戰(zhàn)高難度任務(wù),有效避免直接處理復(fù)雜問題時(shí)的訓(xùn)練不穩(wěn)定。

在 Agent Scaling Law 的基礎(chǔ)上,智譜進(jìn)一步發(fā)現(xiàn)了 Agent 存在的能力涌現(xiàn)。比如在訓(xùn)練過程中,從未教給 AutoGLM 沉思訪問過巨潮資訊網(wǎng)。然而,當(dāng)發(fā)送指令“幫我收集昨天關(guān)于具身智能的相關(guān)研報(bào)”時(shí),卻驚喜地發(fā)現(xiàn), AutoGLM 沉思能夠規(guī)劃出通過訪問巨潮資訊解決問題的方案,并順利操作了網(wǎng)站。

打開網(wǎng)易新聞 查看精彩圖片

最后,智譜在 2025 年將怎么走是大家很關(guān)注的話題,張鵬這樣說道:“智譜始終專注于 AGI 基座模型的研發(fā),目前已經(jīng)探索到 L3-Agentic LLM 階段,我們將 GLM 一系列 Agent 能力,統(tǒng)稱為 Agentic GLM。未來很長一段時(shí)間內(nèi),智譜將聚焦 Agentic GLM 的研發(fā)?!币黄鹌诖?。

4 月 2 日 20:00,CSDN《萬有引力》欄目特別邀請(qǐng)到OpenManus 項(xiàng)目一作、MetaGPT 開源核心貢獻(xiàn)者梁新兵,DeepWisdom 算法研究員、OpenManus 核心作者向勁宇相聚 CSDN 視頻號(hào)直播間,在CSDN &《新程序員》執(zhí)行總編、《萬有引力》主理人唐小引主持下,一起聊聊 00 后程序員的故事,以及 OpenManus 背后的秘密!