打開網(wǎng)易新聞 查看精彩圖片

機(jī)器之心發(fā)布

機(jī)器之心編輯部

剛剛,Local AI 領(lǐng)域的 Libra 團(tuán)隊(duì)發(fā)布了一段最新技術(shù)演示視頻,展示了用戶通過自然語言交互直接生成 Agent,并利用本地消費(fèi)級(jí)算力支持 Agent 進(jìn)行長程 (Long-Horizon) 推理,最終完成復(fù)雜任務(wù)。Libra 構(gòu)建的本地化、即時(shí)響應(yīng)、自我規(guī)劃方案為行業(yè)開辟了一條全新的長程推理 Agent 技術(shù)路徑,實(shí)現(xiàn)了從手工 Agent 設(shè)計(jì)向端到端 In-Context Vibe Agent 生成范式演進(jìn)。

打開網(wǎng)易新聞 查看精彩圖片

從官網(wǎng)信息來看,Libra 的技術(shù)方案直接回應(yīng)了制約 Agent 技術(shù)普及的兩大關(guān)鍵瓶頸:一方面,當(dāng)前熱門 Agent 產(chǎn)品如 Cursor、Devin、Manus 等雖功能強(qiáng)大,但運(yùn)行成本高昂 —— 專業(yè)評(píng)測(cè)顯示單次使用 Manus 可消耗約 1000k Token(起步 2 美元)。Libra 基于本地算力優(yōu)先的架構(gòu)顯著降低了這一成本壓力,為高 Token 消耗應(yīng)用掃除障礙。另一方面,雖然主流 Agent 框架允許自定義開發(fā),但技術(shù)門檻限制了普及范圍。Libra 通過自然語言直接生成 Vibe Agent 的方式不僅簡(jiǎn)化了交互流程,更重要的是,這種端到端、無需編程的 Agent 生成范式為滿足多元化、大規(guī)模的個(gè)性化 Agent 應(yīng)用需求開辟了嶄新道路。

讓我們先看看 Libra 官網(wǎng) (greenbit.ai) 發(fā)布的具體視頻介紹:

場(chǎng)景展示:Libra 的 Agentic 規(guī)劃能力

案例一:10 分鐘打造即時(shí) DeepResearch 服務(wù)

DeepResearch 作為 “模型即產(chǎn)品” 的 AI Agent 代表,用戶想要私有化部署、接入內(nèi)部數(shù)據(jù),不僅面臨昂貴的 API 調(diào)用費(fèi)率,而且需要進(jìn)行額外的手工編排設(shè)計(jì)。在 Libra 的 Vibe Agent 模式下,行業(yè)分析師僅需對(duì)話反饋,就能持續(xù)調(diào)教 agent,并構(gòu)建專業(yè)、個(gè)性化的本地市場(chǎng)研究代理服務(wù):

  • 簡(jiǎn)單描述需求:"我需要分析過去 5 年各市場(chǎng)電動(dòng)車銷量趨勢(shì),用 Python 處理數(shù)據(jù)、進(jìn)行統(tǒng)計(jì)分析并生成可視化圖表。需要按人口標(biāo)準(zhǔn)化銷量數(shù)據(jù),計(jì)算年復(fù)合增長率,并預(yù)測(cè)未來 3 年走勢(shì)。"

打開網(wǎng)易新聞 查看精彩圖片

  • Libra 智能解析需求,自動(dòng)生成具備自我規(guī)劃能力的行動(dòng)智能體,代理用戶進(jìn)行網(wǎng)頁搜索、數(shù)據(jù)清洗、時(shí)序預(yù)測(cè)、數(shù)據(jù)分析、可視化等全流程能力

打開網(wǎng)易新聞 查看精彩圖片

  • 分析師評(píng)估代理服務(wù)的工作效果:完成了包含 15 個(gè)市場(chǎng)的實(shí)時(shí)市場(chǎng)深度分析報(bào)告,包括人均滲透率、區(qū)域增長率對(duì)比、未來預(yù)測(cè)等多維度分析,整個(gè)過程僅消耗約 80K 需要付費(fèi)的云端 token,相比同等任務(wù)在云端 API 服務(wù)的調(diào)用成本降低了 90%

打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片

  • 持續(xù)調(diào)教,滿意后使用 Libra 一鍵導(dǎo)出并部署到本地

案例二:一句話調(diào)教市場(chǎng)上的最佳 Agent 單品

除此之外,Libra 的對(duì)話式 Agent 調(diào)教模式能以極快的速度將潮流智能體產(chǎn)品融入用戶的場(chǎng)景:

  • 個(gè)人 IP 孵化器:只需說 "我想根據(jù)我的每天 Mac 軟件使用記錄,用有趣文字連載我的《00 后職場(chǎng)升職記》小說",瞬間擁有專屬 "數(shù)字史官",讓個(gè)人品牌打造變得輕松自如。
  • Second Me:說一句 "我是一個(gè)數(shù)碼產(chǎn)品內(nèi)容創(chuàng)作者,模擬我的個(gè)人工作流,根據(jù)我的要求篩選每日數(shù)碼科技動(dòng)態(tài),創(chuàng)建一個(gè)關(guān)于最新智能手機(jī)的微博話題",瞬間獲得精準(zhǔn)分析和引人入勝的微博內(nèi)容。為你自主監(jiān)控科技趨勢(shì),提煉核心信息,適時(shí)生成專業(yè)評(píng)測(cè)觀點(diǎn),讓你的數(shù)碼影響力持續(xù)增長。
  • 創(chuàng)意游戲工坊:簡(jiǎn)單一句 "需要在我的酒吧上線一個(gè)可以模擬 AI 大逃殺的對(duì)話游戲",分鐘級(jí)別即可創(chuàng)建基于圖靈測(cè)試的沉浸式大逃殺游戲體驗(yàn),參與 AI 角色間的智慧博弈與爾虞我詐。

最重要的是,這些生成的 Agent 服務(wù)可以全部在本地執(zhí)行,盡情使用,忘掉 Token 消耗。當(dāng)然,有想法的小伙伴已經(jīng)想到了, “想要專屬個(gè)人助理”,“生成一個(gè) Libra”,隨著 Libra 的技術(shù)驗(yàn)證成功,創(chuàng)造力將不再是瓶頸,請(qǐng)開始你的對(duì)話式調(diào)教。

產(chǎn)品革新:Libra 對(duì) Agent 落地的幾點(diǎn)思考

實(shí)惠的國民 Agent: Token 總成本直降 90%

不同于普通的對(duì)話類 AI 應(yīng)用,無論是 Cursor、WindSurf 等 AI Editor,還是以 Libra 為代表的 Vibe Agent 產(chǎn)品,都提供了復(fù)雜工具調(diào)用與多跳場(chǎng)景推理功能作為服務(wù),為用戶帶來極致的自動(dòng)化體驗(yàn),而相應(yīng)的推理 Token 消耗也呈現(xiàn)數(shù)量級(jí)的增長,當(dāng)前 Agent 行業(yè)仍然處于 2G 時(shí)代的收費(fèi)短信收發(fā)階段,對(duì)有效智能的"提速降費(fèi)"迫在眉睫。

根據(jù)官網(wǎng)信息,為了打造 Agent 服務(wù)的 "無限流量" 模式,Libra 團(tuán)隊(duì)通過低比特量化壓縮、基于優(yōu)先級(jí)的長上下文管理、端云協(xié)同等組合優(yōu)化技術(shù),實(shí)現(xiàn)了企業(yè)級(jí)大型語言模型在消費(fèi)級(jí)桌面設(shè)備上的高效運(yùn)行,從根本上改變了 AI 應(yīng)用中的模型側(cè)成本結(jié)構(gòu):

打開網(wǎng)易新聞 查看精彩圖片

  • 端 + 云服務(wù):采用本地模型優(yōu)先的 Agent 方案,無需依賴按 Token 計(jì)費(fèi)的 API 費(fèi)用,消除使用量增長帶來的成本壓力,長期使用成本降低 90% 以上。
  • 走向消費(fèi)級(jí)硬件:通過先進(jìn)的模型壓縮和優(yōu)化技術(shù),使消費(fèi)級(jí)桌面硬件 (如 Apple M3 Ultra) 即可流暢運(yùn)行企業(yè)級(jí)模型,初始投入降低 95%。
  • 初步成本預(yù)估:根據(jù)團(tuán)隊(duì)估算,假設(shè)用戶采用最昂貴的消費(fèi)級(jí)桌面硬件 Apple M3 Ultra,使用 Libra 替換純?cè)贫?API 方案后,持續(xù)的高強(qiáng)度 Agent 服務(wù)月支出從 15 萬元降至設(shè)備一次性投入 8 萬元,初始 Apple M3 Ultra 投資可在不到 3 個(gè)月內(nèi)收回成本,當(dāng)我們使用更日常的消費(fèi)級(jí)硬件時(shí),成本將進(jìn)一步下降。

隨著開源大模型能力、消費(fèi)級(jí)芯片 Memory 與計(jì)算容量的持續(xù)提升,通過 Local Token 優(yōu)先的 "端 + 云" 架構(gòu)進(jìn)行 Agent 部署能有效攤薄用戶使用成本。

擁抱 Vibe Agent: 對(duì)話模式正在拓寬需求的邊界

隨著對(duì)話模式深入人心,語言正在重新定義需求的邊界 ——昨日的口頭愿望正在轉(zhuǎn)變?yōu)榻裉斓膶?shí)際需求。Libra 團(tuán)隊(duì)演示的 Vibe Agent 交互模式,正是對(duì)這一需求演化的精準(zhǔn)回應(yīng)。

從最新的 GPT-4o 圖像直出、AI IDE 的代碼輔助生成再到 Libra 的行動(dòng) Agent 生成,交互體驗(yàn)的突破帶來的是效率的跨越式提升 —— 傳統(tǒng)方式需要數(shù)周構(gòu)建的基礎(chǔ) Agent,在 Vibe Agent 模式下僅需 10 分鐘的對(duì)話調(diào)教,即可讓 AI 自主理解場(chǎng)景中的工具需求與流程約束,生成同等甚至更高水平的專業(yè)級(jí)代理服務(wù)。Vibe Coding 以及 Vibe Agent 模式的出現(xiàn)不僅將提高人們對(duì)服務(wù)響應(yīng)效率的預(yù)期,更將引領(lǐng) Agent 技術(shù)領(lǐng)域不斷向更高峰攀升。

從需求表達(dá)到服務(wù)實(shí)現(xiàn)的距離被大幅縮短,使得"即時(shí)滿足"不再是奢望。隨著這些技術(shù)的成熟與普及,我們將看到越來越多的個(gè)性化、場(chǎng)景化代理服務(wù)在各行各業(yè)涌現(xiàn)。

Local AI 的正確打開方式: Agent 即資產(chǎn)

Libra 團(tuán)隊(duì)的本地優(yōu)先架構(gòu)同時(shí)揭示了 Agent 時(shí)代的關(guān)鍵洞見:個(gè)人智能體已然成為無形但珍貴的知識(shí)資產(chǎn)。這一思路切中了當(dāng)前 AI 發(fā)展的核心矛盾點(diǎn)。在知識(shí)工作者將創(chuàng)意、方法和解決方案輸入云端 AI 工具的同時(shí),他們也在不經(jīng)意間貢獻(xiàn)了自己最有價(jià)值的資產(chǎn)。

恰當(dāng)?shù)谋镜鼗呗允菍?duì)這一需求的正面回應(yīng) —— 通過圍繞用戶需求構(gòu)造本地優(yōu)先的智能體,用戶能夠在輕松獲得 AI 助力、形成個(gè)人工作流的同時(shí),保留對(duì)自己獨(dú)特工作方法的完全控制權(quán),并實(shí)現(xiàn)持續(xù)迭代提升。這一轉(zhuǎn)變的意義遠(yuǎn)超簡(jiǎn)單的隱私保護(hù),它有效回應(yīng)了個(gè)人與 AI 工具的關(guān)系邊界。

為什么是 Libra?核心技術(shù)揭秘

從官網(wǎng)可知,Libra 團(tuán)隊(duì)持續(xù)投入本地 AI 相關(guān)核心技術(shù)棧研究,促使 Libra 成為首款在 Apple Mac 系列上直接運(yùn)行的個(gè)性化 Agent 平臺(tái)。擺脫云端限制,告別高昂 API 費(fèi)用,讓自主適應(yīng)場(chǎng)景的 Vibe Agent 模式成為可能性:

低比特量化技術(shù)

采用基于混合精度量化和 Reasoning-Aware 低比特表征校準(zhǔn)技術(shù),將前沿大模型 (QwQ 32B、DeepSeek-R1-70B、Deepseek R1 671B 等) 精準(zhǔn)壓縮至符合 Apple 消費(fèi)級(jí) Silicon 硬件計(jì)算架構(gòu)的 3/4 比特混合精度表征,并與 Apple MLX 機(jī)器學(xué)習(xí)推理框架無縫融合。在性能保持方面,將常規(guī) Instruct 類大語言模型性能損失精確控制在 1% 以內(nèi),內(nèi)存需求較 FP16 模式顯著下降 75%+。

打開網(wǎng)易新聞 查看精彩圖片

更令人驚喜的是,Libra 團(tuán)隊(duì)驗(yàn)證了低比特量化在提升推理模型 Thinking 階段效率的意外優(yōu)勢(shì),通過維持推理模型 Thinking 階段在壓縮前后的思考質(zhì)量并壓縮 Thinking 時(shí)長,模型在多種復(fù)雜推理任務(wù)上能力不降反升,相反,經(jīng)典量化部署方案 (AWQ、GGUF 等) 表現(xiàn)出對(duì)推理模型壓縮效果的不穩(wěn)定性,在多項(xiàng)任務(wù)中出現(xiàn)性能、思考效率雙降等問題)。這套技術(shù)棧成功突破了傳統(tǒng)量化方法的精度瓶頸,通過精心設(shè)計(jì)的混合精度表征與重校準(zhǔn)策略,在滿足消費(fèi)級(jí)硬件適配需求的同時(shí),完美保護(hù)了影響模型核心能力的 “Super Weights”。

打開網(wǎng)易新聞 查看精彩圖片

在 Libra 平臺(tái)上 Agentic 任務(wù)對(duì)比測(cè)試結(jié)果令人振奮 —— 基于混合精度的低比特模型在復(fù)雜推理任務(wù)上的用戶體驗(yàn)與原始模型幾乎無差別。憑借這一技術(shù)路線,消費(fèi)級(jí)設(shè)備如 Mac Studio 或?qū)⒊蔀椴渴饌€(gè)性化 Agent 服務(wù)的最理想硬件平臺(tái)。

自適應(yīng)上下文管理引擎

為突破本地設(shè)備資源限制與模型 Context 窗口制約,同時(shí)實(shí)現(xiàn)有效的 Token 聚合,Libra 團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了事件驅(qū)動(dòng)的 Token Vibe Orchestration (TVO) 策略。TVO 基于 JSX 的層級(jí)資源調(diào)度策略,對(duì)前后端和歷史交互數(shù)據(jù)進(jìn)行高效整合,并使用專用模型對(duì)原始 contex 進(jìn)行投機(jī)總結(jié)與優(yōu)先級(jí)預(yù)測(cè),使模型能夠預(yù)判用戶交互意圖,對(duì)最相關(guān)上下文片段進(jìn)行重排,從而在有限計(jì)算資源環(huán)境下實(shí)現(xiàn)卓越的上下文理解能力。

打開網(wǎng)易新聞 查看精彩圖片

測(cè)試數(shù)據(jù)表明,這種模型驅(qū)動(dòng)的動(dòng)態(tài)編排架構(gòu)能有效提升本地 AI Agent 在長文檔分析和多輪復(fù)雜對(duì)話中的記憶能力和指令跟隨能力。特別是在 Browser-use 這類涵蓋百萬級(jí) Token 的場(chǎng)景中,TVO 架構(gòu)能優(yōu)先保留高價(jià)值信息,顯著提升模型響應(yīng)質(zhì)量。

響應(yīng)式 Orchestration 框架

Libra 提出一種創(chuàng)新的 Meta Agent-Orchestration (MAO) 框架,為 Vibe Agents 生成進(jìn)行 Instance Multi-Agents Orchestration 與資源調(diào)度。MAO 框架針對(duì) Orchestration 場(chǎng)景定制了專用策略智能體,內(nèi)化了復(fù)雜的 Orchestration 相關(guān)知識(shí),使系統(tǒng)能夠自主推理、預(yù)測(cè)最佳協(xié)作路徑。基于高效的數(shù)據(jù)庫策略,MAO 能夠?qū)Υ罅客獠抗ぞ哝湣⑶昂蠖思磿r(shí)交互 Context 進(jìn)行系統(tǒng)化整合。這種設(shè)計(jì)確保各組件間無縫協(xié)作,即使在本地設(shè)備資源受限的情況下也能保持高效運(yùn)行。作為框架的重要補(bǔ)充,MAO 還針對(duì)數(shù)據(jù)流通層可用性構(gòu)造了專用預(yù)測(cè)器,通過實(shí)時(shí)圖聯(lián)通性驗(yàn)證,實(shí)現(xiàn)了自然語言生成 Agents 的可用性驗(yàn)證,有效降低了任務(wù)失敗風(fēng)險(xiǎn)。

打開網(wǎng)易新聞 查看精彩圖片

可以預(yù)見,Libra 基于消費(fèi)級(jí)硬件與端到端 Agent 生成的技術(shù)方案將加速 Agent 對(duì)個(gè)人與小微團(tuán)體辦公場(chǎng)景的加持:

1. 桌面級(jí) AI 賦能:企業(yè)可直接在 Mac Studio 等消費(fèi)級(jí)設(shè)備使用 Libra 運(yùn)行高性能的 Vibe Agent 服務(wù),為組織提供便捷的 AI 能力獲取路徑,使 AI 技術(shù)與日常辦公環(huán)境無縫融合。

2. 創(chuàng)新周期加速:產(chǎn)品經(jīng)理與 AI 玩具開發(fā)者等能在熟悉的 Mac 工作站環(huán)境中基于 Libra 完成 Agent 原型設(shè)計(jì)并使用 Libra Engine 導(dǎo)出部署,專注于應(yīng)用場(chǎng)景創(chuàng)新,快速將 AI 概念轉(zhuǎn)化為實(shí)用解決方案。

3. 靈活部署選擇:通過 Mac Studio 等消費(fèi)級(jí)硬件實(shí)現(xiàn)本地化 AI 能力,為企業(yè)提供多元化的部署選項(xiàng),使各類組織能根據(jù)自身需求和 IT 策略靈活采用 AI 技術(shù)。

結(jié)語

Libra 提出的 Vibe Agent 范式代表了 Agent 技術(shù)演進(jìn)的新方向。這一范式通過對(duì)話式交互構(gòu)建智能體的方法解決了傳統(tǒng) Agent 開發(fā)中的技術(shù)壁壘問題,將繁復(fù)的工程化流程簡(jiǎn)化為自然語言指令。Vibe Agent 的關(guān)鍵技術(shù)價(jià)值在于實(shí)現(xiàn)了從預(yù)定義框架到端到端生成的轉(zhuǎn)變,使非技術(shù)背景用戶也能根據(jù)具體場(chǎng)景需求實(shí)現(xiàn) In-Context 的 Agent 定制。這種范式轉(zhuǎn)換不僅是交互層面的優(yōu)化,更是對(duì) Agent 開發(fā)模式的重構(gòu)。

在技術(shù)實(shí)現(xiàn)層面,Libra 通過本地模型優(yōu)先的架構(gòu)策略,配合低比特量化和優(yōu)先級(jí)上下文管理,使 Token 成本大幅度下降。這一成本優(yōu)勢(shì)使得持續(xù)性、高頻率的 Agent 交互在經(jīng)濟(jì)上變得可行。通過端云協(xié)同機(jī)制,企業(yè)級(jí)模型能力被有效壓縮并部署至消費(fèi)級(jí)硬件平臺(tái),為用戶提供接近無限制的生產(chǎn)力體驗(yàn)。從產(chǎn)業(yè)發(fā)展角度分析,Vibe Agent 范式的價(jià)值體現(xiàn)在兩個(gè)維度:首先,顯著降低的計(jì)算成本將重塑 Agent 的經(jīng)濟(jì)模型,使 AI 能力從企業(yè)級(jí)資源轉(zhuǎn)變?yōu)閭€(gè)人級(jí)工具;其次,對(duì)話式創(chuàng)建機(jī)制將實(shí)現(xiàn) Agent 開發(fā)應(yīng)用的普及,促使專業(yè)知識(shí)從封閉系統(tǒng)向開放生態(tài)轉(zhuǎn)變。Libra 的技術(shù)方案為 Agent 技術(shù)走向普惠化提供了可驗(yàn)證的實(shí)施路徑,預(yù)計(jì)將在近期推動(dòng) Agent 應(yīng)用從概念驗(yàn)證階段邁向規(guī)?;渴痣A段。隨著端側(cè)計(jì)算資源進(jìn)一步優(yōu)化,Vibe Agent 模式有望成為下一代 Agentic 產(chǎn)品開發(fā)的標(biāo)準(zhǔn)范式。

  • Libra 官方網(wǎng)站:greenbit.ai
  • 申請(qǐng)?jiān)囉茫篿nfo@greenbit.ai