打開(kāi)網(wǎng)易新聞 查看精彩圖片

5 月 7 日,由 GOSIM、CSDN 和 1ms.ai 聯(lián)合主辦的全球開(kāi)源技術(shù)盛會(huì)——GOSIM AI Paris 2025 在法國(guó)巴黎迎來(lái)了大會(huì)第二日的精彩議程。來(lái)自全球的 AI 專家、開(kāi)發(fā)者和產(chǎn)業(yè)代表齊聚一堂,圍繞 AI 技術(shù)的最新趨勢(shì)與實(shí)踐展開(kāi)深入探討。

從底層技術(shù)架構(gòu)到前沿應(yīng)用場(chǎng)景,本次大會(huì)圍繞 AI 模型、AI 基礎(chǔ)設(shè)施、AI 應(yīng)用及具身智能等核心主題設(shè)立技術(shù)論壇,全方位覆蓋 AI 領(lǐng)域的關(guān)鍵議題。此外,Spotlight Talks、PyTorch Day 等特色活動(dòng)也為技術(shù)開(kāi)發(fā)者搭建了一個(gè)思想碰撞與成果展示的技術(shù)舞臺(tái)。

本次 GOSIM AI Paris 2025 不僅匯聚了來(lái)自 NVIDIA、Meta、阿里巴巴、Hugging Face、BAAI、MiniMax、Neo4j、Dify、MetaGPT、智譜 AI、Eigent.AI、Docker、英飛流、北京大學(xué)、德國(guó) Fraunhofer 研究所、牛津大學(xué)、法國(guó) openLLM 社區(qū)等機(jī)構(gòu)的 80 余位技術(shù)專家與學(xué)者;更有華為、全法中國(guó)青年科創(chuàng)協(xié)會(huì)、中法人工智能協(xié)會(huì)、Apache 軟件基金會(huì)、Eclipse 基金會(huì)、The Khronos Group 科納斯標(biāo)準(zhǔn)聯(lián)盟、WasmEdgeRuntime、LF Generative AI Commons、Linux 基金會(huì)研究部、OpenWallet 基金會(huì)、開(kāi)放源代碼促進(jìn)會(huì)(OSI)、Software Heritage、K8SUG 等重量級(jí)合作伙伴深度參與,共同打造了一場(chǎng) AI 與開(kāi)源交織、學(xué)術(shù)與產(chǎn)業(yè)融合的國(guó)際技術(shù)盛宴。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

開(kāi)源+AI,不止是 1+1>2

在 Keynote 環(huán)節(jié),LF AI & Data 基金會(huì)董事會(huì)成員 Zhipeng Huang 發(fā)表了題為《開(kāi)放體驗(yàn)時(shí)代來(lái)臨》的主題演講,并系統(tǒng)梳理了當(dāng)前大模型領(lǐng)域值得關(guān)注的六大發(fā)展趨勢(shì):

  • 多模態(tài)統(tǒng)一架構(gòu)。盡管“統(tǒng)一架構(gòu)”仍有不少技術(shù)爭(zhēng)議,但多個(gè)頂級(jí)實(shí)驗(yàn)室的研究已顯示出明顯趨勢(shì),即試圖將多模態(tài)建模能力整合進(jìn)統(tǒng)一框架。他特別提到 Meta 于去年年底發(fā)布的 BLT(Byte Latent Transformer)架構(gòu),展示了這一方向的可行性。Zhipeng Huang 認(rèn)為,2025 年有望誕生具突破性的統(tǒng)一模型,對(duì)現(xiàn)有主流架構(gòu)發(fā)起挑戰(zhàn)。

  • 高效注意力機(jī)制演進(jìn)。線性注意力、動(dòng)態(tài)稀疏注意力和混合注意力等機(jī)制正快速發(fā)展。

  • 二階優(yōu)化走向?qū)嵺`:二階優(yōu)化因成本高昂,長(zhǎng)期被視為理論工具,但這一局面正在改變。Zhipeng Huang 提到 Google Shampoo、PSGD、MARS 等項(xiàng)目,顯示二階優(yōu)化正逐步應(yīng)用于大規(guī)模訓(xùn)練場(chǎng)景。雖然尚未“爆發(fā)”,但他判斷,未來(lái)隨著計(jì)算資源更普及,二階優(yōu)化將在提升訓(xùn)練效率和模型泛化能力方面扮演關(guān)鍵角色。

  • 從AI4S 到Equivariance4ALL:在科學(xué)建模、分子預(yù)測(cè)等結(jié)構(gòu)化任務(wù)中,單靠大數(shù)據(jù)訓(xùn)練難以替代顯式結(jié)構(gòu)先驗(yàn)。Zhipeng Huang 強(qiáng)調(diào),Equivariance 方法在小分子領(lǐng)域的重要性不容忽視,并呼吁研究者將先驗(yàn)知識(shí)與深度學(xué)習(xí)方法相結(jié)合,以增強(qiáng)模型對(duì)復(fù)雜結(jié)構(gòu)的表達(dá)能力。

  • 構(gòu)建“數(shù)據(jù)油井”:數(shù)據(jù)質(zhì)量決定模型上限。Zhipeng Huang 提到 Hugging Face 發(fā)起的 LeRobot 項(xiàng)目,代表了機(jī)器人數(shù)據(jù)向標(biāo)準(zhǔn)化、開(kāi)放化演進(jìn)的趨勢(shì)。他強(qiáng)調(diào),建立高質(zhì)量、可復(fù)用的數(shù)據(jù)資產(chǎn),是打造強(qiáng)大模型的基礎(chǔ)。

  • 后訓(xùn)練階段成為關(guān)鍵環(huán)節(jié):預(yù)訓(xùn)練日趨成熟后,后訓(xùn)練(如指令調(diào)整、獎(jiǎng)勵(lì)建模、記憶優(yōu)化)逐漸成為提升模型性能的核心路徑。Zhipeng Huang 指出,隨著模型規(guī)模不斷擴(kuò)大,后訓(xùn)練將在特定任務(wù)優(yōu)化中發(fā)揮越來(lái)越重要的作用,并可能帶來(lái)實(shí)質(zhì)性突破。

在這些技術(shù)趨勢(shì)背后,也孕育著豐富的機(jī)會(huì)和全新的用戶體驗(yàn)。Zhipeng Huang 表示,開(kāi)放體驗(yàn)的核心不僅在于開(kāi)放代碼和模型,更在于開(kāi)放協(xié)作與認(rèn)知方式。他堅(jiān)信,隨著大模型持續(xù)演進(jìn),唯有擁抱開(kāi)源、加強(qiáng)協(xié)作、推動(dòng)標(biāo)準(zhǔn)建設(shè),才能打造真正可持續(xù)的技術(shù)生態(tài)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

LF AI & Data 基金會(huì)董事會(huì)成員 Zhipeng Huang

“開(kāi)源和開(kāi)放標(biāo)準(zhǔn)正逐步成為推動(dòng)人工智能發(fā)展的核心力量”,PyTorch 基金會(huì)執(zhí)行董事、Linux 基金會(huì) AI 總經(jīng)理 Matt White 在《釋放 AI 的全部潛能——開(kāi)源與開(kāi)放標(biāo)準(zhǔn)將定義智能系統(tǒng)的未來(lái)》主題演講中說(shuō)道。他指出,在全球 AI 競(jìng)賽不斷加速的背景下,開(kāi)源不僅成為各國(guó)政府高度關(guān)注的戰(zhàn)略重點(diǎn),也為那些依賴專有系統(tǒng)的“信息孤島”提供了透明、可審計(jì)、可信賴的替代方案,“企業(yè)和用戶越來(lái)越需要透明、安全且可信的系統(tǒng),而開(kāi)放性恰恰是解決之道?!?/p>

在談及具體創(chuàng)新時(shí),Matt White 分享了從智能體框架到數(shù)據(jù)平臺(tái),再到 Hugging Face、PyTorch 等開(kāi)源社區(qū)的蓬勃發(fā)展,稱這些生態(tài)系統(tǒng)正在共同推動(dòng) AI 的開(kāi)放進(jìn)程。他認(rèn)為,開(kāi)源 AI 的成功不僅源于代碼本身,更來(lái)自于一個(gè)中立、開(kāi)放且富有活力的社區(qū),“不是由某家公司控制方向,而是大家共同推動(dòng)標(biāo)準(zhǔn)與創(chuàng)新?!?/p>

隨著 AI 從“模型中心”向“系統(tǒng)中心”演進(jìn),Matt White 強(qiáng)調(diào)開(kāi)放標(biāo)準(zhǔn)的重要性日益凸顯。他簡(jiǎn)要介紹了當(dāng)前正在出現(xiàn)的 AI 標(biāo)準(zhǔn),包括 Anthropic 的 MCP、谷歌的 A2A 協(xié)議、IBM 的 ACP 協(xié)議等,并指出 Linux 基金會(huì)是全球 200 多個(gè)開(kāi)放標(biāo)準(zhǔn)的托管平臺(tái),支持標(biāo)準(zhǔn)建設(shè)的機(jī)制包括聯(lián)合開(kāi)發(fā)基金會(huì)(Joint Development Foundation)與社區(qū)規(guī)范(Community Specification)。他強(qiáng)調(diào),標(biāo)準(zhǔn)必須廠商中立,才能真正服務(wù)于整個(gè)行業(yè)。

在開(kāi)源許可方面,Matt White 宣布了一個(gè)重要進(jìn)展——Linux 基金會(huì)正在推動(dòng)一項(xiàng)專為 AI 模型設(shè)計(jì)的新型許可證 OpenMDW,該許可證涵蓋模型架構(gòu)、數(shù)據(jù)集、參數(shù)、文檔與工具,具備全球適用性,并兼容現(xiàn)有主流開(kāi)源許可證。他指出:“Apache 2.0 和 MIT 更適用于軟件,但 AI 模型遠(yuǎn)比軟件復(fù)雜,我們需要新的許可框架?!?/p>

最后,Matt White 也提出了幾項(xiàng)建議:為 AI 工具和模型選用合適的開(kāi)源許可證;積極參與全球協(xié)作,抵制“AI 民族主義”的保護(hù)主義傾向;反對(duì)對(duì)開(kāi)源的過(guò)度監(jiān)管,以避免抑制創(chuàng)新;支持中立、可靠的開(kāi)放標(biāo)準(zhǔn);并始終以負(fù)責(zé)任的方式構(gòu)建可信的 AI,從工程層到產(chǎn)品發(fā)布保持一致。他總結(jié)道:“我們正處于開(kāi)源 AI 的關(guān)鍵時(shí)刻,讓我們共同努力,讓它成為推動(dòng) AI 未來(lái)的事實(shí)標(biāo)準(zhǔn)?!?/p>

打開(kāi)網(wǎng)易新聞 查看精彩圖片

PyTorch 基金會(huì)執(zhí)行董事、Linux 基金會(huì) AI 總經(jīng)理 Matt White

打開(kāi)網(wǎng)易新聞 查看精彩圖片

頂尖 AI 模型是如何煉成的?

在 AI 模型分論壇上,一場(chǎng)關(guān)于模型構(gòu)建與開(kāi)源生態(tài)的深度探討精彩展開(kāi),六位來(lái)自全球頂尖科研機(jī)構(gòu)與企業(yè)的專家,帶來(lái)了他們對(duì)基礎(chǔ)模型研發(fā)和應(yīng)用落地的第一手觀察與技術(shù)干貨。

阿里巴巴通義實(shí)驗(yàn)室科學(xué)家 Baosong Yang 分享了《Qwen 的多語(yǔ)言能力:從基礎(chǔ)模型到應(yīng)用落地》,展示了 Qwen 系列模型如何在多語(yǔ)言理解與生成任務(wù)中實(shí)現(xiàn)能力突破,并逐步走向產(chǎn)業(yè)級(jí)應(yīng)用。來(lái)自 LAION 的科學(xué)負(fù)責(zé)人、Juelich 超級(jí)計(jì)算中心和研究中心高級(jí)研究員兼實(shí)驗(yàn)室負(fù)責(zé)人 Jenia Jitsev 在《開(kāi)源基礎(chǔ)模型:Scaling Laws 與泛化能力的探索》中指出,大模型的遷移能力需依托開(kāi)源基礎(chǔ)模型與數(shù)據(jù)集,強(qiáng)調(diào) Scaling Laws 與泛化能力研究的重要性。

LINAGORA - OpenLLM 法國(guó)總經(jīng)理 Michel-Marie Maudet 帶來(lái)了《LUCIE:從零開(kāi)始,用熱愛(ài)打造的開(kāi)源大模型》,他分享了一支由熱情驅(qū)動(dòng)的團(tuán)隊(duì)如何構(gòu)建出“從訓(xùn)練代碼到數(shù)據(jù)集全開(kāi)放”的 LUCIE-7B 模型。美國(guó)東北大學(xué)電子與計(jì)算機(jī)工程系教授 Yanzhi Wang 則以《解構(gòu)大模型訓(xùn)練——邁向從預(yù)訓(xùn)練到強(qiáng)化學(xué)習(xí)的完全開(kāi)源 LLM》為題,提出“模型開(kāi)放性框架(MOF)”,并展示了從預(yù)訓(xùn)練到強(qiáng)化學(xué)習(xí)全流程開(kāi)源的 Moxin 系列模型。

在“小模型”方向,圍繞《小而強(qiáng):MiniCPM 如何在全球開(kāi)源 AI 賽道實(shí)現(xiàn)突破》主題,OpenBMB & Modelbest 創(chuàng)始合伙人 Chao Jia 帶來(lái)了熱門項(xiàng)目 MiniCPM 的最新進(jìn)展,展示了小模型在效率和性能上的平衡優(yōu)勢(shì)。而 Hugging Face 研究工程師 Elie Bakouch 也在《小模型與大模型的預(yù)訓(xùn)練實(shí)踐》中,結(jié)合實(shí)踐深入解析了當(dāng)前構(gòu)建強(qiáng)大 LLM 所需的關(guān)鍵要素,如 MoE、長(zhǎng)上下文處理與訓(xùn)練穩(wěn)定性優(yōu)化。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

解碼 AI 基礎(chǔ)設(shè)施的演進(jìn)邏輯與技術(shù)趨勢(shì)

隨著大模型和 Agent 技術(shù)的廣泛應(yīng)用,AI 基礎(chǔ)設(shè)施也日益成為決定技術(shù)能否規(guī)?;涞氐年P(guān)鍵。在本場(chǎng)分論壇中,我們邀請(qǐng)了來(lái)自產(chǎn)業(yè)與學(xué)界的多位技術(shù)專家,他們從多個(gè)維度展現(xiàn)了當(dāng)前 AI 底層能力的建設(shè)成果與未來(lái)走向。

論壇開(kāi)場(chǎng),Docker 生成式 AI 加速高級(jí)副總裁 Jean-Laurent de Morlhon 帶來(lái)《用 Docker 簡(jiǎn)化 AI 應(yīng)用開(kāi)發(fā)》主題演講,介紹了如何借助 Docker Model Runner 實(shí)現(xiàn)本地化 GPU 推理,加速 AI 應(yīng)用落地。馬德里理工大學(xué)教授 Joaquin Salvachua 在《數(shù)據(jù)空間:構(gòu)建 AI 數(shù)據(jù)宇宙的基石》中指出,可信的數(shù)據(jù)流通機(jī)制是構(gòu)建 AI 生態(tài)的前提。

圍繞大模型在企業(yè)環(huán)境中的工程化落地,Runhouse 機(jī)器學(xué)習(xí)工程師 Paul Yang 圍繞《Kubetorch:面向 ML 執(zhí)行和生產(chǎn)的現(xiàn)代 Kubernetes 原生方案》,強(qiáng)調(diào)了 Kubetorch 在 ML 模型執(zhí)行與部署流程中的高效性與可調(diào)試性。隨后,InfiniFlow 首席執(zhí)行官 Yingfeng Zhang 的演講《RAGFlow:引領(lǐng)企業(yè)級(jí) RAG 的開(kāi)源革命》,展示了如何通過(guò)開(kāi)源手段解決數(shù)據(jù)質(zhì)量差、語(yǔ)義匹配低等難題,全面提升企業(yè)級(jí) RAG 系統(tǒng)的表現(xiàn)。

而在底層標(biāo)準(zhǔn)方面,英偉達(dá)開(kāi)發(fā)者技術(shù)首席工程師 Markus Tavenrath 帶來(lái)《Khronos 在開(kāi)源與機(jī)器學(xué)習(xí)世界中的探索》,分享了 Khronos Group 在 OpenCL、SYCL、Vulkan 等開(kāi)源標(biāo)準(zhǔn)領(lǐng)域的最新進(jìn)展。Dimforge 首席執(zhí)行官 Sebastien Crozet 在《WGML:構(gòu)建高性能、跨平臺(tái)、端側(cè)推理框架的幕后故事》演講中,聚焦于如何基于 Rust 與 WebGPU 構(gòu)建輕量化、高性能的 GPU 推理框架 WGML。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

AI Agent,驅(qū)動(dòng)下一代應(yīng)用生態(tài)的核心力量

作為本屆大會(huì)關(guān)注的核心議題之一,AI 應(yīng)用分論壇聚焦在大模型落地與智能體架構(gòu)持續(xù)演進(jìn)的關(guān)鍵環(huán)節(jié)。為此,多個(gè)重量級(jí)開(kāi)源項(xiàng)目的實(shí)踐者和技術(shù)領(lǐng)導(dǎo)者帶來(lái)了他們?cè)?AI 應(yīng)用一線的深度思考與經(jīng)驗(yàn)分享。

Neo4j AI 社區(qū)架構(gòu)師 Alexy Khrabrov 以《OAKS:開(kāi)放式智能體 AI 知識(shí)棧》為題,提出了以知識(shí)圖譜和 AI 記憶系統(tǒng)為核心的可擴(kuò)展架構(gòu),強(qiáng)調(diào)開(kāi)放式生態(tài)對(duì)智能體成長(zhǎng)的重要意義。緊接著,DeepWisdom 聯(lián)合創(chuàng)始人、MetaGPT/OpenManus 項(xiàng)目負(fù)責(zé)人 Sirui Hong 在《OpenManus:通過(guò)框架與能力演進(jìn),賦能 LLM 智能體應(yīng)用》中,通過(guò)增強(qiáng)推理規(guī)劃和跨環(huán)境運(yùn)行能力,為 LLM 智能體應(yīng)用拓展了新的可能性。

隨后,solo.io 高級(jí)架構(gòu)師 Eitan Yarmush 帶來(lái)《用 Kagent 重塑開(kāi)源智能體技術(shù)?!?,聚焦底層基礎(chǔ)設(shè)施,提出完整的 Kubernetes 原生技術(shù)棧解決方案。圍繞智能體協(xié)作與擴(kuò)展能力,Eigent.AI / CAMEL-AI.org 創(chuàng)始人兼 CEO Guohao Li 則在《探索智能體的 Scaling Law》中分享了 CAMEL 框架的前沿實(shí)踐,深入研究智能體社群行為與協(xié)作機(jī)制。

當(dāng)然,數(shù)據(jù)庫(kù)層面的支撐也不可忽視。PingCAP 首席技術(shù)官 Dongxu Huang 在《面向 Agent 記憶的數(shù)據(jù)庫(kù),正確的實(shí)現(xiàn)方式》中,系統(tǒng)講解了如何構(gòu)建面向智能體記憶的高效 SQL 數(shù)據(jù)庫(kù)。最后,Jina AI 首席 AI 工程師 Florian H?nicke 以《Agentic Search:智能體驅(qū)動(dòng)的搜索范式》為本場(chǎng)論壇畫(huà)上句點(diǎn),系統(tǒng)闡述了智能搜索新范式,為智能體的信息獲取與決策提供了新思路。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

感知-認(rèn)知-行動(dòng)一體化,是具身智能的核心挑戰(zhàn)

在具身智能論壇中,眾多來(lái)自產(chǎn)業(yè)與科研前沿的專家學(xué)者齊聚一堂,圍繞類人機(jī)器人、數(shù)據(jù)采集、情感交互等核心議題展開(kāi)深入探討。

Hugging Face 具身機(jī)器人工程師 Martino Russi 帶來(lái)了《如何打造你的類人機(jī)器人》主題演講,率先分享了他如何從開(kāi)源一個(gè)擁有 16 個(gè)自由度的數(shù)據(jù)手套出發(fā),探索構(gòu)建類人機(jī)器人的實(shí)踐路徑。Unitree Robotics 歐洲區(qū)總監(jiān) Min Zhang 以《Unitree Robotics 推出的 G1 開(kāi)源數(shù)據(jù)集與類人機(jī)器人》為題,分享了過(guò)去一年行業(yè)和學(xué)術(shù)界在類人機(jī)器人系統(tǒng)領(lǐng)域取得的重要進(jìn)展,并宣布 Unitree 已正式開(kāi)源 G1 類人機(jī)器人的運(yùn)行數(shù)據(jù)集,支持多種開(kāi)源解決方案并持續(xù)更新,以推動(dòng)全球具身智能產(chǎn)業(yè)發(fā)展。Pollen Robotics 高級(jí)產(chǎn)品經(jīng)理 Anne-Charlotte Passanisi 在《為機(jī)器人設(shè)計(jì)情感》演講中提出了引人深思的問(wèn)題:“當(dāng)機(jī)器人開(kāi)始感受,會(huì)發(fā)生什么?”她介紹了團(tuán)隊(duì)如何將語(yǔ)言模型接入 Reachy 2,通過(guò)手勢(shì)、聲音與表情將語(yǔ)言轉(zhuǎn)化為情感,從而邁出了人機(jī)交互中實(shí)現(xiàn)人工共情的第一步。

北京智源人工智能研究院機(jī)器人算法工程師 Junkai Zhao 帶來(lái)了《從人類示范中學(xué)習(xí):可擴(kuò)展機(jī)器人數(shù)據(jù)采集的新范式》的分享,介紹了一種新型的數(shù)據(jù)采集框架,展示其如何突破傳統(tǒng)限制,支持跨任務(wù)、跨環(huán)境的機(jī)器人泛化學(xué)習(xí),為通用機(jī)器人的現(xiàn)實(shí)應(yīng)用奠定基礎(chǔ)。機(jī)智云創(chuàng)始人兼 CEO Jack Huang 的演講《人工智能賦能物聯(lián)網(wǎng)設(shè)備,驅(qū)動(dòng)產(chǎn)業(yè)變革的雙引擎》強(qiáng)調(diào)了 AI 與 IoT 設(shè)備融合所帶來(lái)的深刻變革。他深入分析了這一融合趨勢(shì)、技術(shù)創(chuàng)新和多樣應(yīng)用,并探討其如何成為推動(dòng)傳統(tǒng)產(chǎn)業(yè)數(shù)字化重構(gòu)與新興產(chǎn)業(yè)增長(zhǎng)的核心動(dòng)力。最后,北京智源研究院研究員 Cheng Chi 帶來(lái)了《面向大規(guī)模具身模型的“大腦-小腦協(xié)同”框架探索》主題分享,該團(tuán)隊(duì)受生物大腦中“大腦-小腦協(xié)同機(jī)制”的啟發(fā),提出一種融合高層認(rèn)知推理與快速低延遲運(yùn)動(dòng)響應(yīng)的新型架構(gòu)框架,將高層認(rèn)知推理與快速、低延遲的傳感-運(yùn)動(dòng)適應(yīng)結(jié)合。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

GOSIM AI Spotlight 精選亮點(diǎn)成果重磅呈現(xiàn)

與主題分明的分論壇不同,Spotlight Talks 更像是一場(chǎng)快速、高密度的信息閃電戰(zhàn)。來(lái)自全球各地的開(kāi)發(fā)者與研究人員與帶來(lái)了極具代表性的項(xiàng)目與方法論,不乏對(duì)綠色 AI、機(jī)器人終身學(xué)習(xí)、RAG 智能體框架等熱門技術(shù)的深入探索,展示了 AI 實(shí)踐前沿的多元風(fēng)貌。

CodeCarbon 非營(yíng)利組織主席 Benoit Courty 率先介紹了《CodeCarbon:衡量你服務(wù)器的碳足跡》,展示了如何通過(guò)全新 API 與儀表盤(pán)更準(zhǔn)確地評(píng)估服務(wù)器的碳足跡,助力開(kāi)發(fā)者實(shí)現(xiàn)更可持續(xù)的計(jì)算。北京智源研究院研究員 Siao Liu 聚焦機(jī)器人終身學(xué)習(xí),分享了《從小處著眼,從大處著手:為終身機(jī)器人操作的原語(yǔ)提示學(xué)習(xí)》,提出了“原語(yǔ)提示學(xué)習(xí)(PPL)”方法,以提升機(jī)器人在真實(shí)與模擬環(huán)境中的操作泛化能力。隨后,阿里巴巴通義實(shí)驗(yàn)室算法專家 Ruixue Ding 在《ViDoRAG:基于動(dòng)態(tài)迭代推理智能體的視覺(jué)文檔 RAG》中介紹了 ViDoRAG 在多模態(tài)理解與動(dòng)態(tài)推理中的創(chuàng)新。

在工具層面,北京航空航天大學(xué)博士生 Yaowei Zheng 介紹了《Llama Factory》,一個(gè)無(wú)需編碼即可高效微調(diào)主流大模型的訓(xùn)練框架,支持包括 LLaMA、Qwen、Mistral 等在內(nèi)的百余種預(yù)訓(xùn)練模型。而在智能體架構(gòu)設(shè)計(jì)方面,Relevant Study LLC 創(chuàng)始人 Zonghuan Wu 帶來(lái)了《MoFA,一切皆為智能體》的主題演講,他系統(tǒng)介紹了通用智能體框架 MoFA,通過(guò)組合式構(gòu)建理念推動(dòng) AI 普惠發(fā)展。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

專家云集,共探 PyTorch 如何引領(lǐng) AI 實(shí)踐落地

PyTorch 憑借其靈活性、易用性和強(qiáng)大的擴(kuò)展性,已成為人工智能研究和應(yīng)用的核心框架,推動(dòng)著多個(gè)領(lǐng)域的技術(shù)突破。在本次大會(huì)的 PyTorch Day 論壇,PyTorch 基金會(huì)執(zhí)行董事、Linux 基金會(huì) AI 總經(jīng)理 Matt White 進(jìn)行了開(kāi)幕致辭,隨后多位重量級(jí)嘉賓分享了 PyTorch 在實(shí)際應(yīng)用中的創(chuàng)新成果,并探討了如何借助這一框架實(shí)現(xiàn)前沿技術(shù)。

其中,Pollen Robotics 聯(lián)合創(chuàng)始人兼 CTO Pierre Rouanet 帶來(lái)了題為《現(xiàn)實(shí)世界中的機(jī)器人技術(shù),會(huì)是 AI 的下一個(gè)前沿嗎?》的演講,深入探討了機(jī)器學(xué)習(xí)與機(jī)器人技術(shù)的融合如何為交互、操作與具身智能開(kāi)辟新的可能性,并強(qiáng)調(diào)真實(shí)世界中的實(shí)驗(yàn)與數(shù)據(jù)采集在彌合仿真與實(shí)際部署之間鴻溝中的關(guān)鍵作用。Meta 機(jī)器學(xué)習(xí)研究工程師 Nicolas Hug 在《TorchCodec:為 PyTorch 設(shè)計(jì)的媒體解碼庫(kù)》的分享中,展示這個(gè)全新庫(kù)如何優(yōu)化解碼流程,使視頻和音頻數(shù)據(jù)能夠高效轉(zhuǎn)換為 PyTorch 張量,并與 PyTorch 生態(tài)系統(tǒng)深度融合的實(shí)踐。Red Hat 高級(jí)首席產(chǎn)品經(jīng)理 Erwan Gallen 和 Red Hat 高級(jí)機(jī)器學(xué)習(xí)研究工程師 Eldar Kurtic 共同呈現(xiàn)了《使用 vLLM 擴(kuò)展 LLM 推理:多加速器部署與量化 LLM 應(yīng)用》的演講,介紹了通過(guò) vLLM 擴(kuò)展大語(yǔ)言模型推理的實(shí)踐過(guò)程,并借助多加速器部署與量化技術(shù)提升推理性能,進(jìn)一步推動(dòng) AI 系統(tǒng)的規(guī)模化應(yīng)用。

對(duì)于近期業(yè)界備受關(guān)注的開(kāi)源大模型 LLama 4,Meta 生成式 AI 研究產(chǎn)品負(fù)責(zé)人 Christian Keller 詳解了 Llama 4 的開(kāi)發(fā)歷程,并通過(guò)真實(shí)案例展示其在具身智能場(chǎng)景中如自主決策與人機(jī)協(xié)作方面的廣闊應(yīng)用潛力。緊隨其后,Common Crawl 高級(jí)研究科學(xué)家 Pedro Ortis Suarez 帶來(lái)了《利用 Common Crawl 數(shù)據(jù)服務(wù)于 AI 與 ML 應(yīng)用》主題演講,分享了如何高效利用 Common Crawl 的網(wǎng)頁(yè)歸檔,從預(yù)處理到數(shù)據(jù)過(guò)濾的全流程實(shí)踐,為數(shù)據(jù)驅(qū)動(dòng)的研究提供了寶貴經(jīng)驗(yàn)。而 Hugging Face 機(jī)器學(xué)習(xí)工程師 Nouamane Tazi ,則以《超大規(guī)模經(jīng)驗(yàn)分享:將訓(xùn)練擴(kuò)展到數(shù)千個(gè) GPU》為題,深入剖析超大規(guī)模訓(xùn)練的實(shí)踐細(xì)節(jié),并通過(guò) 5D 并行策略——涵蓋數(shù)據(jù)、張量、流水線、上下文和專家維度,揭示了 LLM 擴(kuò)展背后的系統(tǒng)工程之美。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

基于《教 Mistral 推理:使用 PyTorch 和 NVIDIA 進(jìn)行訓(xùn)練后優(yōu)化》主題,NVIDIA 對(duì)話式人工智能解決方案架構(gòu)經(jīng)理 Meriem Bendris 以 Mistral 為工作示例,聚焦推理性能優(yōu)化,演示了如何使用 PyTorch 與 NVIDIA 工具鏈(如 NeMo、TensorRT-LLM)提升 Mistral 等開(kāi)源模型的實(shí)際運(yùn)行效率,滿足當(dāng)下對(duì)高性能推理的旺盛需求。深度學(xué)習(xí)專家 Olatunji Ruwase 在《DeepSpeed – 深度學(xué)習(xí)模型的高效訓(xùn)練可擴(kuò)展性》分享中介紹了深度學(xué)習(xí)優(yōu)化庫(kù) DeepSpeed 在提升極大規(guī)模模型訓(xùn)練的計(jì)算、通信和 I/O 優(yōu)化方面的應(yīng)用。IBM 研究科學(xué)家 Garrett Goon 發(fā)表了《在 PyTorch 中推進(jìn) Mamba》主題演講,帶來(lái)了 IBM 在推動(dòng) PyTorch 中 Mamba 訓(xùn)練的最新進(jìn)展,包括長(zhǎng)序列數(shù)據(jù)的上下文并行訓(xùn)練、Mamba 與專家混合模型的支持以及專家并行、Torch 原生關(guān)聯(lián)掃描操作,以及改進(jìn)的 DTensor 操作支持等。在硬件感知優(yōu)化方面,Lightning AI CTO Luca Antiga 在《Lightning Thunder:為現(xiàn)代硬件加速的增強(qiáng)版 PyTorch》中展示了 Lightning Thunder 如何將“教學(xué)式” PyTorch 代碼編譯為經(jīng)過(guò)優(yōu)化的分布式 PyTorch 代碼,幫助團(tuán)隊(duì)輕松編寫(xiě)自定義代碼轉(zhuǎn)換,以高效擴(kuò)展模型、減少 GPU 浪費(fèi),并掌控技術(shù)棧。

聚焦個(gè)性化 AI 應(yīng)用,Runhouse 機(jī)器學(xué)習(xí)工程師 Paul Yang 帶來(lái)了《超越 GPT-4,打造最適合你的 AI:用微調(diào)釋放第一方數(shù)據(jù)的價(jià)值》的主題演講,探討了如何結(jié)合第一方數(shù)據(jù)與微調(diào)方法,在質(zhì)量、速度和成本間找到最佳平衡,為用戶構(gòu)建真正“屬于自己的 AI”。而在多語(yǔ)言大模型的評(píng)估實(shí)踐上,EleutherAI 自然語(yǔ)言處理研究員 Catherine Arnett 總結(jié)了一套可復(fù)現(xiàn)、可擴(kuò)展的評(píng)估最佳范式,尤其強(qiáng)調(diào)了開(kāi)發(fā)新多語(yǔ)言基準(zhǔn)時(shí)應(yīng)重點(diǎn)考慮的關(guān)鍵因素。圍繞《Kyutai 的多模態(tài)開(kāi)源,從在線演示到設(shè)備端實(shí)現(xiàn)》這一主題,Kyutai 首席探索官 Alexandre Défossez 分享了實(shí)驗(yàn)室從在線 demo 到本地設(shè)備上的流式模型運(yùn)行的探索歷程,涵蓋語(yǔ)音、視覺(jué)、同聲傳譯等多個(gè)模型方向,并剖析了跨平臺(tái)部署帶來(lái)的技術(shù)挑戰(zhàn)。最后,Hugging Face 機(jī)器學(xué)習(xí)工程師 Pablo Montalvo 在《PyTorch x Transformers 的演進(jìn)之路:Python 式編程風(fēng)格、自動(dòng)微分與模塊化如何塑造現(xiàn)代 AI》演講中率先回顧了 Transformers 庫(kù)的發(fā)展之路,如何從單一 BERT 實(shí)現(xiàn)演進(jìn)為模塊化生態(tài)系統(tǒng),并通過(guò) PyTorch 的靈活性與新特性(如 torch.compile、DTensor)持續(xù)推動(dòng)現(xiàn)代 AI 工程的可組合性與可擴(kuò)展性。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

從技術(shù)展示到實(shí)踐探索,共繪智能新篇章

大會(huì)第二天依舊干貨滿滿、亮點(diǎn)頻出。在展示單元(Showcase Sessions),眾多企業(yè)與科研機(jī)構(gòu)帶來(lái)了他們?cè)?AI 領(lǐng)域的最新技術(shù)成果與產(chǎn)品,吸引了大量觀眾駐足交流,現(xiàn)場(chǎng)氣氛熱烈。而在競(jìng)賽單元(Competition Sessions),來(lái)自全球的開(kāi)發(fā)者、工程師與機(jī)器人愛(ài)好者圍繞開(kāi)源 SO-ARM100 機(jī)械臂套件展開(kāi)實(shí)踐探索,嘗試通過(guò)模仿學(xué)習(xí)解決真實(shí)任務(wù)。這一套件集成了 Hugging Face 的 LeRobot 框架,并結(jié)合 NVIDIA 的 AI 與機(jī)器人技術(shù),支持包括 ACT 和 Diffusion Policy 在內(nèi)的前沿架構(gòu),為參賽者提供了豐富的技術(shù)支持和廣闊的探索空間。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

兩天的時(shí)間雖短,但精彩不斷。我們一起見(jiàn)證了前沿技術(shù)的碰撞、思想觀點(diǎn)的交鋒,也感受到了社區(qū)蓬勃的活力與創(chuàng)造力。GOSIM AI Paris 2025 至此圓滿落幕,感謝每一位參與者的熱情投入與支持。

當(dāng)然,技術(shù)探索永不停步!下一場(chǎng)技術(shù)盛宴已提上日程——GOSIM HANGZHOU 2025(杭州),將于 9 月 13-14 日隆重召開(kāi)。屆時(shí),更多精彩議題、重磅嘉賓和實(shí)踐分享即將揭曉,敬請(qǐng)關(guān)注~