
從 OpenAI o1 到 DeepSeek R1,推理模型進入到了全新的發(fā)展階段,展現(xiàn)出來的「慢思考、強推理」能力正在加速從語言智能到認知智能的進程,并構(gòu)筑起未來 AGI 的重要基石。同時,學(xué)界對大語言模型范式的探索仍在繼續(xù),擴散模型不斷向主流的自回歸架構(gòu)發(fā)起挑戰(zhàn)。
當(dāng)然,在 2025 智能體元年,大語言模型(LLM)驅(qū)動的智能體借助手機等移動終端的落地,深刻改變了人機交互范式。多模態(tài)大模型的競爭也趨于白熱化,提升跨模態(tài)理解與生成能力的同時注重低成本和低門檻應(yīng)用。
為讓從業(yè)者全面了解 AI 社區(qū)涌現(xiàn)的最新創(chuàng)新成果和發(fā)展趨勢,機器之心計劃 4 月 20 日在北京舉辦「ICLR 2025 論文分享會」,圍繞著訓(xùn)練推理、多模態(tài)、Agent 等熱門主題邀請頂級專家、論文作者與現(xiàn)場參會觀眾共同交流。
作為機器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的頂級會議,ICLR 具有極高的含金量, 每年都會吸引大量研究機構(gòu)和高校參會。今年,ICLR 2025 共接收 11,565 份投稿,錄用率為 32.08%。
作為一場為國內(nèi) AI 人才打造的盛會,本次論文分享會設(shè)置了 Keynote、論文分享、圓桌對話、Poster 交流等豐富環(huán)節(jié)。今天,論文分享會的全日程、Keynote 分享嘉賓及演講主題正式公布,感興趣的讀者可以通過鏈接來報名參加

報名鏈接:https://wj.qq.com/s2/19052599/vujd/?wj_lang=zhs
Keynote 嘉賓及演講主題
上午 Keynote:陳鍵飛 基于量化稀疏的高效訓(xùn)練推理:理論及算法

分享人介紹:陳鍵飛,清華大學(xué)計算機系準(zhǔn)聘副教授。2010-2019 年獲清華大學(xué)學(xué)士和博士學(xué)位。從事高效機器學(xué)習(xí)研究,谷歌學(xué)術(shù)引用 5000 余次。擔(dān)任 IEEE TPAMI 的編委,擔(dān)任 ICLR 等會議領(lǐng)域主席。獲得 CCF 青年人才發(fā)展計劃、清華大學(xué)學(xué)術(shù)新人獎等。
分享摘要:大模型所需計算成本高昂,而低精度、稀疏等高效訓(xùn)練推理方法均在原有計算基礎(chǔ)上引入了近似,可能會引起精度損失。本報告將介紹近似梯度下降理論,該理論可以為高效的近似訓(xùn)練方法的收斂性、收斂速度提供理論保證。基于該理論,將分別介紹通過量化和稀疏兩條技術(shù)路線設(shè)計的前饋神經(jīng)網(wǎng)絡(luò)計算加速、注意力計算加速、激活壓縮、優(yōu)化器壓縮、通信壓縮等高效訓(xùn)練推理算法。將從機器學(xué)習(xí)的角度出發(fā),介紹高效訓(xùn)練的過程中遇到的訓(xùn)練不穩(wěn)定等問題及克服方法。
下午 Keynote:李崇軒 LLaDA:語言模型新范式

分享人介紹:李崇軒,中國人民大學(xué)高瓴人工智能學(xué)院準(zhǔn)聘副教授、博士生導(dǎo)師,2010-2019 年獲清華大學(xué)學(xué)士和博士學(xué)位。主要研究機器學(xué)習(xí)、深度生成模型,代表性工作部署于 DALL?E 2、Stable Diffusion、Vidu 等生成式大模型。獲國際會議 ICLR 杰出論文獎、吳文俊優(yōu)秀青年獎、吳文俊人工智能自然科學(xué)一等獎、中國計算機學(xué)會優(yōu)秀博士論文等,主持國家自然基金重大研究計劃培育項目、面上項目等。擔(dān)任 IEEE TPAMI 編委、軟件學(xué)報編委和 ICLR、NeurIPS 等國際會議的領(lǐng)域主席。
分享摘要:本次報告聚焦一個問題:自回歸是否是通向當(dāng)前乃至更高水平的生成式智能的唯一范式?本次報告首先從統(tǒng)一概率建模的視角總結(jié)當(dāng)前基礎(chǔ)生成模型的發(fā)展,并從這個視角出發(fā)指出大語言模型的性質(zhì)(如可擴展性、指令追隨、情景學(xué)習(xí)、對話、無損壓縮)主要來自于生成式準(zhǔn)則,而非自回歸建模獨有?;谶@些洞察,本次報告基于掩碼的擴散語言模型的技術(shù)路線,包括基礎(chǔ)理論和擴展定律。最終,基于前期成果,訓(xùn)練 8B 擴散大語言模型 LLaDA(Large Language Diffusion with mAsking)。在 20 多個語言、代碼、數(shù)學(xué)等評測集上,LLaDA 8B 全面超過 LLaMA 2,對標(biāo) LLaMA 3。并且 LLaDA 通過非自回歸的方式,展示了令人驚訝的可擴展性和多輪對話能力。這些結(jié)果不僅挑戰(zhàn)了自回歸的地位,更加深了我們對生成式人工智能的理解。
Poster
在本次論文分享會中,將會有一批論文作者進行論文分享與 Poster 展示,感興趣的讀者可以通過下圖了解具體信息:

此次論文分享會也將在機器之心視頻號以及黃大年茶思屋科技網(wǎng)站兩個平臺進行直播,歡迎大家關(guān)注、預(yù)約。
合作伙伴介紹
黃大年茶思屋科技網(wǎng)站
黃大年茶思屋科技網(wǎng)站是致力于推動科學(xué)與技術(shù)交流的開放平臺。我們匯聚全球科學(xué)家、研究人員和技術(shù)專家,共同探討最前沿的學(xué)術(shù)話題,分享最新的科研成果,激發(fā)創(chuàng)新思維的火花。在這里,您可以看到學(xué)術(shù)熱點、精選論文、學(xué)術(shù)峰會、技術(shù)難題、專利、開源和科技賽事等內(nèi)容。茶思屋科技網(wǎng)站,匯聚全球科研智慧,推動科技創(chuàng)新,讓科技百花園更加繁榮。
網(wǎng)址:https://www.chaspark.com
騰訊青云計劃
騰訊青云計劃聚焦 AI 大模型等十大技術(shù)領(lǐng)域,面向全球招募頂尖實習(xí)生和畢業(yè)生,提供上不封頂?shù)穆毤壭匠?、全面定制化的培養(yǎng)方案,并開放核心業(yè)務(wù)工作機會、解鎖前瞻性技術(shù)課題培養(yǎng)中國未來的科技人才。
今年騰訊將繼續(xù)深度參與多場全球頂級學(xué)術(shù)會議,并組織群星未來之夜的系列活動。
加入青云計劃,不負少年意氣!
青云官網(wǎng):https://join.qq.com/qingyun.html
真格基金
真格基金創(chuàng)立于 2011 年,是國內(nèi)最早的天使投資機構(gòu)之一。自創(chuàng)立伊始,真格基金一直積極尋找最優(yōu)秀的創(chuàng)業(yè)團隊和引領(lǐng)時代的投資機會,從早期陪伴了小紅書、Nuro、Momenta、依圖科技、出門問問、晶泰科技、星競威武、XCharge、地平線、云天勵飛、禾賽科技、億航智能、格靈深瞳、水滴、逸仙電商等公司一路成長,并連續(xù) 9 年獲評清科「中國早期投資機構(gòu) 30 強」TOP3。
網(wǎng)址:https://www.zhenfund.com/
博世集團
博世集團是全球領(lǐng)先的技術(shù)和服務(wù)供應(yīng)商,博世在智能出行,工業(yè)技術(shù),能源與建筑技術(shù),消費品等領(lǐng)域持續(xù)深耕,助力全球社會的可持續(xù)發(fā)展。
在加速變革的時代,博世始終堅持 “科技成就生活之美的理念”, 以創(chuàng)新為驅(qū)動,用信息與決心堅定向前。
網(wǎng)址:https://www.bosch.com.cn/careers
熱門跟貼