本期為TechBeat人工智能社區(qū)668線上Talk。

北京時間3月13日(周四)20:00,香港科技大學(xué)博士生伍君杰的Talk將準(zhǔn)時在TechBeat人工智能社區(qū)開播!

他與大家分享的主題是:“大語言模型是否足夠智能?聚焦流體智能評測”,屆時他將介紹兩個與大語言模型流體智能評測相關(guān)的工作,與大家探討大語言模型的流體智能水平的真實邊界。兩篇工作均已被NAACL 2025 錄用為Oral。

Talk·信息

主題:大語言模型是否足夠智能?聚焦流體智能評測

嘉賓:香港科技大學(xué) · 博士生 - 伍君杰

時間:北京時間3月13日(周四)20:00

地點:TechBeat人工智能社區(qū)

http://www.techbeat.net/

Talk·介紹

智能系統(tǒng)可分為兩個層級:晶體智能與流體智能。研究表明,大語言模型在晶體智能維度已展現(xiàn)超越人類的表現(xiàn)。但當(dāng)面對未知任務(wù)時,這些模型能否像人類般運用流體智能實現(xiàn)知識遷移?在本次Talk中,我將介紹兩個與大語言模型流體智能評測相關(guān)的工作,與大家探討大語言模型的流體智能水平的真實邊界。

Talk大綱

1. 背景:智能系統(tǒng)的分類和對大語言模型進(jìn)行流體智能評測的重要性。

2. 解決方案1:從現(xiàn)有數(shù)據(jù)集ARC出發(fā)進(jìn)行評測。

3. 解決方案2:手動構(gòu)建物理概念理解任務(wù)PhysiCo進(jìn)行評測。

4. 結(jié)論和未來展望:總結(jié)我們的主要發(fā)現(xiàn)和未來的拓展工作。

Talk·預(yù)習(xí)資料

打開網(wǎng)易新聞 查看精彩圖片

論文鏈接: https://arxiv.org/abs/2502.07190 項目主頁: https://wujunjie1998.github.io/araoc-benchmark.github.io/

打開網(wǎng)易新聞 查看精彩圖片

論文鏈接: https://arxiv.org/abs/2502.08946 項目主頁: https://physico-benchmark.github.io/

Talk·提問交流

在Talk界面下的【交流區(qū)】參與互動!留下你的打call和問題,和更多小伙伴們共同討論,被講者直接翻牌解答!

打開網(wǎng)易新聞 查看精彩圖片

你的每一次貢獻(xiàn),我們都會給予你相應(yīng)的i豆積分,還會有驚喜獎勵哦!

Talk·嘉賓介紹

打開網(wǎng)易新聞 查看精彩圖片

伍君杰???????????

香港科技大學(xué) · 博士生???

香港科技大學(xué)在讀博士生,師從Dit-Yan Yeung教授,本科畢業(yè)于中山大學(xué), 現(xiàn)于耶魯大學(xué)自然語言處理實驗室(Yale NLP Lab)訪問。研究方向包括大語言模型評測,長文本模型訓(xùn)練與評測, 檢索增強生成及機(jī)器翻譯。相關(guān)工作發(fā)表于EMNLP, NAACL、Web Conference等自然語言處理和機(jī)器學(xué)習(xí)的頂級學(xué)術(shù)會議。

個人主頁: https://www.techbeat.net/grzytrkj?id=43740

-The End-

打開網(wǎng)易新聞 查看精彩圖片

如果你也想成為講者

自薦 / 推薦

單人Talk | 團(tuán)隊專場 | 錄播or直播 | 閉門交流

多種方式任你選擇!

推薦講者成功也有獎勵哦~

關(guān)于TechBeat人工智能社區(qū)

TechBeat(www.techbeat.net)隸屬于將門創(chuàng)投,是一個薈聚全球華人AI精英的成長社區(qū)。

我們希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其學(xué)習(xí)成長。

期待這里可以成為你學(xué)習(xí)AI前沿知識的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級打怪的根據(jù)地!

更多詳細(xì)介紹>>

預(yù)約本期Talk