打開網易新聞 查看精彩圖片

本期為TechBeat人工智能社區(qū)671線上Talk。

北京時間3月26日(周三)20:00,加州大學洛杉磯分校博士生周詩杰的Talk將準時在TechBeat人工智能社區(qū)開播!

他與大家分享的主題是:“邁向4D空間智能 - 當動態(tài)3D場景表示遇見視覺語言大模型”,屆時他將探索:從 3D 場景表征的底層邏輯到動態(tài) 4D 重建的前沿突破,并聚焦多模態(tài)認知架構,剖析現有智能體在時空認知能力上與人類的差距。

Talk·信息

主題:邁向4D空間智能 - 當動態(tài)3D場景表示遇見視覺語言大模型

嘉賓:加州大學洛杉磯分校 · 博士生 - 周詩杰

時間:北京時間3月26日(周三)20:00

地點:TechBeat人工智能社區(qū)

http://www.techbeat.net/

Talk·介紹

如何讓AI真正理解我們所處的世界?物理世界的本質是三維空間與時間流變的統(tǒng)一場域——我們稱之為4D時空場。當前AGI大模型與智能體的終極使命,正是要在這動態(tài)的時空連續(xù)體中實現與人類的無縫協(xié)作。構建具備4D時空認知能力的智能系統(tǒng),已成為解鎖下一代AI潛能的關鍵密鑰。

本次Talk我們將探索:首先解構3D場景表征的底層邏輯,沿著"靜態(tài)3D重建→動態(tài)4D重建"的技術脈絡,揭示時空連續(xù)體特征場建模的前沿突破;進而聚焦多模態(tài)認知架構,從語義拓撲構建到視覺語言大模型的推理躍遷,剖析現有智能體的時空認知能力距離人類到底還差多遠。

Talk大綱

0. 3D場景表示入門與基礎

參考:3DGS時代的三維場景表示與生成

https://techbeat.net/talk-info?id=877

1. 構建3D靜態(tài)語義世界 (Feature 3DGS - CVPR 2024 Highlight)

2. 從3D場景表示到4D智能體(Feature4X - CVPR 2025)

3. 我們距離真正具備4D時空意識的智能體還有多遠 (VLM4D - Technical Report)

Talk·預習資料

打開網易新聞 查看精彩圖片

論文鏈接: https://arxiv.org/abs/2312.03203 項目主頁: https://feature-3dgs.github.io/

打開網易新聞 查看精彩圖片

項目主頁: https://feature4x.github.io/

打開網易新聞 查看精彩圖片

項目主頁: https://vlm4d.github.io/


Talk·提問交流

在Talk界面下的【交流區(qū)】參與互動!留下你的打call和問題,和更多小伙伴們共同討論,被講者直接翻牌解答!

打開網易新聞 查看精彩圖片

你的每一次貢獻,我們都會給予你相應的i豆積分,還會有驚喜獎勵哦!

Talk·嘉賓介紹

打開網易新聞 查看精彩圖片

周詩杰???????????

加州大學洛杉磯分校 · 博士生???

周詩杰,加州大學洛杉磯分校(UCLA)博士生,研究方向為3D計算機視覺與空間智能。他在CVPR,ECCV,NeurIPS,ICLR等計算機視覺與人工智能頂會發(fā)表過多篇論文,其中2篇榮獲CVPR 2024 Highlight和ICLR 2025 Spotlight,同時他也是SIGGRAPH,CVPR等頂會審稿人。他曾在Google擔任學生研究員,并將于2025年加入Apple擔任研究實習生,致力于空間智能研發(fā)。曾獲UCLA視覺與圖形學傅立葉學者獎,加州大學研究生院長學者獎,哥倫比亞大學碩士榮譽學生獎,電子科技大學優(yōu)秀本科畢業(yè)生獎等。

個人主頁: https://www.techbeat.net/grzytrkj?id=39927????

-The End-

打開網易新聞 查看精彩圖片

如果你也想成為講者

自薦 / 推薦

單人Talk | 團隊專場 | 錄播or直播 | 閉門交流

多種方式任你選擇!

推薦講者成功也有獎勵哦~

關于TechBeat人工智能社區(qū)

TechBeat(www.techbeat.net)隸屬于將門創(chuàng)投,是一個薈聚全球華人AI精英的成長社區(qū)。

我們希望為AI人才打造更專業(yè)的服務和體驗,加速并陪伴其學習成長。

期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據地!

更多詳細介紹>>

預約本期Talk