国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

全球首款 AI 多人游戲來了！你的老電腦也能玩 | 附下載地址

AppSo

2025-05-09 14:43 ·廣東 ·AppSo官方網(wǎng)易號

AI 玩游戲，不稀奇；AI 編游戲，也不新鮮。

但用 AI 構建一個支持兩個人實時互動、視角一致、邏輯同步的游戲世界？這事兒，今天才第一次發(fā)生。

以色列 Enigma Labs 團隊今天在 X 平臺宣稱發(fā)布全球首款由 AI 生成的多人游戲——Multiverse（多重宇宙）。名字聽起來就像漫威出品，玩法也確實夠科幻。

漂移、撞車，全都同步，操作互相響應，細節(jié)還能對上幀數(shù)。

游戲里的一切，不再靠預設劇本或物理引擎控制，而是由一個 AI 模型實時生成，確保兩名玩家看到的是同一個邏輯統(tǒng)一的世界。

而且 Multiverse 已經(jīng)全面開源：代碼、模型、數(shù)據(jù)、文檔一應俱全，全都放到了 GitHub 和 Hugging Face 上。你甚至能在自己電腦上直接跑起來。

Hugging Face CEO Clément Delangue 也在 X 平臺在線打 call：

這是我今天在 Hugging Face 上看到的最酷的數(shù)據(jù)集：Gran Turismo 4 中 1 對 1 競速的動作標簽，用來訓練一個多人世界模型

車輛在賽道上不斷變換位置，超車、漂移、加速，然后再次在某個路段匯合。

那這款名為 Multiverse 的模型，究竟是怎么一回事？官方技術團隊用一篇技術博客分享了更多構建細節(jié)。

在此之前，我們得先介紹一下傳統(tǒng) AI 世界模型：你操作一下，它預測一下畫面需要怎樣生成。模型看你的操作、看前幾幀，然后生成下一幀。原理嘛，說起來也不難理解：

動作嵌入器：把玩家操作（比如你按了哪個鍵）轉成嵌入向量

去噪網(wǎng)絡：使用擴散模型，結合操作和前幾幀畫面，預測下一幀

上采樣器（可選）：對生成畫面進行分辨率和細節(jié)增強處理

但一旦引入第二名玩家，問題就復雜了。

最典型的 bug 是，你這邊賽車剛撞上護欄，對手那邊卻還在風馳電掣；你甩出賽道，對方卻根本沒看見你在哪。整個游戲體驗就像卡了兩幀，還不同步。

而 Multiverse，正是第一款能同步兩個玩家視角的 AI 世界模型，無論哪個玩家發(fā)生了什么，另一個人都能實時在自己畫面中看到，毫無延遲、無邏輯沖突。

這也是過去 AI 模擬很難搞定的一點：多視角一致性。

要想解決這一點，構建真正的協(xié)作式多人世界模型，Multiverse 團隊想到了一個很聰明的的方案。說干就干，他們保留了核心組件，同時把原本的「單人預測」思路全打碎重構：

動作嵌入器：接收兩個玩家的動作，輸出一個整合了雙方操作的嵌入向量；

去噪網(wǎng)絡：擴散網(wǎng)絡，同時生成兩個玩家的畫面，確保它們作為一個整體一致；

上采樣器：與單人模式類似，但同時對兩個玩家的畫面進行處理和增強。

本來，處理雙人畫面，很多人第一反應是分屏：把兩幅畫分開，各自生成。

這思路簡單粗暴，但同步難、資源耗、效果差，但他們想到將兩個玩家的視角「縫合」成一個畫面，將他們的輸入合并為一個統(tǒng)一的動作向量，整體當作一個「統(tǒng)一場景」來處理。

具體做法是通道軸堆疊：把兩個畫面作為一張擁有雙倍顏色通道的圖像處理。

這事兒聽著小，技術上其實非常聰明。因為擴散模型采用的是 U-Net 架構，核心是卷積和反卷積，而卷積神經(jīng)網(wǎng)絡對通道維度的結構感知能力極強。

換句話說，這不是把兩個世界貼一起，而是讓模型從「神經(jīng)元底層」就知道這兩個畫面是有關聯(lián)的，是要協(xié)同生成的，最終的畫面，不用手動對齊，天然同步。

但要讓模型預測下一幀準確無誤，還得搞清楚一件事：車速和相對位置是動態(tài)的，預測得準，得有足夠的信息。他們發(fā)現(xiàn)：8 幀（30 fps 條件下）足以學習加速、剎車、轉向等運動學特征。

但問題在于：超車等相對速度遠比絕對速度慢得多（約 100 km/h vs 5 km/h），幀數(shù)要是太近，模型根本感知不到變化。

于是他們設計了一個折中方案 —— 稀疏采樣：

提供最近連續(xù)的 4 幀（確保即時響應）；

再額外提供 4 幀「隔 4 幀采樣」的歷史畫面；

最早一幀距離當前幀 20 幀，也就是約 0.666 秒前。

而要真正讓模型理解「協(xié)同駕駛」，不能只靠這些輸入數(shù)據(jù)，還得在互動行為上做強化訓練。

傳統(tǒng)單人任務（比如走路、打槍）只需要預測很短的時間窗口，比如 0.25 秒。但多人交互下，這么點時間變化微乎其微，根本體現(xiàn)不出「組隊感」。

Multiverse 的解法是：干脆讓模型預測長達 15 秒的行為序列，以此捕捉長周期、多輪次的互動邏輯。

訓練方法也不是一下就上 15 秒，而是用了一套「課程式學習（curriculum learning）」策略：從 0.25 秒預測開始，逐步延長到 15 秒。這樣模型先學會汽車結構、賽道幾何這些底層特征，再慢慢掌握玩家策略、博弈動態(tài)這些高階概念。

訓練完之后，模型在物體持續(xù)性、幀間一致性方面表現(xiàn)明顯提升。簡而言之，不會突然車子消失，也不會前后邏輯崩壞。

如此出色的訓練表現(xiàn)，歸功于其背后精心挑選的數(shù)據(jù)集，沒錯，就是那款 2004 年 PS2 上的賽車模擬游戲：Gran Turismo 4。

當然，為了免責，Multiverse 團隊也沒忘記調侃自己是索尼的鐵桿粉絲。

他們的測試場景是筑波賽道上的 1 對 1 比賽，但問題是 GT4 并不原生支持「1v1 視角回放」。所以他們逆向工程了一把，把游戲改造出一個真實的 1v1 模式。接著：

每場比賽錄兩次，一次看自己，一次看對手；

再通過同步處理，合并為一個完整視頻，展示雙方實時對戰(zhàn)畫面。

那按鍵數(shù)據(jù)怎么辦，畢竟游戲本身沒提供操作日志。

答案是，他們利用游戲 HUD 顯示的信息（油門、剎車、方向盤指示條），通過計算機視覺，逐幀提取游戲屏幕上顯示的油門、剎車、方向條，再反推出控制指令。

也就是說，全靠畫面信息就能還原操作，無需額外日志文件。

當然，這個流程效率偏低，總不可能每場比賽都得人工錄兩遍。

他們發(fā)現(xiàn) GT4 有個隱藏功能叫 B-Spec 模式，可以讓 AI 自己開車。于是就寫了個腳本，給 AI 發(fā)隨機指令，讓它自己開比賽、自己撞車、從而批量生成數(shù)據(jù)集。

順便，他們還試過用 OpenPilot 的自動駕駛模型控制游戲角色，雖然效果不錯，但就效率和穩(wěn)定性而言，B-Spec 更適合做大規(guī)模訓練。

重點來了，談效果，不談成本，自然是耍流氓。

這么一個能跑多視角世界、畫面同步、穩(wěn)定輸出的 AI 模型，模型、訓練、數(shù)據(jù)、推理全算上，全程只花了 1500 刀，跟一臺高端顯卡差不多。

Multiverse 員工 Jonathan Jacobi 在 X 上發(fā)文寫道：

我們只用了 1500 美元就構建了 Multiverse，關鍵不在算力，而在技術創(chuàng)新。

更重要的是，Jacobi 認為，多人世界模型不僅是 AI 玩游戲的新方式，更是模擬技術的下一步。它解鎖了一個全新的世界：由玩家、智能體和機器人共同進化、共同塑造的動態(tài)環(huán)境。

未來，世界模型可能就像是虛擬版的真實社會：你與 AI 共處其中，形成真實感極強的「動態(tài)宇宙」，同時也擁有接近現(xiàn)實社會的復雜互動邏輯。

所以，你說這事兒聽起來是不是有點上頭？

附上參考地址：

GitHub：
https://github.com/EnigmaLabsAI/multiverse
Hugging Face 數(shù)據(jù)集：
https://huggingface.co/datasets/Enigma-AI/multiplayer-racing-low-res
Hugging Face 模型：
https://huggingface.co/Enigma-AI/multiverse
官方博客：
https://enigma-labs.io/blog

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關鏈接）

打開網(wǎng)易新聞體驗更佳

熱搜

熱門跟貼

打開APP發(fā)貼

禄劝| 佛教| 宁南县| 北安市| 靖江市| 高尔夫| 兴文县| 修水县| 平陆县| 于都县| 台中市| 奉节县| 通榆县| 五家渠市| 佛山市| 育儿| 孟连| 呼图壁县| 富裕县| 上高县| 开封县| 岑溪市| 双柏县| 宁陕县| 仙桃市| 青州市| 南岸区| 黄山市| 平罗县| 亚东县| 嘉祥县| 留坝县| 固原市| 宜黄县| 错那县| 农安县| 武山县| 鄂伦春自治旗| 五家渠市| 涞水县| 平定县|