国产精品女人视频一区二区三区,在线观看亚洲电影网站,成人午夜福利电影在线,av在线大片不卡可观看,国产又粗又长又爽又黄视频

場(chǎng)景生成與3D資產(chǎn)的結(jié)合是一項(xiàng)復(fù)雜的挑戰(zhàn)，既需要高層次的語(yǔ)義理解，也需要低層次的幾何推理。雖然多模態(tài)大語(yǔ)言模型（MLLMs）在語(yǔ)義任務(wù)上表現(xiàn)出色，但其在3D場(chǎng)景生成中的應(yīng)用受限于對(duì)3D幾何的有限理解。如何最有效地利用MLLMs來(lái)完成物體擺放任務(wù)。為此，谷歌提出了一個(gè)名為FirePlace的創(chuàng)新框架，該框架利用現(xiàn)有的MLLMs來(lái)：（1）進(jìn)行3D幾何推理，并從3D場(chǎng)景中提取相關(guān)的幾何細(xì)節(jié)；（2）構(gòu)建并求解從低級(jí)幾何信息中提取的幾何約束；（3）進(jìn)行篩選，以確保最終的物體擺放符合常識(shí)。

通過(guò)將幾何推理與MLLMs的現(xiàn)實(shí)世界理解相結(jié)合，FirePlace方法能夠提出同時(shí)滿足幾何約束和高級(jí)語(yǔ)義常識(shí)的物體擺放方案。通過(guò)批量視覺(jué)選擇（Batched Visual Selection）實(shí)現(xiàn)視覺(jué)選擇任務(wù)的推理計(jì)算擴(kuò)展，F(xiàn)irePlace 能夠?qū)⒄Z(yǔ)言指令轉(zhuǎn)換為可落地的 3D 約束，從而生成既符合幾何可行性，又在美學(xué)、功能性和可達(dá)性等方面合理的物體擺放方案。(鏈接在文章底部)

01 技術(shù)原理

FirePlace 流水線：[步驟1]FirePlace 首先生成一組約束概要，以文本形式描述適用的約束條件以及相應(yīng)的交互表面。[步驟2-4]FirePlace 使用批量視覺(jué)選擇（Batched Visual Selection）在實(shí)例分割掩碼上選擇錨定物體，提取與約束概要最匹配的表面，并利用約束求解器生成可行的布局方案。[步驟5]最后，F(xiàn)irePlace 通過(guò)MLLMs選擇符合常識(shí)原則的擺放方案子集，確保最終結(jié)果既合理又實(shí)用。

FirePlace 使多模態(tài)大語(yǔ)言模型（MLLMs）能夠在復(fù)雜的預(yù)設(shè)3D場(chǎng)景中放置新的3D物體，其輸入包括：一個(gè) 3D 場(chǎng)景，一個(gè) 3D 物體，一條語(yǔ)言指令。FirePlace 結(jié)合MLLMs的常識(shí)推理與低級(jí)幾何約束，按照所述流程執(zhí)行物體擺放，F(xiàn)irePlace 生成的物體擺放位置以紅色標(biāo)示。

02 物體擺放三個(gè)挑戰(zhàn)

獲取精細(xì)幾何信息：實(shí)現(xiàn)逼真的放置需要超越邊界框的幾何信息。但幾何細(xì)節(jié)應(yīng)如何傳遞給多模態(tài)大模型（MLLMs）？先前的研究通常傳遞邊界框參數(shù)。例如，"椅子上的泰迪熊"并不等同于[泰迪熊] 在 [椅子]上方。

對(duì)對(duì)象實(shí)例的上下文理解：被放置到現(xiàn)有場(chǎng)景中的對(duì)象需要一種方法來(lái)區(qū)分相同類型的不同實(shí)例，利用它們所處的上下文信息。左邊的椅子有人坐了，所以我們應(yīng)該把泰迪熊放在右邊的椅子上。

關(guān)于物體放置的常識(shí)推理：滿足幾何約束的放置方式可能并不符合關(guān)于美觀性、可達(dá)性或功能性的常識(shí)推理。而這些因素很難僅通過(guò)原始幾何約束來(lái)傳達(dá)。在展示的四種泰迪熊放置方式中，有一種最“合理”。你之所以知道，是因?yàn)槟隳芸匆?jiàn)它們。

https://arxiv.org/pdf/2503.04919
https://fireplace3d.github.io/

歡迎交流~，帶你學(xué)習(xí)AI，了解AI

国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

FirePlace讓3D場(chǎng)景生成進(jìn)入智能擺放新時(shí)代

熱搜

熱門跟貼

国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

熱搜

熱門跟貼

相關(guān)推薦

擴(kuò)散模型還原被遮擋物體，幾張稀疏照片也能"腦補(bǔ)"重建交互式場(chǎng)景

當(dāng)夢(mèng)寐以求的3D打印機(jī)走近顯示，想要什么玩具都能自己打印機(jī)

制造業(yè)的魅力，小攤折疊收納一氣呵成，設(shè)計(jì)人太有才了！

僅用3周時(shí)間，就打造出Manus開(kāi)源平替！貢獻(xiàn)源代碼，免費(fèi)用

學(xué)會(huì)3D打印技術(shù)，想要什么輕松實(shí)現(xiàn)，放在過(guò)去簡(jiǎn)直就是科幻片

國(guó)外技術(shù)師的研究，可以適應(yīng)任何形狀的工作臺(tái)，看變化就懂了！

美術(shù)生看到要崩潰，雕塑都是機(jī)械化雕刻了，想要怎么自動(dòng)化生成！

全屋智能性價(jià)比方案來(lái)啦

印度不愧是生產(chǎn)地，蘋(píng)果折疊板都出來(lái)了，和概念圖很類似！

智能大模型的應(yīng)用場(chǎng)景，直接用來(lái)哄孩子，以后別怪孩子不養(yǎng)你

當(dāng)夢(mèng)寐以求的3D打印機(jī)走進(jìn)現(xiàn)實(shí)，實(shí)現(xiàn)玩具自由不是夢(mèng)

NUS團(tuán)隊(duì)新作FAR同時(shí)實(shí)現(xiàn)短視頻和長(zhǎng)視頻預(yù)測(cè)SOTA，代碼已開(kāi)源

中杯o3成OpenAI“性價(jià)比之王”？ARC-AGI測(cè)試結(jié)果出爐

采樣越多越聰明？隱式擴(kuò)展顛覆認(rèn)知，采樣搜索如何挑出完美解

篩選基因總不好？這個(gè)網(wǎng)站不可少

GPT-4o能拼好樂(lè)高嗎？首個(gè)多步空間推理評(píng)測(cè)基準(zhǔn)：閉源模型領(lǐng)跑

北約戰(zhàn)斗機(jī)首次空戰(zhàn)勝利！美軍F-16擊落6架南斯拉夫攻擊機(jī) ！

上交基于AI開(kāi)發(fā)多感官反饋系統(tǒng)及硬件，建立人機(jī)協(xié)同空間認(rèn)知范式

空壓機(jī)維修實(shí)例分享，不止一個(gè)故障，這個(gè)算經(jīng)典案例嗎？

同樣的視覺(jué)，不同的想法！

制造業(yè)的魅力，小攤折疊收納一氣呵成，設(shè)計(jì)人太有才了！

僅用3周時(shí)間，就打造出Manus開(kāi)源平替！貢獻(xiàn)源代碼，免費(fèi)用

學(xué)會(huì)3D打印技術(shù)，想要什么輕松實(shí)現(xiàn)，放在過(guò)去簡(jiǎn)直就是科幻片

國(guó)外技術(shù)師的研究，可以適應(yīng)任何形狀的工作臺(tái)，看變化就懂了！

美術(shù)生看到要崩潰，雕塑都是機(jī)械化雕刻了，想要怎么自動(dòng)化生成！

印度不愧是生產(chǎn)地，蘋(píng)果折疊板都出來(lái)了，和概念圖很類似！

智能大模型的應(yīng)用場(chǎng)景，直接用來(lái)哄孩子，以后別怪孩子不養(yǎng)你

NUS團(tuán)隊(duì)新作FAR同時(shí)實(shí)現(xiàn)短視頻和長(zhǎng)視頻預(yù)測(cè)SOTA，代碼已開(kāi)源

中杯o3成OpenAI“性價(jià)比之王”？ARC-AGI測(cè)試結(jié)果出爐

采樣越多越聰明？隱式擴(kuò)展顛覆認(rèn)知，采樣搜索如何挑出完美解

篩選基因總不好？這個(gè)網(wǎng)站不可少

GPT-4o能拼好樂(lè)高嗎？首個(gè)多步空間推理評(píng)測(cè)基準(zhǔn)：閉源模型領(lǐng)跑

北約戰(zhàn)斗機(jī)首次空戰(zhàn)勝利！美軍F-16擊落6架南斯拉夫攻擊機(jī) ！

上交基于AI開(kāi)發(fā)多感官反饋系統(tǒng)及硬件，建立人機(jī)協(xié)同空間認(rèn)知范式

空壓機(jī)維修實(shí)例分享，不止一個(gè)故障，這個(gè)算經(jīng)典案例嗎？

同樣的視覺(jué)，不同的想法！