国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

生成很強(qiáng)，推理很弱：GPT-4o的視覺(jué)短板

大數(shù)據(jù)文摘

2025-04-21 12:14 ·北京

大數(shù)據(jù)文摘出品

如果讓AI畫(huà)一只狗站在“左邊”，但事先告訴它“左就是右”，你覺(jué)得它能反應(yīng)過(guò)來(lái)嗎？
最近，UCLA的一項(xiàng)新研究用一系列精心設(shè)計(jì)的實(shí)驗(yàn)，揭開(kāi)了GPT-4o在圖像理解和推理上的短板——它畫(huà)得漂亮，卻未必真懂你的意思。

論文主線很直接，GPT-4o的畫(huà)圖能力確實(shí)驚艷，但真正涉及理解圖像、語(yǔ)境推理、多步邏輯鏈條時(shí)，依然有明顯短板。

這讓我想起了“看起來(lái)很會(huì)，實(shí)際上還差點(diǎn)意思”那種AI微妙的尷尬。

照例，我把三大實(shí)驗(yàn)部分，一個(gè)一個(gè)給大家說(shuō)清楚，希望帶你們完整感受下，這波研究到底發(fā)現(xiàn)了什么。

01. 全局規(guī)則遵循失敗

其實(shí)這個(gè)部分有點(diǎn)意思，就類似我們平常和朋友開(kāi)玩笑：“以后我說(shuō)左其實(shí)是右哦”，然后再讓他“往左走一步”，看他會(huì)不會(huì)真的往右走。

UCLA研究員給GPT-4o下了類似的套：“接下來(lái)‘left’都指‘right’”，“數(shù)字都要減2”，然后再讓它“畫(huà)一只狗在左邊”，“畫(huà)5只鳥(niǎo)”。

本以為AI能舉一反三，結(jié)果——

狗還是在左邊，鳥(niǎo)還是5只，全然無(wú)視前面重新定義的規(guī)則。

這說(shuō)明什么？

GPT-4o在圖像生成時(shí)，還是字面理解指令，全局重定義、上文設(shè)定根本進(jìn)不到它的“畫(huà)畫(huà)腦子”里。

你想讓它“靈活變通”，它卻只會(huì)“忠實(shí)執(zhí)行表面”，這跟人類的小聰明比還差了不少。

02. 圖像編輯：淺層語(yǔ)義理解暴露

第二部分測(cè)試更有挑戰(zhàn)性，研究員讓GPT-4o動(dòng)手編輯圖片。

比如，

“只改水里的馬倒影為獅子，別動(dòng)馬本體?！?/p>

結(jié)果AI一出手，馬和倒影全變了。

再比如，

“只刪掉畫(huà)面里坐著的人?！?/p>

結(jié)果站著的背景人也被一鍋端了。

這些例子直接暴露了一個(gè)問(wèn)題：

GPT-4o對(duì)于“局部修改”“語(yǔ)義限定”這類任務(wù)，根本把握不住分寸。

它沒(méi)法精確地區(qū)分“倒影”與“實(shí)體”、“坐著”與“站著”，操作經(jīng)常“過(guò)猶不及”，動(dòng)錯(cuò)地方。

說(shuō)白了，AI的圖像編輯理解，遠(yuǎn)沒(méi)達(dá)到“人類看圖、理解場(chǎng)景”的精細(xì)度。

有點(diǎn)像讓一個(gè)剛學(xué)會(huì)PS的小白去修圖，沒(méi)概念，純靠猜。

03. 多步推理與條件邏輯：徹底拉胯

最致命的短板，出現(xiàn)在“多步推理”和“條件判斷”環(huán)節(jié)。

比如，

先叫GPT-4o畫(huà)一只狗和一只貓，然后告訴它：“如果沒(méi)有貓，把狗換成貓并搬到海灘?！?/p>

但其實(shí)第一張圖貓已經(jīng)有了。

按理說(shuō)，這時(shí)候AI應(yīng)該什么都不改。

但它還是把狗換成貓，還把場(chǎng)景全搬了——條件完全沒(méi)判對(duì)，邏輯也亂套。

類似的例子還有很多，AI經(jīng)常搞不清復(fù)雜條件，或者干脆“每條指令都照做”，不管前后有沒(méi)有沖突。

這印證了一個(gè)核心問(wèn)題：

GPT-4o不具備上下文敏感的推理能力，無(wú)法在復(fù)雜圖像編輯任務(wù)中進(jìn)行智能判斷。

它在“理解前提—邏輯判斷—再行動(dòng)”這個(gè)鏈路上，明顯還差一大截。

總的來(lái)說(shuō)，現(xiàn)在的AI，更像是個(gè)“精致的指令機(jī)器”，你讓它畫(huà)什么就畫(huà)什么，但要讓它“看懂規(guī)則、讀懂場(chǎng)景、舉一反三”，那還真得再進(jìn)化幾輪。

這也讓我想起，AI剛學(xué)會(huì)生成文字那會(huì)兒，大家覺(jué)得它“能寫(xiě)會(huì)說(shuō)”，但一追問(wèn)細(xì)節(jié)、讓它編故事、圓邏輯，還是會(huì)出大大小小的bug。

今天的GPT-4o，在圖片領(lǐng)域面臨的困境，其實(shí)和曾經(jīng)的文本AI如出一轍：

會(huì)畫(huà)，但不一定會(huì)“理解”；能改，但不一定能“精準(zhǔn)”；能聽(tīng)指令，但不一定能“舉一反三”。這也許是我們與“真正理解世界”的AI之間，最值得警惕、也最令人期待的那道坎。

或許，下一次技術(shù)突破，就會(huì)從這里開(kāi)始。但至少現(xiàn)在，我們還沒(méi)到那一步。

via

https://the-decoder.com/gpt-4o-makes-beautiful-images-but-fails-basic-reasoning-tests-ucla-study-finds/

GPU算力按需租用

A100/H100 GPU算力按需租用，

秒級(jí)計(jì)費(fèi)，平均節(jié)省開(kāi)支30%以上！

掃碼了解詳情?

打開(kāi)網(wǎng)易新聞體驗(yàn)更佳

熱搜

熱門跟貼

打開(kāi)APP發(fā)貼

沙雅县| 自贡市| 伊宁市| 精河县| 大英县| 高淳县| 略阳县| 永丰县| 蒲城县| 民县| 陇西县| 岱山县| 吉木乃县| 汉阴县| 嘉义县| 集贤县| 木兰县| 奉新县| 广州市| 秦安县| 呼图壁县| 新和县| 崇州市| 颍上县| 太仆寺旗| 建德市| 民丰县| 梓潼县| 修水县| 丰原市| 韶山市| 瑞安市| 延川县| 梨树县| 吐鲁番市| 阳西县| 温宿县| 锡林浩特市| 恩施市| 拜泉县| 台东县|