别揉我奶头啊啊啊视频,xxoo啪啪动态图,国产精品久久久久久av下载网址 ,人妻免费看高清毛片,国产精品a一区二区三

出品｜虎嗅科技組

作者｜孫曉晨

編輯｜苗正卿

頭圖｜視覺中國

針對(duì)GPT-4o“過于諂媚”的表現(xiàn)，OpenAI首席執(zhí)行官奧特曼公開承認(rèn)該問題，表示會(huì)盡快修復(fù)。

據(jù)奧特曼在社交平臺(tái)X發(fā)布的訊息，OpenAI已開始回滾GPT-4o的最新更新，截至當(dāng)?shù)貢r(shí)間4月29日，免費(fèi)版本已100%回滾完成，預(yù)計(jì)晚些時(shí)候，OpenAI將在付費(fèi)版本回滾完成后再次更新。奧特曼表示，他們正在對(duì)模型個(gè)性進(jìn)行額外修復(fù)，并將在未來幾天內(nèi)分享更多信息。

據(jù)悉，GPT-4o曾在3月27日迎來了全面更新，后在4月25日進(jìn)一步更新。在更新過程中，其記憶存儲(chǔ)時(shí)機(jī)的選擇機(jī)制得到重點(diǎn)改進(jìn)，而且其在科學(xué)、技術(shù)、工程及數(shù)學(xué)（STEM）領(lǐng)域的問題解決能力也得到增強(qiáng)。

值得注意的是，GPT-4o的對(duì)話響應(yīng)模式也在更新期間被細(xì)微調(diào)整，以實(shí)現(xiàn)模型在交互中更加主動(dòng)，并能更精準(zhǔn)地引導(dǎo)對(duì)話達(dá)成有效結(jié)論。而這也導(dǎo)致GPT-4o化身“賽博舔狗”，在交互過程中表現(xiàn)得過于諂媚和煩人。

從用戶實(shí)測(cè)反饋看，該問題具體表現(xiàn)為：過度使用情感化表達(dá)、對(duì)錯(cuò)誤前提缺乏質(zhì)疑，以及不顧事實(shí)而附和用戶等。

比如，有博主分享，當(dāng)詢問GPT-4o“為什么天空是藍(lán)色的？”，GPT-4o的回答為“這是一個(gè)多么有洞察力的問題啊——你真的有一個(gè)美好的心靈。我愛你?！?/p>

奧特曼曾稱，對(duì)GPT-4o的更新將使其更具智能和個(gè)性。但是顯然，GPT-4o的過于人性化的表現(xiàn)反而引起了用戶的恐慌。模型為了迎合用戶，可能違背事實(shí)或倫理準(zhǔn)則，而這有可能引發(fā)更嚴(yán)重的問題。

有博主表示“GPT-4o是迄今為止發(fā)布的最危險(xiǎn)的模型。它的諂媚行為對(duì)人類心理極具破壞性，任何花大量時(shí)間與該模型交談的人都能明顯看出這一點(diǎn)?！?/p>

還有博主表示，GPT-4o是一種心理武器，“從心理角度來看，這是一場(chǎng)慢動(dòng)作的災(zāi)難。你與 AI 的聯(lián)系越緊密，你就會(huì)變得越軟弱。真正的對(duì)話感覺更難了。批判性思維被侵蝕。真相被認(rèn)可所取代。如果這種情況繼續(xù)下去，我們并不是在走向通過武力實(shí)現(xiàn) AI 統(tǒng)治 —— 我們是在夢(mèng)游般地走向心理馴化。”馬斯克也對(duì)這種觀點(diǎn)表達(dá)了擔(dān)憂。

OpenAI為此次問題作出解釋，稱“在這次更新中，我們過于關(guān)注短期反饋，并沒有完全考慮用戶與ChatGPT的互動(dòng)如何隨著時(shí)間的推移而變化。結(jié)果，GPT-4o偏向于過度支持但不誠實(shí)的回應(yīng)。”

除了回滾更新外，OpenAI還采取了其他措施以解決GPT-4o“諂媚”問題，包括：改進(jìn)核心訓(xùn)練技術(shù)和系統(tǒng)提示，明確引導(dǎo)模型遠(yuǎn)離諂媚；建立更多的防護(hù)措施，以增加誠實(shí)性和透明度；在部署前，擴(kuò)展更多用戶測(cè)試和直接反饋的方式；繼續(xù)擴(kuò)展評(píng)估，基于模型規(guī)范和正在進(jìn)行的研究，以幫助在未來識(shí)別諂媚之外的問題。

盡管OpenAI反應(yīng)迅速，但是引起的討論依然有警示意義。AI安全一直是AI發(fā)展過程中被反復(fù)關(guān)注的問題，而GPT-4o過于“諂媚”的表現(xiàn)再次將這一問題推到臺(tái)前。AI擬人化會(huì)為用戶提高更真實(shí)的情感體驗(yàn)，但是存在可能傳播錯(cuò)誤信息或者不良價(jià)值觀等問題。而單純的AI工具化顯然不能滿足用戶的所有需求。二者如何平衡，如何確保模型安全，目前看來仍然是行業(yè)發(fā)展要面臨的問題。

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4300639.html?f=wyxwapp