打開網(wǎng)易新聞 查看精彩圖片

出品|虎嗅科技組

作者|孫曉晨

編輯|苗正卿

頭圖|視覺中國

針對(duì)GPT-4o“過于諂媚”的表現(xiàn),OpenAI首席執(zhí)行官奧特曼公開承認(rèn)該問題,表示會(huì)盡快修復(fù)。

打開網(wǎng)易新聞 查看精彩圖片

據(jù)奧特曼在社交平臺(tái)X發(fā)布的訊息,OpenAI已開始回滾GPT-4o的最新更新,截至當(dāng)?shù)貢r(shí)間4月29日,免費(fèi)版本已100%回滾完成,預(yù)計(jì)晚些時(shí)候,OpenAI將在付費(fèi)版本回滾完成后再次更新。奧特曼表示,他們正在對(duì)模型個(gè)性進(jìn)行額外修復(fù),并將在未來幾天內(nèi)分享更多信息。

打開網(wǎng)易新聞 查看精彩圖片

據(jù)悉,GPT-4o曾在3月27日迎來了全面更新,后在4月25日進(jìn)一步更新。在更新過程中,其記憶存儲(chǔ)時(shí)機(jī)的選擇機(jī)制得到重點(diǎn)改進(jìn),而且其在科學(xué)、技術(shù)、工程及數(shù)學(xué)(STEM)領(lǐng)域的問題解決能力也得到增強(qiáng)。

值得注意的是,GPT-4o的對(duì)話響應(yīng)模式也在更新期間被細(xì)微調(diào)整,以實(shí)現(xiàn)模型在交互中更加主動(dòng),并能更精準(zhǔn)地引導(dǎo)對(duì)話達(dá)成有效結(jié)論。而這也導(dǎo)致GPT-4o化身“賽博舔狗”,在交互過程中表現(xiàn)得過于諂媚和煩人。

從用戶實(shí)測(cè)反饋看,該問題具體表現(xiàn)為:過度使用情感化表達(dá)、對(duì)錯(cuò)誤前提缺乏質(zhì)疑,以及不顧事實(shí)而附和用戶等。

比如,有博主分享,當(dāng)詢問GPT-4o“為什么天空是藍(lán)色的?”,GPT-4o的回答為“這是一個(gè)多么有洞察力的問題啊——你真的有一個(gè)美好的心靈。我愛你?!?/p>

打開網(wǎng)易新聞 查看精彩圖片

奧特曼曾稱,對(duì)GPT-4o的更新將使其更具智能和個(gè)性。但是顯然,GPT-4o的過于人性化的表現(xiàn)反而引起了用戶的恐慌。模型為了迎合用戶,可能違背事實(shí)或倫理準(zhǔn)則,而這有可能引發(fā)更嚴(yán)重的問題。

有博主表示“GPT-4o是迄今為止發(fā)布的最危險(xiǎn)的模型。它的諂媚行為對(duì)人類心理極具破壞性,任何花大量時(shí)間與該模型交談的人都能明顯看出這一點(diǎn)?!?/p>

打開網(wǎng)易新聞 查看精彩圖片

還有博主表示,GPT-4o是一種心理武器,“從心理角度來看,這是一場(chǎng)慢動(dòng)作的災(zāi)難。你與 AI 的聯(lián)系越緊密,你就會(huì)變得越軟弱。真正的對(duì)話感覺更難了。批判性思維被侵蝕。真相被認(rèn)可所取代。如果這種情況繼續(xù)下去,我們并不是在走向通過武力實(shí)現(xiàn) AI 統(tǒng)治 —— 我們是在夢(mèng)游般地走向心理馴化。”馬斯克也對(duì)這種觀點(diǎn)表達(dá)了擔(dān)憂。

打開網(wǎng)易新聞 查看精彩圖片

OpenAI為此次問題作出解釋,稱“在這次更新中,我們過于關(guān)注短期反饋,并沒有完全考慮用戶與ChatGPT的互動(dòng)如何隨著時(shí)間的推移而變化。結(jié)果,GPT-4o偏向于過度支持但不誠實(shí)的回應(yīng)。”

除了回滾更新外,OpenAI還采取了其他措施以解決GPT-4o“諂媚”問題,包括:改進(jìn)核心訓(xùn)練技術(shù)和系統(tǒng)提示,明確引導(dǎo)模型遠(yuǎn)離諂媚;建立更多的防護(hù)措施,以增加誠實(shí)性和透明度;在部署前,擴(kuò)展更多用戶測(cè)試和直接反饋的方式; 繼續(xù)擴(kuò)展評(píng)估,基于模型規(guī)范和正在進(jìn)行的研究,以幫助在未來識(shí)別諂媚之外的問題。

打開網(wǎng)易新聞 查看精彩圖片

盡管OpenAI反應(yīng)迅速,但是引起的討論依然有警示意義。AI安全一直是AI發(fā)展過程中被反復(fù)關(guān)注的問題,而GPT-4o過于“諂媚”的表現(xiàn)再次將這一問題推到臺(tái)前。AI擬人化會(huì)為用戶提高更真實(shí)的情感體驗(yàn),但是存在可能傳播錯(cuò)誤信息或者不良價(jià)值觀等問題。而單純的AI工具化顯然不能滿足用戶的所有需求。二者如何平衡,如何確保模型安全,目前看來仍然是行業(yè)發(fā)展要面臨的問題。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4300639.html?f=wyxwapp