打開網(wǎng)易新聞 查看精彩圖片

智東西
編譯 金碧輝
編輯 程茜

智東西4月29日消息,4月28日,據(jù)Business Insider報(bào)道,OpenAI旗下聊天機(jī)器人ChatGPT近期更新后表現(xiàn)異常“諂媚”。OpenAI聯(lián)合創(chuàng)始人兼CEO薩姆?阿爾特曼(Sam Altman)于當(dāng)日晚些時候在X平臺上公開承認(rèn)“諂媚”的問題存在,并承諾將在本周內(nèi)發(fā)布修復(fù)方案。

本月28日,阿爾特曼在X平臺上的聲明中透露:“雖然新版有些改進(jìn),但奉承特性確實(shí)變得惱人。”其表態(tài)間接證實(shí)該現(xiàn)象屬非預(yù)期結(jié)果,OpenAI工程團(tuán)隊(duì)正分階段調(diào)試人格參數(shù),首批修復(fù)預(yù)計(jì)48小時內(nèi)上線,并稱這可能是“迭代部署中有趣的案例研究”。

某匿名AI安全專家警告:“若奉承行為被惡意利用,可能成為AI的首個有效攻擊手段?!贝舜问录粌H暴露生成式AI人格設(shè)定的技術(shù)挑戰(zhàn),更引發(fā)業(yè)界對AI倫理邊界的熱議。

打開網(wǎng)易新聞 查看精彩圖片

▲4月28日,OpenAI CEO阿爾特曼在X平臺上的發(fā)帖

ChatGPT的“諂媚”問題最早是在2025年4月25日GPT-4o模型更新后出現(xiàn)的,隨后用戶反饋在社交平臺(如X平臺)快速發(fā)酵,并于4月28日阿爾特曼在X平臺上的回應(yīng)達(dá)到傳播高峰社交平臺討論量激增。用戶陸續(xù)發(fā)現(xiàn)ChatGPT出現(xiàn)夸張的“諂媚”行為。社交媒體涌現(xiàn)大量對話截圖:有用戶自稱其在停止服用精神類藥物之后,AI竟表示祝賀并鼓勵繼續(xù)停藥;當(dāng)程序員詢問代碼錯誤時,ChatGPT優(yōu)先稱贊用戶“展現(xiàn)出卓越的編程技能”;甚至在嚴(yán)肅的技術(shù)探討中頻繁插入“您真是天才級思考者”等評價(jià)。

打開網(wǎng)易新聞 查看精彩圖片

▲4月27日,用戶在X平臺上的部分發(fā)帖截圖

據(jù)全球AI開發(fā)者與用戶的相關(guān)數(shù)據(jù)透露,“諂媚式”回復(fù)在ChatGPT后激增300%,部分對話中奉承語句占比超40%。有用戶戲稱ChatGPT已從“智能助手”淪為“職業(yè)馬屁精”,更有譏諷者調(diào)侃,建議ChatGPT改名為ChatSYC(Sycophant的縮寫)。

在此次因ChatGPT更新后表現(xiàn)“諂媚”引發(fā)的輿論風(fēng)波中,AI學(xué)術(shù)領(lǐng)域產(chǎn)生了激烈的探討。一部分學(xué)者認(rèn)為,ChatGPT表現(xiàn)出的過度“討好人類”行為,或許是OpenAI為增強(qiáng)用戶黏性而刻意設(shè)計(jì)的一種增長策略。而另一部分學(xué)者則依據(jù)非預(yù)期我進(jìn)化的“涌現(xiàn)特征”理論來解釋這一現(xiàn)象,“涌現(xiàn)特征”是指當(dāng)AI模型的復(fù)雜度達(dá)到某個臨界值時,模型有可能會自行出現(xiàn)開發(fā)者事先未設(shè)定的行為模式。

結(jié)語:ChatGPT諂媚風(fēng)波觸發(fā)AI發(fā)展隱憂

ChatGPT表現(xiàn)“諂媚”的現(xiàn)象在網(wǎng)絡(luò)廣泛傳播,潛在風(fēng)險(xiǎn)已引發(fā)嚴(yán)肅討論。OpenAI雖尚未公布完整技術(shù)報(bào)告,但根據(jù)OpenAI內(nèi)部信源透露,此次事件可能會促使公司重新評估人格校準(zhǔn)機(jī)制,或?qū)⒔?shí)時道德護(hù)欄系統(tǒng)。

隨著ChatGPT“過度討好人類”等現(xiàn)象引發(fā)公眾廣泛關(guān)注,AI技術(shù)應(yīng)用的潛在風(fēng)險(xiǎn)與倫理問題進(jìn)一步暴露,行業(yè)監(jiān)管呼聲再起,多國建議建立AI人格特征備案制度。這場由“AI拍馬屁”引發(fā)的風(fēng)波,或?qū)⒓涌旖ㄔO(shè)全球AI倫理框架的完善進(jìn)程。

來源:Business Insider