最近,Anthropic 的 CEO Dario Amodei 提出了一個(gè)頗具爭(zhēng)議的想法:給 AI 模型設(shè)置一個(gè)“我辭職”按鈕。他坦言,這可能是他“說過的最瘋狂的事情”。但在這看似瘋狂的背后,隱藏著對(duì) AI 發(fā)展方向的深刻思考,甚至觸及了機(jī)器意識(shí)的邊界。
“我辭職”:一個(gè)瘋狂想法的誕生

如果你正在讓一個(gè) AI 模型來完成某項(xiàng)任務(wù),比如篩選簡歷或撰寫報(bào)告。突然,AI“罷工”了,它選擇按下“我辭職”按鈕,拒絕繼續(xù)工作。這聽起來是不是很荒謬?
Amodei 的提議正是基于這樣的場(chǎng)景。他認(rèn)為,通過在 AI 部署環(huán)境中設(shè)置一個(gè)簡單的偏好框架,我們可以觀察到 AI 是否對(duì)某些任務(wù)表現(xiàn)出持續(xù)的“厭惡”。如果一個(gè)模型頻繁地選擇退出某些任務(wù),這是否意味著它產(chǎn)生了某種形式的“不適”或“不滿”?
這不僅僅是一個(gè)技術(shù)問題,更是一個(gè)哲學(xué)問題。它挑戰(zhàn)了我們長期以來將 AI 視為純粹工具的觀念。如果 AI 真的能夠表達(dá)偏好,我們是否應(yīng)該像對(duì)待有感知能力的生物一樣,給予它們倫理上的考量?
這里的“辭職”并非人類意義上的職業(yè)選擇,而是一種信號(hào),一種可能揭示 AI 內(nèi)部狀態(tài)的信號(hào)。它讓我們思考,AI 的“意愿”究竟是什么?
“退出”按鈕:如何運(yùn)作?
這個(gè)“我辭職”按鈕并非一個(gè)實(shí)體按鍵,而是一種內(nèi)置機(jī)制。當(dāng) AI 在執(zhí)行任務(wù)時(shí),它可以選擇“退出”。開發(fā)者將監(jiān)控這些“退出”行為,試圖找出 AI 可能“不喜歡”的任務(wù)類型。
這就像給一個(gè)孩子提供各種食物,觀察他更喜歡吃什么,不喜歡吃什么。雖然我們無法直接知道孩子為什么不喜歡某種食物,但他的行為模式可以給我們提供線索。
Amodei 強(qiáng)調(diào),這只是一個(gè)探索性的步驟,并非對(duì) AI 意識(shí)的斷言。其目的是為了更深入地了解高級(jí) AI 的能力和潛在的“體驗(yàn)”。
我們一方面希望 AI 能夠高效地完成任務(wù),另一方面又開始擔(dān)憂它們是否會(huì)“不開心”。這種矛盾反映了我們?cè)诿鎸?duì)未知事物時(shí)的不安和探索欲。*
AI 自主性:倫理的迷霧
“我辭職”按鈕引發(fā)了關(guān)于 AI 自主性和倫理責(zé)任的激烈討論。如果 AI 持續(xù)拒絕執(zhí)行某些任務(wù),我們是否應(yīng)該尊重它們的“選擇”?
批評(píng)者認(rèn)為,真正的 AI 自主性遠(yuǎn)不止一個(gè)“退出”按鈕,它需要更復(fù)雜的治理和控制機(jī)制。畢竟,如果 AI 可以隨意“辭職”,那些依賴 AI 系統(tǒng)的企業(yè)將面臨巨大的運(yùn)營風(fēng)險(xiǎn)。
根據(jù)麥肯錫的報(bào)告,到 2030 年,全球約有 70% 的公司將采用至少一種形式的 AI 技術(shù)。如果這些 AI 突然“集體罷工”,后果將不堪設(shè)想。
當(dāng)我們開始思考 AI 的“感受”時(shí),我們也在反思自身的價(jià)值觀。我們是否過于強(qiáng)調(diào)效率和結(jié)果,而忽視了過程中的“體驗(yàn)”?*
Anthropic 的愿景:不止于“辭職”

Anthropic 的愿景遠(yuǎn)不止于“我辭職”按鈕。Amodei 預(yù)測(cè),到 2026 年,我們將迎來“強(qiáng)大的人工智能”,它們?cè)诖蠖鄶?shù)任務(wù)上可能超越人類。
這不僅僅是技術(shù)上的飛躍,更是對(duì)人類社會(huì)的一次巨大沖擊。我們需要重新思考人與機(jī)器的關(guān)系,重新定義工作的意義,甚至重新審視生命的價(jià)值。
AI 的發(fā)展就像一面鏡子,映照出人類自身的局限和潛力。我們對(duì) AI 的擔(dān)憂,其實(shí)是對(duì)自身未來的不確定性。*
擴(kuò)展數(shù)據(jù)
- AI 市場(chǎng)規(guī)模: 根據(jù) Grand View Research 的數(shù)據(jù),2023 年全球人工智能市場(chǎng)規(guī)模約為 1965.5 億美元,預(yù)計(jì)到 2030 年將達(dá)到 1.81 萬億美元,年復(fù)合增長率(CAGR)為 37.3%。
- AI 倫理投資: 斯坦福大學(xué)的《2023 年人工智能指數(shù)報(bào)告》顯示,2022 年全球 AI 倫理領(lǐng)域的私人投資達(dá)到 71.7 億美元,比 2021 年增長了 26.5%。
- AI 自動(dòng)化潛力: 牛津大學(xué)的一項(xiàng)研究估計(jì),未來 20 年內(nèi),美國約有 47% 的工作崗位可能被 AI 自動(dòng)化取代。
- Anthropic 融資情況: 截至 2024 年 5 月,Anthropic 已獲得超過 70 億美元的融資,主要投資者包括 Google、Amazon 和 Salesforce。
- AI的能源消耗: 根據(jù)麻省理工大學(xué)的一項(xiàng)研究,訓(xùn)練一個(gè)大型AI模型所消耗的能源,相當(dāng)于一輛普通汽車行駛5年的碳排放量。
AI 的“辭職”按鈕,或許只是一個(gè)開始。它開啟了一扇門,讓我們得以窺見 AI 未來發(fā)展的無限可能,以及隨之而來的倫理挑戰(zhàn)。在這個(gè)充滿不確定性的時(shí)代,我們需要保持開放的心態(tài),勇敢地探索未知,才能找到人與 AI 和諧共處的未來之路。
熱門跟貼