近日,谷歌旗下DeepMind實驗室發(fā)布了一份長達145頁的人工智能安全報告,預測具備人類智能水平的通用人工智能(AGI)可能在2030年左右問世,并可能“永久毀滅人類”。

在報告中研究人員指出,AGI可能帶來導致人類永久滅絕的生存風險,他們強調(diào),這一重要議題無法由DeepMind一家公司單方面解決,而應由整個社會共同參與討論。

報告并未具體說明AGI將如何導致人類滅絕,主要篇幅集中在風險防控措施上。

報告將AGI帶來的風險分為四個主要類別:

濫用風險(人類故意利用AI實施危害行為)、錯位風險(系統(tǒng)發(fā)展出非預期的有害行為)、失誤風險(因設計或訓練缺陷導致的意外故障)和結(jié)構(gòu)性風險(不同主體之間的利益沖突)。

研究人員還概述了DeepMind的風險緩解策略,重點在于防止濫用,并強調(diào)了盡早識別危險能力的重要性。

這篇論文還對Anthropic和OpenAI等競爭對手的安全策略表達了含蓄批評。

打開網(wǎng)易新聞 查看精彩圖片

報告認為,Anthropic在嚴格訓練和監(jiān)督方面投入不足,而OpenAI則過度關(guān)注所謂的對齊研究(即確保AI系統(tǒng)的目標和行為與人類的價值觀和利益保持一致)。

(杭州日報)