打開網(wǎng)易新聞 查看精彩圖片

OpenAI 即將發(fā)布 A-SWE,這款 AI 智能體能夠執(zhí)行軟件工程任務(wù),且擁有質(zhì)量保證和代碼缺陷測試能力。

打開網(wǎng)易新聞 查看精彩圖片

然而,此前關(guān)于 AI 能力的說法往往被夸大,導(dǎo)致人們對這類模型的真正潛力產(chǎn)生了懷疑。

如果 OpenAI 首席財務(wù)官 Sarah Friar 的描述屬實,OpenAI 正在開發(fā)的一款新的 AI 智能體必將在業(yè)界引起不小的轟動。

打開網(wǎng)易新聞 查看精彩圖片

Sarah Friar

Friar 最近證實,ChatGPT 即將發(fā)布其第三款 AI 智能體:A-SWE(即智能體軟件工程師)。它不僅能夠執(zhí)行普通軟件工程師能夠完成的任務(wù),還能夠執(zhí)行其他的額外任務(wù),比如質(zhì)量保證、代碼缺陷測試和代碼缺陷修復(fù)。

Friar在與高盛公司談時表示:即將推出的第三款(AI智能體)是我們所說的A-SWE ……智能體軟件工程師。不僅僅可以提升員工隊伍中現(xiàn)有軟件工程師的能力(就像我們今天借助Copilot所做的那樣),是真正意義上的智能體軟件工程師,可以全面開發(fā)應(yīng)用程序。

Friar補充道:“它可以拿來交給任何其他工程師的合并請求(PR)進行開發(fā)。但它不僅能開發(fā),還能做所有軟件工程師討厭做的所有事情。它自己就能質(zhì)量保證做代碼缺陷測試做代碼缺陷修復(fù),還能做說明文檔編制,這些是你不會讓軟件工程師做的事情。突然之間,你可以大大提升軟件工程師隊伍的工作能力了。

OpenAI 于今年 1 月推出了其首款 AI 智能體:Operator,隨后于 2 月推出了 Deep Research,這兩款 AI 產(chǎn)品目前僅對 ChatGPT 的付費用戶開放。

為什么眼下你不必驚慌失措 ?

OpenAI 歷來喜歡大肆吹噓其產(chǎn)品,但有些產(chǎn)品從未變?yōu)楝F(xiàn)實。

以 Deep Research 為例,在發(fā)布時,OpenAI 號稱這款新工具能夠取代研究助理 —— Friar 在周五重申了這一說法。

雖然 OpenAI 的許多同行(包括 xAI 和 Perplexity)都已推出了類似的工具,但這些 AI 模型究竟能在多大程度上真正接管研究助理的工作目前仍不清楚。

原因何在?它們?nèi)匀蝗菀桩a(chǎn)生幻覺,即自信地生成根本不是真實的信息。

問題不在于這些大語言模型不準確 —— 畢竟,人類也會犯錯。

比較令人擔(dān)憂的是,這些模型以絕對自信的態(tài)度提供虛假信息,因而使得用戶更難區(qū)分信息的真?zhèn)巍?/p>

自 2022 年底 ChatGPT 首次向公眾推出以來,這種情況并沒有發(fā)生太大的變化。

因此,當 OpenAI 聲稱其即將推出的 AI 智能體將能夠完成當前軟件工程師所做的所有工作、甚至完成更多的工作時,請謹慎對待,切勿盲目相信。

打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片