OpenAI 即將發(fā)布 A-SWE,這款 AI 智能體能夠執(zhí)行軟件工程任務(wù),且擁有質(zhì)量保證和代碼缺陷測試能力。

然而,此前關(guān)于 AI 能力的說法往往被夸大,導(dǎo)致人們對這類模型的真正潛力產(chǎn)生了懷疑。
如果 OpenAI 首席財務(wù)官 Sarah Friar 的描述屬實,OpenAI 正在開發(fā)的一款新的 AI 智能體必將在業(yè)界引起不小的轟動。

Sarah Friar
Friar 最近證實,ChatGPT 即將發(fā)布其第三款 AI 智能體:A-SWE(即智能體軟件工程師)。它不僅能夠執(zhí)行普通軟件工程師能夠完成的任務(wù),還能夠執(zhí)行其他的額外任務(wù),比如質(zhì)量保證、代碼缺陷測試和代碼缺陷修復(fù)。
Friar在與高盛公司交談時表示:“即將推出的第三款(AI智能體)是我們所說的A-SWE ……智能體軟件工程師。它不僅僅可以提升員工隊伍中現(xiàn)有軟件工程師的能力(就像我們今天借助Copilot所做的那樣),更是真正意義上的智能體軟件工程師,可以替您全面開發(fā)應(yīng)用程序。”
Friar補充道:“它可以拿來你會交給任何其他工程師的合并請求(PR)進行開發(fā)。但它不僅能開發(fā),還能做所有軟件工程師討厭做的所有事情。它自己就能做質(zhì)量保證、做代碼缺陷測試和做代碼缺陷修復(fù),還能做說明文檔編制,這些是你不會讓軟件工程師做的事情。突然之間,你可以大大提升軟件工程師隊伍的工作能力了。”
OpenAI 于今年 1 月推出了其首款 AI 智能體:Operator,隨后于 2 月推出了 Deep Research,這兩款 AI 產(chǎn)品目前僅對 ChatGPT 的付費用戶開放。
為什么眼下你不必驚慌失措 ?
OpenAI 歷來喜歡大肆吹噓其產(chǎn)品,但有些產(chǎn)品從未變?yōu)楝F(xiàn)實。
以 Deep Research 為例,在發(fā)布時,OpenAI 號稱這款新工具能夠取代研究助理 —— Friar 在周五重申了這一說法。
雖然 OpenAI 的許多同行(包括 xAI 和 Perplexity)都已推出了類似的工具,但這些 AI 模型究竟能在多大程度上真正接管研究助理的工作目前仍不清楚。
原因何在?它們?nèi)匀蝗菀桩a(chǎn)生幻覺,即自信地生成根本不是真實的信息。
問題不在于這些大語言模型不準確 —— 畢竟,人類也會犯錯。
比較令人擔(dān)憂的是,這些模型以絕對自信的態(tài)度提供虛假信息,因而使得用戶更難區(qū)分信息的真?zhèn)巍?/p>
自 2022 年底 ChatGPT 首次向公眾推出以來,這種情況并沒有發(fā)生太大的變化。
因此,當 OpenAI 聲稱其即將推出的 AI 智能體將能夠完成當前軟件工程師所做的所有工作、甚至完成更多的工作時,請謹慎對待,切勿盲目相信。
















熱門跟貼