終于有人說實話了!OpenAI的研究人員發(fā)現(xiàn),即使是頂級大模型,也根本不能替代程序員!到底怎么回事呢?原來,OpenAI聯(lián)合了上百名工程師開展了一項叫作SWE-Lancer的基準測試,并開出了100萬美元賞金,從Upwork精選了1488個真實開發(fā)任務,最后表現(xiàn)最好的Claude 3.5 Sonne也只賺了20.8萬美元, OpenAI自家模型在內(nèi)的o1和GPT-4o也只排在了第二位和第三位。對此,研究人員還特別指出:即使是這樣,模型給出的解決方案大多數(shù)都是錯誤的,可靠性還需要進一步提高!

打開網(wǎng)易新聞 查看精彩圖片

對此,對于像我這樣的程序員來講,我終于可以脫口說出那句我憋了很久的話:“三年!你知道我這三年是怎么過的嗎?”

2022年11月,從GPT3.0發(fā)布之日起,AI會替代程序員這個言論就一直旋繞在包括我在內(nèi)的所有程序員耳邊,我曾經(jīng)無數(shù)次跟我身邊的人解釋,目前的AI想要替代程序員很難,甚至于我曾經(jīng)公開發(fā)表過看法,表示AI想要在10年內(nèi)替代程序員的可能性都不高。

但是,不管你怎么說,總是會有很多營銷號,大部分還都是程序員,他們只要一有機會,就會鼓吹AI要替代程序員這個事情,只要一有新的模型出現(xiàn),就會有人想去薅一波程序員的流量。

這導致的后果就是前端程序員出現(xiàn)大量失業(yè)的情況,Java這個巨大的程序員群體萎靡不振,雖然我作為C#程序員影響較小,但時不時還會有同事指著他使用大模型問出來的答案告訴我:程序員危矣!

直至我在編寫這篇文章之前,我的一位非程序員的同事還拿著從DeepSeek那問出來的編程答案告訴我:“太強大了!程序員這行不能干了!”

我一個白眼跟他說:“來,你自己運行一下看看!”

結(jié)果他回答我:“不會?。〉悄憔驼fDeepSeek給的答案對不對吧!”

我一看DeepSeek給出的代碼,回答道:“答案是對的,但有什么意義?這些答案不管是從百度還是從書里,都能找到正確答案,但是,這個答案如果我不告訴你它是對的,你會怎么樣?”

同事不語,于是我告訴他:“也就兩種結(jié)果,第一種就是它是對的,然后花了大量時間去研究怎么部署,但實際上,這個工作交給程序員,可能就是復制粘貼的事情,第二種,他是錯的,那么你不光會耗費大量時間去驗證它,最后還被這個答案搞得一頭霧水!”

我又跟同事說,這只是一方面,另一方面,他問的只是一個小的模塊,一個普通的程序,它是由很多模塊組成的,最基本的就包括前端、后端,而前端模塊又分很多頁面,后端模塊又分很多服務,這是需要“承上啟下”的,有些東西雖然能問出結(jié)果,但你不一定有能力把他們拼湊起來。

我始終覺得,AI只是程序員的輔助開發(fā)工具,因為AI給出的結(jié)果的不確定性,因此需要有人來判定它是否正確,所以,就目前的情況來看,用AI替代程序員,幾乎是不可能的事情。但未來的不確定性太多了,AI水平發(fā)展到一定程度也不無可能,但我還是那么認為,10年內(nèi),AI不會替代程序員!

此時,我估計有人會說了:上面不是說了么,那個叫Claude 3.5 Sonne的模型不是還賺了20.8萬美元嘛,至少這個就能充分說明,AI會替代一部分程序員!

這個不假,現(xiàn)在很多AI的所謂編程水平的確已經(jīng)超越了一些水平一般的程序員,但是,如果Claude 3.5 Sonne在無人干涉的情況下,我覺得它一分錢也掙不到!因為這里面有一個很重要的BUG!那就是它既然超越的是一些水平一般的程序員,可高水平的程序員又是如何提升起來的呢?

因此,這樣“既要又要”的超越?jīng)]有意義!

當然,不可否認,很多公司就是“既要又要”,那么如果這樣的話,勢必會增加大齡程序員的競爭力。

結(jié)語很短

所以,我認為現(xiàn)在AI能做到的,只是篩選程序員,而不是替代程序員!