大家好,我是微笑哥。

寫這篇文章還有點(diǎn)小激動,你說我國牛逼的大廠那么多,但是 AI 大模型的發(fā)展現(xiàn)在完全要依賴 DeepSeek 這家小公司。

之前是大模型遠(yuǎn)遠(yuǎn)的差國外一線一大截,后來 DeepSeek V3、R1發(fā)布之后,我們幾乎和國外打平手了。

然后各個(gè)大廠馬上復(fù)制 DeepSeek 的能力,全中國的互聯(lián)網(wǎng)產(chǎn)品的 AI 能力,突然集體飆升到世界一線。

要說有點(diǎn)缺陷,那就是編程能力了。

像之前大家都喜歡用 Cursor,因?yàn)樗澈蠼恿撕芏鄬?a class="keyword-search" >編程能力支持很強(qiáng)的大模型,比如 Claude3.5、3.7。

國內(nèi)雖然有 Trae 這樣的產(chǎn)品,但是由于這些大模型都是國外產(chǎn)品,法律法規(guī)上不允許國內(nèi)使用。

這就導(dǎo)致國內(nèi)的 AI 編程發(fā)展,和國外確實(shí)還差了一大截子!但是現(xiàn)在這個(gè)情況,又有所突破了。

打開網(wǎng)易新聞 查看精彩圖片

原因就是 DeepSeek V3 昨天又發(fā)布了一個(gè)小版本,使得 DeepSeek V3 編程能力大幅度提升,超過 R1。

在 KCORES大模型競技場中,Claude-3.7-Sonnet-Thinking無疑是LLM當(dāng)之無愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,僅次于Claude 3.5 Sonnet。

打開網(wǎng)易新聞 查看精彩圖片

實(shí)際測試中,用戶僅用單一提示詞即可生成包含HTML/CSS/JS的完整登錄頁面,代碼量超800行且無錯誤,展示了與Claude 3.7相當(dāng)?shù)纳少|(zhì)量。

用戶按照下面的提示詞,同時(shí)對新版 V3 與 R1 下達(dá)任務(wù),實(shí)際產(chǎn)出的效果已經(jīng)出現(xiàn)巨大差異。

創(chuàng)建一個(gè)包含 CSS 和 JavaScript 的單個(gè) HTML 文件,以生成一個(gè)動畫天氣卡片??ㄆ瑧?yīng)通過不同的動畫直觀地表示以下天氣條件:風(fēng):(例如,移動的云朵、搖曳的樹木或風(fēng)線)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,閃耀的光線、明亮的背景)雪:(例如,落下的雪花、積雪)并排顯示所有天氣卡片??ㄆ瑧?yīng)具有深色背景。在此單個(gè)文件中提供所有 HTML、CSS 和 JavaScript 代碼。JavaScript 應(yīng)包含一種在不同天氣條件之間切換的方法(例如,一個(gè)函數(shù)或一組按鈕),以演示每種天氣的動畫。

上面這個(gè)是是 DeepSeek 新版 V3 模型的生成結(jié)果,下面第二圖片是 R1 的生成結(jié)果。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

除了對比 R1 ,用戶還用類似的提示詞,對比了 Claude 系列。

Claude 3.7 作為目前號稱「編程能力最強(qiáng)模型」,實(shí)際編程能力使用體驗(yàn)也是多次被評為「已經(jīng)達(dá)到專家級程序員水準(zhǔn)」。

同一提示詞給到 Claude 3.5/3.7 后,模型生成的前端內(nèi)容如下所示:

打開網(wǎng)易新聞 查看精彩圖片

根據(jù)更多用戶的反饋,普遍結(jié)論是最新版本的 V3 編程能力已經(jīng)接近c(diǎn)laude3.7 。

最關(guān)鍵的是 Caude 死貴還難用,DeepSeek 是一款開源的大模型,在編程能力就如此突出。

然后再做一個(gè)網(wǎng)站搭建的測試,我 DeepSeek V3 的老版本和新版本,發(fā)這樣一句要求:

做一個(gè)精美的官網(wǎng)落地頁,內(nèi)容是介紹 AI 俱樂部。

原來的 V3 版本輸出的網(wǎng)頁就是這樣,就一個(gè)頁面,很簡單的展示幾個(gè)信息而已,像初學(xué)的程序員。

打開網(wǎng)易新聞 查看精彩圖片

再來看看最新版本的 V3,同樣是輸出上面給出的命令,看看它能給我生成一個(gè)什么樣的官網(wǎng)。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

都叫 V3 版本,但是差距巨大。

最新版本的 V3,輸出的網(wǎng)頁至少可以達(dá)到正常的審美要求,各種需要的元素也都包含在其中。

再來給 V3 上一個(gè)難度,再給他一句提示詞:

幫我生成一個(gè)在線html的番茄時(shí)鐘。

打開網(wǎng)易新聞 查看精彩圖片

生成的頁面如上,功能都可以設(shè)置和使用。

測試完成之后,我就有一個(gè)強(qiáng)烈的感慨,這還不是中國國運(yùn)嗎?DeepSeek 以一己之力拉平國內(nèi)AI編程水平。

如果沒有 DeepSeek 這家公司,國內(nèi)的 AI 發(fā)展確實(shí)對比美國還差點(diǎn)意思,現(xiàn)在來看基本上拉平了。

最最重要的是,國外這些優(yōu)秀的大模型,都是商業(yè)閉源,我們用的時(shí)候還要付費(fèi)。

付費(fèi)也不說了,關(guān)鍵還動不動響應(yīng)慢、甚至使用的稍微不規(guī)范,還給你封號了。

DeepSeek 完全開源,直接在官網(wǎng)上就可以免費(fèi)使用。

它不但普惠的是中國用戶,是全世界的用戶都可以免費(fèi)利用 DeepSeek 的能力,拉平他們的 AI 差距。

另外,還有一個(gè)好消息。

按照 DeepSeek 這家公司的調(diào)性,據(jù)說很快 R2 就要發(fā)布了,到時(shí)候還不知道能給大家?guī)矶啻蟮捏@喜。

保持期待吧。

打開網(wǎng)易新聞 查看精彩圖片

以上,既然看到這里了,如果覺得不錯,隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見。


(本公眾號接收讀者有償投稿,內(nèi)容AI方向的硬核測評,感興趣請聯(lián)系我助理微信:
xiaxia5480


PS:

推薦大家加入我的 AI 星球,已經(jīng)1.1萬朋友加入,全年更新 100+ AI實(shí)戰(zhàn)落地案例,4-6訓(xùn)練營實(shí)戰(zhàn)。

未來一定是 AI 的未來,很感慨 AI 的每一天都在瘋狂發(fā)展,為了方便和讀者交流和分享 AI 信息。

我還創(chuàng)建了一個(gè) AIGC 交流群,方便分享關(guān)于最新情報(bào)和商業(yè)機(jī)會,每天限額 100 人加入。

如果感興趣,現(xiàn)在請加我微信回復(fù):666,微信通過后會拉你入群!