
就像李開復老師的說的,Sam Altman 覺又要睡不好了!
事情是這樣的,DeepSeek 悄悄的推出了deepseek v3一個版本更新-v3 0324,沒有做任何宣傳,沒有任何benchmark,直接上傳hugging face,大約700G,還是MIT許可,可以直接部署,或者現(xiàn)在就可以在deepseek官網(wǎng)直接使用(不要開啟思考模式就行)

本來以為這就是一個普通的更新,我沒當回事,結果測試了一下,沒想到這個版本的能力強到離譜,我的直觀體驗是編程能力,尤其是前端表現(xiàn)和Claude 3.7 Sonnet表現(xiàn)不相上下,考慮到deepseek的API的價格,真的非常令人震驚?。?!
以下是實測,全部都是一次運行,未做任何修改
實測1
這是一個我測試各家大模型最新版本最常用的一個題目
提示:幫我制作一個賽朋克貪吃蛇游戲,在單個HTML中運行
這是測試過程
這是測試結果,沒有任何邏輯錯誤,也比較好的實現(xiàn)了賽朋克效果,實現(xiàn)效果比R1和Claude 3.7都要好(R1和Claude 的表現(xiàn)我之前的文章有,貪吃蛇游戲雖然很簡單,但是加上賽朋克三個字很多新模型實現(xiàn)起來邏輯總是有bug,這里就不作對比了)
實測2
這是網(wǎng)友的一個提示詞,我看看是否能復刻
提示:Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions (e.g., a function or a set of buttons) to demonstrate the animations for each.
中文:創(chuàng)建一個包含 CSS 和 JavaScript 的 HTML 文件,生成一張動畫天氣卡片。該卡應以獨特的動畫直觀地表現(xiàn)以下天氣狀況: 風:(如移動的云、搖擺的樹或風線) 雨:(如落下的雨滴、形成的水坑) 太陽:(如閃耀的光芒、明亮的背景) 雪:(如飄落的雪花、積雪) 并排顯示所有天氣卡片。在此單一文件中提供所有 HTML、CSS 和 JavaScript 代碼。JavaScript 應包括在不同天氣條件之間切換的方法(例如,一個函數(shù)或一組按鈕),以演示每種天氣條件的動畫效果
測試過程:
測試結果:完美,完全達到了要求,設計非常精美,細節(jié)滿滿,比如積雪厚度動態(tài)效果,高亮每一種天氣卡片的按鈕,唯一的遺憾是沒能夠并排顯示所有天氣卡片,但是整體的指令遵循能力非常強與Claude 3.7相比有過之而無不及
這是Claude 3.7 Sonnet的測試過程和結果,大家對比一下,Claude 3.7實現(xiàn)缺少了一些細節(jié),也沒有天氣卡片的切換按鈕
我順便也用同樣的提示詞測試了一下R1的表現(xiàn),很明顯沒有v3的新版本好
實測3
這個測試主要是測試模型在極簡提示下實現(xiàn)復雜系統(tǒng)的能力
提示:模擬一個太陽系行星運動,在單個HTML中運行
這是測試過程:
測試結果也是讓我很震驚:比較完美的模擬的太陽系的行星運動,我的提示詞里甚至沒有對宇宙環(huán)境,軌道,行星數(shù)量等的細節(jié)描述,結果他設置了模擬行星運動三種模式:慢速,標準,加速,土星還有土星環(huán),這都是讓我沒有想到的
同樣的提示詞,這是R1的測試過程和結果,相對于V3新版本缺少了很多細節(jié)
時間有限,我只是簡單的測試了一下,沒有系統(tǒng)性,有網(wǎng)友測試v3 0324的數(shù)學能力也很強,大家現(xiàn)在到DeepSeek官網(wǎng)直接就可以測試,純粹個人感受:小更新大進步!這下更加期待DeepSeek V4和R2了
熱門跟貼