一、結論&建議
這兩天DeepSeek又發(fā)布了一個編程能力更強的V3模型,自媒體圈肯定是又被各種震驚。估計大家也是不可避免的都關注到了,所以我這里給大家提供一些更真實的結論和建議。
1、實測下DeepSeek V3-0324相比此前的版本確實在前端設計能力上取得了很大的進步,設計審美和生成長代碼的能力都增強了許多;
2、整體編程能力大致在Claude 3.5到Claude 3.7之間
3、目前Cursor中的DeepSeek V3還不是最新版本,但預計很快會接入,不需要花很多時間整自己的API接入方式,價值不大
4、現(xiàn)在使用DeepSeek V3-0324最方便的方式就是DeepSeek官網(wǎng),可以在一些簡單的,只需要少數(shù)幾個代碼文件的任務場景下使用,比如生成app原型,生成簡單的html網(wǎng)頁等。
二、DeepSeek V3-0324模型跑分
按DeepSeek官方發(fā)布的說法是:
新版 V3 模型借鑒 DeepSeek-R1 模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現(xiàn)水平,在數(shù)學、代碼類相關評測集上取得了超過 GPT-4.5 的得分成績。
可以看出從跑分來說,DeepSeek V3-0324確實開始明顯領先了,甚至在評估代碼能力的LiveCodeBench上超過了Claude 3.7,不過我在之前的文章中:https://t.zsxq.com/Jpher 就和大家提過,現(xiàn)實世界軟件工程要解決的問題和編程競賽類的跑分是不同的,我們真正該關注的兩個評測集其實是SWE-Lancer和SWE-Bench Verified,只有這兩個集合的評估才真正代表模型的編程能力??上н@次V3的發(fā)布沒有這個數(shù)據(jù)。
三、實際的測試
這兩天DeepSeek的編程能力測試很多,有一個小球在六邊形里滾動的,那個其實價值一般,還是讓模型解決難題。我覺得更有價值的還是讓模型能前端頁面和完成后端的開發(fā)。所以我還是拿了之前嘗試過對模型能力要求比較高的app原型測試的提示詞,并做了些調(diào)整,去要求deepseek一次性生成全部html代碼。
我想開發(fā)一個類似拼多多的電商平臺app,現(xiàn)在需要輸出高保真的原型圖,請通過以下方式幫我完成所有界面的原型設計,并確保這些原型界面可以直接用于開發(fā):
1、用戶體驗分析:先分析這個 App 的主要功能和用戶需求,確定核心交互邏輯。
2、產(chǎn)品界面規(guī)劃:作為產(chǎn)品經(jīng)理,定義關鍵界面,確保信息架構合理。
3、高保真 UI 設計:作為 UI 設計師,設計貼近真實 iOS/Android 設計規(guī)范的界面,使用現(xiàn)代化的 UI 元素,使其具有良好的視覺體驗。
4、HTML 原型實現(xiàn):使用 HTML + Tailwind CSS(或 Bootstrap)生成所有原型界面,并使用 FontAwesome(或其他開源 UI 組件)讓界面更加精美、接近真實的 App 設計。
拆分代碼文件,保持結構清晰:
5、將所有頁面直接平鋪展示在 index 頁面中,而不是跳轉鏈接。
- 真實感增強:
- 界面尺寸應模擬 iPhone 15 Pro,并讓界面圓角化,使其更像真實的手機界面。
- 使用真實的 UI 圖片,而非占位符圖片(可從 Unsplash、Pexels、Apple 官方 UI 資源中選擇)。
- 添加頂部狀態(tài)欄(模擬 iOS 狀態(tài)欄),并包含 App 導航欄(類似 iOS 底部 Tab Bar)。
請按照以上要求生成完整的 HTML 代碼,并確保其可用于實際開發(fā)。
這個提示詞獲得了1400多行的代碼,但是因為生成的代碼文件過長,deepseek在生成時中斷過一次,但點擊「繼續(xù)生成」就解決了。
獲得的實際效果如下:





另外,我還嘗試了個網(wǎng)站的生成,效果也還可以,大致都是屬于Claude 3.5到Claude 3.7之間的水平。
熱門跟貼