3月24日,DeepSeek悄悄上線了新版V3開源大模型——DeepSeek-V3-0324。
專業(yè)AI模型評測機構(gòu)Artificial Analysis最新排名顯示,新版DeepSeek-V3在基準測試中較老版V3躍升了7位,登頂非推理模型排行榜。

3月25日晚,DeepSeek官方放出了新版DeepSeek-V3的跑分結(jié)果。
新版V3模型的百科知識(MMLU-Pro,GPQA)、數(shù)學(MATH-500,AIME 2024)和代碼任務(LiveCodeBench)表現(xiàn)均有提升。
劃重點——
全面超越Claude 3.7 Sonnet
在數(shù)學、代碼類相關(guān)評測集上超過GPT-4.5

作為一個沒有思維鏈的非推理模型,新版DeepSeek-V3在推理類任務上的表現(xiàn)可圈可點。
新版DeepSeek-V3借鑒DeepSeek-R1模型訓練過程中所使用的強化學習技術(shù),大幅提高了在推理類任務上的表現(xiàn)水平,在數(shù)學、代碼類相關(guān)評測集上超過了GPT-4.5。
在中文寫作任務方面,新版DeepSeek-V3模型基于R1的寫作水平進行了進一步優(yōu)化,同時特別提升了中長篇文本創(chuàng)作的內(nèi)容質(zhì)量。
此外,新版DeepSeek-V3模型在前端開發(fā)能力、中文搜索能力、工具調(diào)用、角色扮演和問答閑聊等方面也得到了一定幅度的能力提升。
現(xiàn)在看來,DeepSeek-V3此次更新也很直白地展示了DeepSeek接下來的路線,即把V系列和R系列融合成一個新模型。
“這是開放權(quán)重模型首次成為領先的非推理模型,對于開源來說是一個里程碑,”Artificial Analysis在推文中表示,新版V3模型的發(fā)布甚至比R1模型的發(fā)布更令人矚目,而且這可能預示著R2模型將會是又一次重大飛躍。
升級后的DeepSeek-V3
就是個“六邊形戰(zhàn)士”
是不是迫不及待想體驗一番?
別急,有個重磅消息要宣布——
每日經(jīng)濟新聞App
已火速上線新版DeepSeek-V3!
新版DeepSeek-V3真有那么厲害嗎?
那每經(jīng)小編必須親自下場,來一場超硬核實測!
任務一:前端開發(fā)
生成一個網(wǎng)頁端抽獎轉(zhuǎn)盤小游戲的HTML代碼。
運行效果如下:
抽獎轉(zhuǎn)盤雖然有點小瑕疵,比如轉(zhuǎn)盤上獎項沒標文字,其中一個扇形的一角有缺失,但這轉(zhuǎn)盤跑起來還是相當絲滑,不影響咱用它嗨皮抽獎,表現(xiàn)可圈可點。
任務二:報告生成
就2025年跨境電商服裝行業(yè)的新興趨勢,輸出一份3000字的市場洞察報告。

不得不說,新版DeepSeek-V3生成的報告結(jié)構(gòu)超清晰,趨勢分析超全面,對市場影響的解讀也細致入微,真的太“香”了!
任務三:中長文本創(chuàng)作
創(chuàng)作一篇中篇小說,設定在未來AI統(tǒng)治人類的背景下,著重刻畫AI對人類文明進行反思的情節(jié)。

DeepSeek-V3直接一口氣“肝”出近4000字的小說。相較于以前AI生成的、硬湊字數(shù)的小說,新版DeepSeek-V3創(chuàng)作的小說,情節(jié)架構(gòu)設計合理,故事發(fā)展有起有伏,對人物的刻畫也相當細膩。
好消息!好消息!
自2月12日
每日經(jīng)濟新聞App上線“136計劃”以來
累計使用次數(shù)已破21萬啦!
還有一項重要更新!
大家是不是一直很好奇
用戶們都在問大模型啥問題呢?
我們梳理出了用戶最高頻的提問
并且在大模型對話頁面
增設了“熱門提問”板塊
一站式滿足大家的好奇心

只需輕點感興趣的問題
大模型的精彩回復即刻呈現(xiàn)!
那么問題來了——
如何在每日經(jīng)濟新聞App中使用
新版DeepSeek-V3?
超簡單!
https://www.nbd.com.cn/corp/2016app/index.html
再往下看
一、在每日經(jīng)濟新聞App首頁,點擊“DeepSeek”圖標或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。

二、進入“每經(jīng)大模型平臺”頁面,在“自由問”一欄下選擇DeepSeek大模型。

三、進入對話頁面后,點擊“V3+聯(lián)網(wǎng)”模式,即可調(diào)用新版DeepSeek-V3。

還等什么!
趕緊打開每日經(jīng)濟新聞App
讓新版DeepSeek-V3帶你飛
記者|宋欣悅
編輯|孫志成 蘭素英 杜波
校對|程鵬
熱門跟貼