DeepSeek：放假是不可能放假的。671B 新模型已上線，開發(fā)者喜提“五一數(shù)學(xué)題”！

CSDN

2025-04-30 21:29 ·北京 ·優(yōu)質(zhì)互聯(lián)網(wǎng)領(lǐng)域創(chuàng)作者

正當(dāng)大家紛紛進(jìn)入“五一”假期模式時，AI 界的 “勞?！?DeepSeek 再次證明：放假？不存在的。他們就在這個節(jié)骨眼上，悄然向開源社區(qū)投喂了一款重量級新模型——DeepSeek-Prover-V2-671B。

模型現(xiàn)已登陸 Hugging Face (鏈接: https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B)，光看這 6710 億（671B）的參數(shù)量，就足以讓不少機(jī)器瑟瑟發(fā)抖。

這并非一款通用大模型，而是 DeepSeek 專為高難度數(shù)學(xué)領(lǐng)域，特別是使用 Lean 4 進(jìn)行形式化定理證明而打造的“專業(yè)選手”。

作為 DeepSeek-Prover 系列的第二代產(chǎn)品，大家自然對其能力充滿期待。要知道，其前身 V1.5（雖然只有 7B 參數(shù)）在去年的高中數(shù)學(xué)測試 (miniF2F) 中已能達(dá)到 63.5% 的成功率，在大學(xué)級別測試 (ProofNet) 中也有 25.3% 的準(zhǔn)確率。如今參數(shù)量暴漲近百倍的 V2，潛力顯然不可同日而語，但具體實(shí)力如何，還有待驗(yàn)證。

然而，DeepSeek 這次的操作頗有“先把孩子生下來，名字和體檢報告稍后補(bǔ)上”的風(fēng)格。模型權(quán)重已經(jīng)大方開源，但至關(guān)重要的 Model Card (模型詳細(xì)說明書) 和 Benchmark (官方性能成績單) 卻暫時缺席。

這不禁讓人猜測，是團(tuán)隊為了趕在假期前“交卷”過于匆忙，還是有意讓社區(qū)進(jìn)行一輪“盲測”和探索？

總之，勞動節(jié)是得繼續(xù)勞動了。