就在剛剛,DeepSeek 在全球最大 AI 開源社區(qū) Hugging Face 發(fā)布了一個名為 DeepSeek-Prover-V2-671B 的新模型。

根據(jù)目前公布的信息,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持多種計算精度,方便模型更快、更省資源地訓(xùn)練和部署。

從命名上看,這款參數(shù)高達(dá) 6710 億的模型可能是去年發(fā)布的數(shù)學(xué) AI 模型 Prover-V1.5 的升級版。

去年開源的 Prover-V1.5 雖然只有 70 億參數(shù),但在高中數(shù)學(xué)測試(miniF2F)中成功率達(dá)到 63.5%,在大學(xué)級別測試(ProofNet)中也拿下了 25.3%,超越了多款開源模型(InternLM2-StepProver、Llemma)。

不少網(wǎng)友猜測,這款模型延續(xù)了前作 Prover-V1.5 的風(fēng)格,專門用來攻克數(shù)學(xué)難題,尤其擅長自動證明定理、做復(fù)雜計算,比如像 AlphaGo 下圍棋一樣,通過「自我對弈」來學(xué)數(shù)學(xué)。

接下來它會表現(xiàn)如何,值得期待。

附上 Hugging Face 地址:
https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片