4月30日,DeepSeek今日于AI開源社區(qū)Hugging Face上發(fā)布了一個(gè)名為DeepSeek-Prover-V2-671B的新模型。新模型是專注于數(shù)學(xué)定理證明的大語言模型,專門針對(duì)形式化數(shù)學(xué)證明任務(wù)進(jìn)行優(yōu)化。

打開網(wǎng)易新聞 查看精彩圖片
DeepSeek-Prover-V2-671B使用了DeepSeek-V3架構(gòu),參數(shù)高達(dá)6710億,采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。更令人驚嘆的是,其最大位置嵌入達(dá)到了16.38萬,這意味著它能夠處理極其復(fù)雜的數(shù)學(xué)證明問題。

打開網(wǎng)易新聞 查看精彩圖片
值得注意的是,3月發(fā)布的V3-0324版本已被業(yè)內(nèi)視為未來R2的基礎(chǔ)模型。這一版本通過6850億參數(shù)的MoE架構(gòu)升級(jí),代碼能力獲得顯著增強(qiáng)。
值得注意的是,4月30日晚美股開盤,英偉達(dá)股價(jià)下跌3.9%,市值蒸發(fā)1037億美元(約合人民幣7541億元)。

打開網(wǎng)易新聞 查看精彩圖片
每日經(jīng)濟(jì)新聞綜合自公開信息
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
熱門跟貼