就在剛剛,全球最大 AI 開(kāi)源社區(qū) Hugging Face CEO Clément Delangue 發(fā)布了一條相當(dāng)耐人尋味的帖子。

在推文中,他配上了三個(gè) 表情,并附上了 DeepSeek 在 Hugging Face 的倉(cāng)庫(kù)鏈接(https://huggingface.co/deepseek-ai)以及相關(guān)配圖,疑似暗示 DeepSeek R2 即將發(fā)布。

不少網(wǎng)友在評(píng)論區(qū)也紛紛猜測(cè) DeepSeek R2 可能很快上線。

而在今日凌晨,關(guān)于 DeepSeek R2 的泄露信息也在 X 平臺(tái)上遭到病毒式傳播,泄露內(nèi)容包括:

1?? 擁有 1.2 萬(wàn)億參數(shù),活躍參數(shù)為 780 億,采用混合 MoE 架構(gòu)
2?? 成本比 GPT-4o 便宜 97.3%(輸入每百萬(wàn)次 0.07 美元,輸出每百萬(wàn)次 0.27 美元)
3?? 使用了 5.2PB 的訓(xùn)練數(shù)據(jù),在 C-Eval2.0 測(cè)試中取得了 89.7% 的得分
4?? 視覺(jué)能力更強(qiáng),在 COCO 測(cè)試集上達(dá)到了 92.4%
5?? …

不過(guò),目前尚無(wú)法確認(rèn)這些信息的真實(shí)性,而從信息源頭來(lái)看,這則信息的可靠程度并不高。

另外,阿里旗下的 Qwen 近日也在海外部分地區(qū)上線了 Qwen Chat 應(yīng)用,已支持 iOS 和 Android 用戶。許多網(wǎng)友猜測(cè),這或許是在為 Qwen 3 的發(fā)布做鋪墊。

截至發(fā)稿時(shí),DeepSeek 和 Qwen 官方均未對(duì)相關(guān)傳聞作出回應(yīng)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片