4月6日消息,深夜,Meta 發(fā)布全新 AI 模型系列 Llama 4,推出Llama 4 Maverick(400B 參數(shù))和 Llama 4 Scout(109B 參數(shù)),以及最強大的 Llama 4 Behemoth預(yù)覽。

Meta 表示,Scout 和 Maverick 模型已可在 llama.com 與 Hugging Face 下載。Scout 支持1000萬 token 上下文,適配單個 H100 GPU;Maverick 主打性價比,在推理效率與性能上對標(biāo) GPT-4o 與 DeepSeek V3。

打開網(wǎng)易新聞 查看精彩圖片

值得一提的是,Llama 4 Maverick 在 LMSYS Arena 中 ELO 得分達1417,成為第四個突破1400分的大模型,開放模型中排名第一。在編程、數(shù)學(xué)、創(chuàng)意寫作等任務(wù)中得分領(lǐng)先,較 Llama 3 405B 提升近150分。

Llama 4 Behemoth 擁有2880億激活參數(shù),Meta 稱其為“世界上最智能”的大模型之一,在 STEM 多項基準測試中超越 GPT-4.5和 Gemini 2.0 Pro,目前仍處于訓(xùn)練階段。

所有模型支持文本、圖像、視頻輸入,原生設(shè)計實現(xiàn) token 級別的早期融合。視覺 encoder 基于 MetaCLIP 改進,對圖像區(qū)域定位(grounding)能力顯著增強。

Llama 4是 Meta 首次采用混合專家(MoE)架構(gòu)的模型,同等算力下比密集模型更高效。以 Maverick 為例,采用128專家 + 共享專家的路由結(jié)構(gòu),在單臺 H100上即可運行。

Meta 稱 Llama 4預(yù)訓(xùn)練數(shù)據(jù)量是 Llama 3的兩倍,覆蓋文本、圖像與視頻,支持200種語言預(yù)訓(xùn)練,其中100種語言的 token 超過10億。(袁寧)