午夜精品福利久久一区,国产欧美日韩综合在线,av片永久免费在线观看,嫩草影院aⅴ,成人精品免费国产一区二区

Meta 深夜開源 Llama 4：首次采用 MoE 架構(gòu)，千萬 Token 上下文刷新紀錄

2025-04-06 12:06 ·北京 ·網(wǎng)易科技官方網(wǎng)易號

4月6日消息，深夜，Meta 發(fā)布全新 AI 模型系列 Llama 4，推出Llama 4 Maverick（400B 參數(shù)）和 Llama 4 Scout（109B 參數(shù)），以及最強大的 Llama 4 Behemoth預(yù)覽。

Meta 表示，Scout 和 Maverick 模型已可在 llama.com 與 Hugging Face 下載。Scout 支持1000萬 token 上下文，適配單個 H100 GPU；Maverick 主打性價比，在推理效率與性能上對標(biāo) GPT-4o 與 DeepSeek V3。

值得一提的是，Llama 4 Maverick 在 LMSYS Arena 中 ELO 得分達1417，成為第四個突破1400分的大模型，開放模型中排名第一。在編程、數(shù)學(xué)、創(chuàng)意寫作等任務(wù)中得分領(lǐng)先，較 Llama 3 405B 提升近150分。

Llama 4 Behemoth 擁有2880億激活參數(shù)，Meta 稱其為“世界上最智能”的大模型之一，在 STEM 多項基準測試中超越 GPT-4.5和 Gemini 2.0 Pro，目前仍處于訓(xùn)練階段。

所有模型支持文本、圖像、視頻輸入，原生設(shè)計實現(xiàn) token 級別的早期融合。視覺 encoder 基于 MetaCLIP 改進，對圖像區(qū)域定位（grounding）能力顯著增強。

Llama 4是 Meta 首次采用混合專家（MoE）架構(gòu)的模型，同等算力下比密集模型更高效。以 Maverick 為例，采用128專家 + 共享專家的路由結(jié)構(gòu)，在單臺 H100上即可運行。

Meta 稱 Llama 4預(yù)訓(xùn)練數(shù)據(jù)量是 Llama 3的兩倍，覆蓋文本、圖像與視頻，支持200種語言預(yù)訓(xùn)練，其中100種語言的 token 超過10億。（袁寧）