Meta 今日凌晨發(fā)布旗下最新Llama 4系列開源AI 模型,包含Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth。

打開網(wǎng)易新聞 查看精彩圖片

Meta 表示,這些模型都經(jīng)過了“大量未標(biāo)注的文本、圖像和視頻數(shù)據(jù)”的訓(xùn)練,以使它們具備“廣泛的視覺理解能力”。

“今天標(biāo)志著原生多模態(tài)人工智能創(chuàng)新的新紀(jì)元的開啟。我們推出了首批 Llama 4 模型:Llama 4 Scout 和 Llama 4 Maverick——這是我們迄今為止最先進(jìn)的模型,也是多模態(tài)領(lǐng)域中同類最佳的模型?!?/p>

具體來看:

Llama 4 Scout

?170 億活躍參數(shù)模型,配備 16 個專家。

?行業(yè)領(lǐng)先的上下文窗口,可處理 1000 萬標(biāo)記。

?在廣泛認(rèn)可的多項基準(zhǔn)測試中,表現(xiàn)優(yōu)于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。

Llama 4 Maverick

?170 億活躍參數(shù)模型,配備 128 個專家。

?在圖像定位方面處于行業(yè)頂尖水平,能夠?qū)⒂脩籼崾九c相關(guān)的視覺概念對齊,并將模型響應(yīng)錨定在圖像的特定區(qū)域。

?在廣泛認(rèn)可的多項基準(zhǔn)測試中,表現(xiàn)優(yōu)于 GPT-4o 和 Gemini 2.0 Flash。

?在推理和編碼方面,與 DeepSeek v3 取得了相當(dāng)?shù)慕Y(jié)果,而活躍參數(shù)僅為后者的一半。

?在性價比方面,其聊天版本在 LMArena 上的 ELO 得分為 1417。

Meta表示,這些模型之所以成為其迄今為止最好的模型,得益于從 Llama 4 Behemoth 中進(jìn)行的知識蒸餾,而 Llama 4 Behemoth 是其迄今為止最強大的模型。Llama 4 Behemoth 仍在訓(xùn)練中,目前在專注于 STEM 的基準(zhǔn)測試中,表現(xiàn)優(yōu)于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。

Llama 4 系列模型是該公司旗下首批采用混合專家(MoE)架構(gòu)的模型,這種架構(gòu)在訓(xùn)練和回答用戶查詢時的效率更高。

打開網(wǎng)易新聞 查看精彩圖片

“混合專家架構(gòu)”是將數(shù)據(jù)處理任務(wù)分解為子任務(wù),然后將它們委派給更小的、專門的“專家”模型。(三言科技)