據(jù)媒體周五報道,Meta有望在本月發(fā)布的新一代開源大語言模型Llama 4。此前這款大語言模型的發(fā)布已至少經(jīng)歷兩次延期,目前仍存在再度推遲可能。

打開網(wǎng)易新聞 查看精彩圖片

這距離前代模型Llama 3的發(fā)布已過去近一年,凸顯出Meta在AI軍備競賽中面臨的技術(shù)挑戰(zhàn)。

據(jù)Meta內(nèi)部測試顯示Llama 4在數(shù)學推理(GSM8K基準)和代碼生成(HumanEval)準確率較Llama 3提升37%。

這款大語言模型多次延期的主因是多模態(tài)訓練數(shù)據(jù)清洗遇阻,特別是視頻-文本對齊質(zhì)量未達預期。該模型需協(xié)調(diào)16000塊H100 GPU集群,能源消耗較Llama 3訓練增加2.3倍。

行業(yè)觀察人士指出,若再度延期,Meta將錯過6月開發(fā)者大會的關(guān)鍵展示窗口。而競爭對手Anthropic的Claude 4和谷歌Gemini 2.0已分別計劃在Q3發(fā)布重大更新。