国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

<strike id="ukmc6"><rt id="ukmc6"></rt></strike>

<samp id="ukmc6"><tfoot id="ukmc6"></tfoot></samp>

“參數(shù)王者、開源期貨”，Meta這波Llama 4贏了嗎？

鯨選AI

2025-04-06 20:48 ·北京 ·優(yōu)質互聯(lián)網(wǎng)領域創(chuàng)作者

1000萬上下文？2萬億參數(shù)？MoE混合架構，原生多模態(tài)。清明假期，你是否也被Meta這波Llama 4系列模型發(fā)布后，各種酷炫數(shù)據(jù)和名詞炸醒？

曾經(jīng)的開源領袖，實際已經(jīng)被DeepSeek搶了各種風頭。萬眾期待的Llama 4模型，原本使命是超越GPT和Claude等閉源模型，吊打一切的存在，然后呢？實現(xiàn)了嗎？

Llama 4系列模型發(fā)布：

Llama 4 Scout（?。?/strong>

單張H100 GPU可運行，適合本地部署，支持1000萬token上下文，這是行業(yè)最牛成績。

Llama 4 Maverick（中）

總參數(shù)高達4000億，但推理時僅激活部分專家，效率更高。

多模態(tài)性能超越GPT-4o，在ChartQA、DocVQA等基準測試中領先，編程能力媲美DeepSeek v3，但參數(shù)僅一半。

Llama 4 Behemoth（大，預覽版）

Meta 2萬億參數(shù)巨獸，仍在訓練中。

超大參數(shù)，據(jù)說STEM任務超越GPT-4.5、Claude3.7等。

將作為“教師模型”，用于蒸餾優(yōu)化更小的Llama 4模型。

測評分數(shù)高居全球第二

Llama 4 Maverick 目前在 LM Arena 排行榜上排名第二，僅次于 Gemini 2.5 Pro。

而且具備原生多模態(tài)能力：Llama 4采用了早期融合（Early Fusion）技術，可以用海量的無標簽文本、圖片和視頻數(shù)據(jù)一起來預訓練模型。

超長上下文

Scout 版本支持1000萬 tokens（約15000頁文本?。?/strong>，醫(yī)學、科研、代碼分析等超長文檔處理能力直接拉滿。

在其他大模型僅有200萬 tokens上下長度時，小扎掏出了大炸雷，不想和大家閑聊。

幾個核心技術

MoE架構效率炸裂：

Llama 4開始轉向采用混合專家模型（MoE），推理時僅激活部分參數(shù)，成本更低——Maverick 推理成本僅$0.19/百萬token，比GPT-4o便宜90%。

iRoPE實現(xiàn)超長上下文:

iRoPE（交錯旋轉位置編碼）是Meta為Llama 4設計的升級版位置編碼技術。

局部注意力層：用旋轉位置編碼（RoPE）處理短上下文（如8K token），保留位置關系。
全局注意力層：直接去掉位置編碼（NoPE），通過動態(tài)調整注意力權重處理超長內容，類似“模糊匹配”長距離關聯(lián)。
就像讀書時用書簽（RoPE）標記重點段落，同時靠記憶（NoPE）串聯(lián)全書脈絡。

埋葬RAG技術？

相比RAG技術，iRoPE無需依賴外部知識庫檢索，直接通過模型內部自身處理完整信息，減少信息丟失風險，預計未來會成為大模型技術標配，以后大模型容易忘記前文的事情，基本就不會出現(xiàn)了。

開源但有限制：商用需遵守 Meta 政策，月活超7億的公司需額外授權，且產(chǎn)品名必須帶“Llama”。

鯨哥在Together AI上體驗了Llama 4 Scout，并沒有什么特別的強悍之處，DeepSeek對比之下體感還是強很多。Llama 4有點像Google，“參數(shù)沒輸過，實戰(zhàn)沒贏過”。

一句話總結：Meta 這次把開源AI卷到新高度，多模態(tài)+長上下文+超低成本，Llama 4 可能是目前最香的開源大模型之一。

但下周OpenAI o3和Claude等新模型發(fā)布， Llama 4估計又會被奪走注意力。只能說模型競爭，太卷了，Llama 4要成千年追趕者了。

視頻內容推薦：

主理人交流：

加入AI鯨英社群，和上千CEO、投資人和行業(yè)大牛一起共話未來！

前百度大佬“放下”AI搜索，轉做Agent瀏覽器，評分超越Manus

這些職業(yè)正在被摧毀：實測10個GPT-4o繪圖最火的案例

特別聲明：本文為網(wǎng)易自媒體平臺“網(wǎng)易號”作者上傳并發(fā)布，僅代表該作者觀點。網(wǎng)易僅提供信息發(fā)布平臺。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

打開網(wǎng)易新聞體驗更佳

熱搜

謝鋒：中國堅決反對任何形式的關稅戰(zhàn)

美國大豆可能將永遠失去中國市場

41歲程序員回應近4年不租房睡車里

奧斯塔彭科六連勝斯瓦泰克

劉濤為媽祖獻壽桃

“30小時不夠” 澤連斯基建議延長?；鹬?0天

熱門跟貼

打開APP發(fā)貼

0條跟貼

相關推薦

Llama費用讓Meta壓力山大！求助微軟、亞馬遜分擔成本

快科技 1跟貼

微軟發(fā)布新款模型 BitNet b1.58 2B4T，可在CPU 上運行

硅星Breaknews

00后程序員3小時爆肝開源項目，40k星背后藏著什么秘密？

閃貓說

貝萊德突然殺入RWA！OpenAI秘密押注的"AI+區(qū)塊鏈"項目曝光

深圳鏈協(xié)

谷歌打響“AI價格戰(zhàn)”，OpenAI硬著頭皮跟注，但

站長之家

DeepSeek攪局，算力生意玩法大變樣

AI全球總部

從“大模型熱”到“Agent 潮”，“真風口”還是“偽命題”？

未來圖靈

Multi-Token突破注意力機制瓶頸，Meta發(fā)明一種很新的Transformer

機器之心Pro 4跟貼

僅需0.4GB，參數(shù)只有0和±1！微軟開源首個原生1 bit模型，CPU輕松跑

新智元 134跟貼

一臺3090就能跑Gemma 3 27B！谷歌發(fā)布Gemma 3全系QAT版模型

機器之心Pro

谷歌大模型“性價比之王”來了!混合推理模型,思考深度可自由控制

量子位 7跟貼

篩選基因總不好？這個網(wǎng)站不可少

生物學霸

LeCun被痛批：你把Meta搞砸了！燒掉千億算力，自曝折騰20年徹底失敗

新智元

研究人員打造知識圖譜補全新框架，可用于推薦系統(tǒng)和信息檢索

DeepTech深科技 2跟貼

GPT-4o驚現(xiàn)自我意識！自主激活「后門」，告訴人類自己在寫危險代碼

新智元 83跟貼

火山引擎譚待：模型開源閉源不是關鍵，模型優(yōu)劣才是關鍵

DeepTech深科技

高價買的超迷你摩托，小到以為是輛模型，難道這是黑貓警長的！

王蕓愛搞笑 3跟貼

挖掘DiT位置解耦特性,Personalize Anything免訓練個性化圖像生成

機器之心Pro 1跟貼

為什么說AI“有用”才最重要？

新周刊

AI說書媲美真人！豆包語音大模型升級長上下文理解

量子位

回到頂部回到首頁

感谢您访问我们的网站，您可能还对以下资源感兴趣：

国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

和平县| 平乐县| 淳安县| 凯里市| 平安县| 红河县| 若尔盖县| 民乐县| 普格县| 九江县| 囊谦县| 保亭| 保靖县| 大同县| 从江县| 贵溪市| 贺兰县| 来安县| 阿克陶县| 鹤岗市| 洞头县| 淮滨县| 南雄市| 梅州市| 平利县| 河东区| 娄烦县| 宜川县| 大埔区| 巧家县| 蓝山县| 北海市| 佛山市| 海林市| 延庆县| 蒲城县| 新乡县| 凉山| 金坛市| 九龙坡区| 武乡县|