国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

<fieldset id="4mu8m"><menu id="4mu8m"></menu></fieldset>

<fieldset id="4mu8m"><menu id="4mu8m"></menu></fieldset>

Llama 4發(fā)布36小時(shí)差評如潮！匿名員工爆料拒絕署名技術(shù)報(bào)告

量子位

2025-04-07 12:59 ·北京 ·《量子位》官方網(wǎng)易號

夢晨發(fā)自凹非寺量子位 | 公眾號 QbitAI

夢晨發(fā)自凹非寺量子位 | 公眾號 QbitAI

Meta最新基礎(chǔ)模型Llama 4發(fā)布36小時(shí)后，評論區(qū)居然是這個(gè)畫風(fēng)：

失望，非常失望
不知道他們后訓(xùn)練怎么搞的，總之不太行
在[各種測試]2中失敗

還被做成表情包調(diào)侃，總結(jié)起來就是一個(gè)“差評如潮”。

具體來看，大家的抱怨主要集中在代碼能力。

最直觀的要數(shù)經(jīng)典“氛圍編程”小球反彈測試，小球直接穿過墻壁掉下去了。

反映在榜單上，成績也相當(dāng)割裂。

發(fā)布時(shí)的官方測評（LiveCodeBench）分?jǐn)?shù)和在大模型競技場表現(xiàn)明明都很不錯。

但到了各種第三方基準(zhǔn)測試中，情況大多直接逆轉(zhuǎn)，排名末尾。

讓人不由得懷疑，這個(gè)競技場排名到底是數(shù)據(jù)過擬合，還是刷票了。

就在Llama 4即將發(fā)布前幾天，Meta AI研究主管Joelle Pineau在工作8年之后突然宣布離職，總之就是不太妙。

Llama 4怎么了?

大模型關(guān)注者們火熱實(shí)測吐槽之際，一則有關(guān)Llama 4的匿名爆料，突然引起軒然大波：

有網(wǎng)友稱自己已向Meta GenAI部門提交提交辭職，并要求不要署名在Llama 4的技術(shù)報(bào)告上。

原貼發(fā)布在海外留學(xué)求職交流平臺一畝三分地，在國內(nèi)也引起很多討論。

此爆料尚未得到證實(shí)，但有人搬出Meta GenAI負(fù)責(zé)人Ahmad Al-Dahle的帖子，至少能看出在Llama 4大模型競技場里運(yùn)行的是特殊版本模型。

還有Meta前員工借此話題貼出2024年11月的一項(xiàng)研究，指出從Llama 1開始數(shù)據(jù)泄露的問題就存在了。

也不只是編程能力一個(gè)方面有問題，在EQBench測評基準(zhǔn)的的長文章寫作榜中，Llama 4系列也直接墊底。

榜單維護(hù)者_(dá)sqrkl說明了具體情況。

測試非常簡單，模型需要先完成一個(gè)短篇小說的頭腦風(fēng)暴、反思并修改寫作計(jì)劃，最終每輪寫1000字，重復(fù)8輪以上。

由Claude-Sonnet 3.7來當(dāng)裁判，先對每個(gè)章節(jié)單獨(dú)打分，再對整個(gè)作品打分。

Llama 4的低分表現(xiàn)在寫到后面開始大段的內(nèi)容重復(fù)，以及寫作非常公式化。

對此結(jié)果，有一個(gè)猜想是之前的版權(quán)訴訟讓Meta刪除了網(wǎng)絡(luò)和書籍?dāng)?shù)據(jù)，使用了更多的合成數(shù)據(jù)。

在這場訴訟中，許多作家發(fā)現(xiàn)自己的作品可能被用于AI訓(xùn)練，還到倫敦的Meta辦公室附近發(fā)起抗議。

Llama 4發(fā)布后的種種，讓人聯(lián)想到年初的匿名員工爆，有網(wǎng)友表示當(dāng)初只是隨便看看，現(xiàn)在卻開始相信了：

在這條爆料中，Deepseek v3出來之后，訓(xùn)練中的Llama4就顯得落后了，中層管理的薪水都比DeepSeek V3的訓(xùn)練成本都高，Meta內(nèi)部陷入恐慌模式。

讓人不由得感嘆，DeepSeel-R1橫空出世僅僅兩個(gè)月時(shí)間，卻像過了幾輩子。

[1]https://www.reddit.com/r/LocalLLaMA/comments/1jt7hlc/metas_llama_4_fell_short/
[2]https://www.1point3acres.com/bbs/thread-1122600-1-1.html
[3]https://x.com/suchenzang/status/1909070231517143509
https://x.com/TheAhmadOsman/status/1908833792111906894

打開網(wǎng)易新聞體驗(yàn)更佳

熱搜

熱門跟貼

打開APP發(fā)貼

静海县| 班戈县| 高青县| 神农架林区| 新龙县| 大同县| 涞水县| 海晏县| 杭锦后旗| 灵璧县| 霍林郭勒市| 新乡市| 祁连县| 乐陵市| 翁牛特旗| 精河县| 鄂伦春自治旗| 北流市| 都兰县| 大港区| 平湖市| 上杭县| 拉孜县| 九龙县| 宜阳县| 双峰县| 新余市| 沁源县| 陕西省| 江孜县| 宣城市| 台南市| 清镇市| 莱阳市| 临泽县| 同江市| 射洪县| 墨脱县| 四子王旗| 莆田市| 老河口市|

<cite id="caeyu"></cite>

<strike id="caeyu"></strike>