馬斯克又又又開了一場“載入史冊”的發(fā)布會。

上一次還是去年10月發(fā)布Cybercab的“We,robot”,那天馬斯克讓直播間里的全球觀眾等了一個半小時。

而這一次,馬斯克在X平臺重磅發(fā)布的“地表最強(qiáng)AI”Grok 3模型,僅僅遲到了18分鐘。

“遲到人設(shè)”屹立不倒,觀看體驗(yàn)倒是成倍提升。

打開網(wǎng)易新聞 查看精彩圖片

值得注意的是,Grok 3的發(fā)布正趕上DeepSeek名聲大噪之際,聯(lián)想到馬總對DeepSeek那股說不清道不明的在意——

喜歡5G沖浪的網(wǎng)友,經(jīng)常能在質(zhì)疑DeepSeek的言論下面,看到馬斯克的身影:

比如Scale AI掌門人亞歷山大·王說DeepSeek成本才沒有那么低,他們有5萬塊英偉達(dá)H100芯片,只不過不能往外說。

馬斯克就很捧場的表示:那可不

打開網(wǎng)易新聞 查看精彩圖片

加上發(fā)布會上,Gork 3也多次提到自己的模型非常強(qiáng)大:

不僅擊敗了包括DeepSeek-V3和GPT-4o在內(nèi)的競爭對手;推出了名為“DeepSearch”的智能搜索引擎;還有一張長得賊眼熟的UI界面……

打開網(wǎng)易新聞 查看精彩圖片

導(dǎo)致大伙難免就把Grok 3和DeepSeek放在一起討論:

有人質(zhì)疑Grok 3是否真的如馬斯克所說“聰明得嚇人”“是最聰明的AI”?

打開網(wǎng)易新聞 查看精彩圖片

也有人開始擔(dān)心DeepSeek才走紅不到一個月,就要被大力出奇跡的Grok“炸翻”……

具體結(jié)論是啥樣的黑馬不知道,但咱們可以先走一波Grok 3的發(fā)布會,看看到底是什么給了馬斯克“地表最強(qiáng)”的自信?

打開網(wǎng)易新聞 查看精彩圖片

20萬張H100堆出來的“地表最強(qiáng)”

先介紹一下馬斯克的xAI,這家人工智能公司是馬斯克在2023年7月創(chuàng)辦的,其首個大模型Grok發(fā)布于同年11月。

2024年,xAI發(fā)布了Grok1.5和Grok 2。

Grok 3原本計(jì)劃是在去年年底發(fā)布的,馬斯克在社交平臺上造足了勢,稱其是“聰明得嚇人”“最聰明的AI”。

結(jié)果馬斯克沒想到,只是照例小小“跳票”了幾個月,市場上就已經(jīng)風(fēng)云變幻——

先是OpenAI宣布開啟算力基礎(chǔ)建設(shè)的“星際之門”項(xiàng)目,另一邊中國又出了個DeepSeek一口氣把大模型成本打到一個讓人難以置信的水平。

打開網(wǎng)易新聞 查看精彩圖片

而這邊馬斯克的牛已經(jīng)吹了出去,Grok 3夾在中間不上不下的,略顯尷尬。

但這次在發(fā)布會上,馬斯克公布了一個非常amazing的信息:

訓(xùn)練Grok 3的Colossus超級計(jì)算機(jī),包含了20萬張英偉達(dá)H100芯片;

也就是說,Grok 3是全球首個20萬塊GPU訓(xùn)練出的AI大模型

,號稱計(jì)算量是Grok 2的10倍。

打開網(wǎng)易新聞 查看精彩圖片

整場發(fā)布會并沒有過多的應(yīng)用展示,(演示生成新游戲的那段中途還慘遭翻車),更多的是甩的大模型跑分表現(xiàn)。

怎么說呢,如果馬斯克沒有吹牛,Grok 3確實(shí)足夠遙遙領(lǐng)先。

所謂大力出奇跡。

在xAI提供的多項(xiàng)基準(zhǔn)測試中,Grok 3在數(shù)學(xué)、科學(xué)問答、編碼上,都大幅度超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o等模型。

打開網(wǎng)易新聞 查看精彩圖片

在Chatbot Arena競技場,Grok3直接拿下第一,分?jǐn)?shù)也高得驚人。

打開網(wǎng)易新聞 查看精彩圖片

不僅第一,還是目前唯一1400分以上的模型,直接把沒火多久的Gemini2.0甩開一大截。

此外,Grok 3還推出了推理模型——Grok-3 Reasoning。

在聊天入口中同樣可以選擇深度思考

(Grok-3中叫“Think”),同樣也會顯示模型“思考”的過程。

打開網(wǎng)易新聞 查看精彩圖片

但馬斯克表示,xAI 會稍微模糊思維,這樣其他公司就不能直接復(fù)制xAI的聊天機(jī)器人。

而根據(jù)演示,Grok 3的可以做到推算出太空飛船從地球發(fā)射、到火星著陸、再到下一次發(fā)射返回地球的動畫代碼。

甚至還能推算宇航員出倉時間、火星探索的軌道運(yùn)轉(zhuǎn)等。

打開網(wǎng)易新聞 查看精彩圖片

而馬斯克表示,這就是Space X真實(shí)的探索軌道,并表示3年內(nèi),計(jì)算機(jī)就能打敗人類。

打開網(wǎng)易新聞 查看精彩圖片

基于Grok 3強(qiáng)大的算力支持和跑分演示所展示的驚人效果,哪怕馬斯克一再強(qiáng)調(diào),目前Grok 3還處于測試版本,正式版還需要再等一周。

但吃瓜群眾對于Grok 3的正式發(fā)布已經(jīng)蠢蠢欲動——

是真牛逼還是吹牛逼,你先拉出來遛遛,

打開網(wǎng)易新聞 查看精彩圖片

而馬斯克表示,目前X平臺上預(yù)先訂閱用戶已經(jīng)可以體驗(yàn)Grok 3,但正式發(fā)布還需要等到一周后。

Grok 3網(wǎng)址為:grok.com。

支持語音功能,也會推出App(但最新版在網(wǎng)頁端)

不同于DeepSeek的算法優(yōu)化路徑,僅用2048個H800 GPU,訓(xùn)練2788千小時就完成了深度學(xué)習(xí);

Grok 3走的是強(qiáng)算力平推的火力覆蓋路線——8個月20萬塊H100的訓(xùn)練成本,使得Grok 3在多個領(lǐng)域都表現(xiàn)出了強(qiáng)大的競爭力。

打開網(wǎng)易新聞 查看精彩圖片

不過在黑馬看來,Grok 3的出現(xiàn)在某種程度上其實(shí)是一件好事。

DeepSeek的價值在于打通了低成本大模型的技術(shù)路徑,開源又進(jìn)一步加速了國內(nèi)AI發(fā)展進(jìn)程。

低成本路徑下,中小企業(yè)的成本得到了大幅度降低,AI應(yīng)用有預(yù)期會迎來一波大的爆發(fā),能夠?yàn)锳I模型提供更肥沃的生態(tài)土壤。

簡而言之,DeepSeek作為推理模型而言,優(yōu)劣都很突出,但其真正的價值并不局限在應(yīng)用本身的推理能力,而是在于其對生態(tài)的反哺。

打開網(wǎng)易新聞 查看精彩圖片

而Grok 3卻是采用大量資源堆出來的超級推理模型,在應(yīng)用體驗(yàn)上應(yīng)該更加全面和智能。

只不過當(dāng)前我們無法確認(rèn)Grok 3是否真的如馬斯克所說的那樣amazing。

作為一個普通用戶來說,黑馬是希望能出現(xiàn)越來越多便宜、好用、算力充足的模型服務(wù)大眾的。

(還是想吐槽一句,DeepSeek你真的太卡了)

而現(xiàn)在,就讓子彈先飛一周,再見分曉吧。

撰文:柯然

編輯:小馬哥