這兩天,AI圈最火爆的新聞莫過于馬斯克親自站臺(tái)宣傳的Grok3。這位科技狂人將Grok3吹上了天,又是20萬張頂級(jí)GPU,又是史詩(shī)級(jí)訓(xùn)練,讓人不禁好奇,這“含著金湯匙”出生的AI,究竟能有多神?

這20萬卡具體是:

初始階段使用了10萬張英偉達(dá)H100 GPU,訓(xùn)練時(shí)間為122天。

后來擴(kuò)展到20萬張GPU,其中包括:

  1. 原有的10萬張H100
  2. 新增5萬張H100
  3. 新增5萬張H200
  4. 擴(kuò)展后又訓(xùn)練了92天

總的訓(xùn)練時(shí)間達(dá)到214天,使用了全球最大的AI訓(xùn)練集群Colossus。這個(gè)訓(xùn)練規(guī)模被馬斯克稱為"前所未有的,遠(yuǎn)超過前代Grok 2使用的1.5萬張GPU。

App和網(wǎng)頁(yè)端一上線就迫不及待地體驗(yàn)了一番,效率和效果確實(shí)讓人眼前一亮,不得不承認(rèn),AI世界每天都在刷新驚喜,而Grok無疑是最新加入的“王炸”選手。

打開網(wǎng)易新聞 查看精彩圖片

DeepSearch速度質(zhì)量都不輸于Perplexity

心癢難耐地充值了5美元,就等著API快點(diǎn)到碗里來。但在API排隊(duì)期間,我的注意力又被另一個(gè)“新晉網(wǎng)紅”吸引了——騰訊的ima app。 尤其想試試 “知識(shí)庫(kù)+DeepSeek” 究竟能碰撞出什么火花。

說干就干,我立刻將小宇宙App里“屠龍之術(shù)”的主持人莊明浩,邀請(qǐng)嘉賓Monica的張濤老師,東不壓橋研究院的張鵬老師,律人行主播Lily聊的一期播客:“Vol.51 那些關(guān)于DeepSeek的謠言與誤解?!毕螺d下來,轉(zhuǎn)成pdf文本,一股腦兒投喂給ima,然后問一個(gè)總結(jié)性的問題:

打開網(wǎng)易新聞 查看精彩圖片

請(qǐng)根據(jù)知識(shí)庫(kù)中的信息,總結(jié)所有 deepseek 能成功、與眾不同、讓大家大為驚異的地方,一定要列出來所有的特點(diǎn)。

打開網(wǎng)易新聞 查看精彩圖片

然而,ima在調(diào)用DeepSeek R1后,足足思考了35秒(不算長(zhǎng)),給出的答案竟然是 “文中并未提及關(guān)于deepseek的技術(shù)特點(diǎn)、功能優(yōu)勢(shì)或創(chuàng)新點(diǎn)”。 這結(jié)果讓我瞬間懵了,難道是embedding環(huán)節(jié)出了問題?但再試著問一些查找類的簡(jiǎn)單問題,ima卻又能對(duì)答如流。 免費(fèi)固然香,但這 “首選知識(shí)庫(kù)” 的地位,恐怕要重新掂量掂量了。

略感失望之余,我轉(zhuǎn)戰(zhàn)Cherry Studio,再次對(duì)DeepSeek R1發(fā)起測(cè)試。 這次回答基本算得上正確,但細(xì)究之下,卻發(fā)現(xiàn)它漏掉了一個(gè)我特別想讓DeepSeek “高亮” 的關(guān)鍵信息,那是播客中張濤老師強(qiáng)調(diào)的DeepSeek的破圈之處:

那么DeepSeek除了本身的這個(gè)技術(shù)很厲害,并且開源以外,我覺得他破圈還有一個(gè)非常重要的一個(gè)點(diǎn),就在于他在全世界范圍之內(nèi)第一次提供了一個(gè)既有reasoning model,又可以通過搜索獲取現(xiàn)實(shí)知識(shí)不斷的結(jié)合反思的這樣子的一個(gè)一個(gè)產(chǎn)品。你要記得這是一個(gè)產(chǎn)品啊,這不是一個(gè)模型。

打開網(wǎng)易新聞 查看精彩圖片

為了驗(yàn)證是否是DeepSeek本身能力不足,我決定請(qǐng)出我心中的 “優(yōu)等生” Claude 來做對(duì)比測(cè)試。 結(jié)果證明,Claude依然穩(wěn)定可靠,不僅精準(zhǔn)地抓住了張濤老師提到的關(guān)鍵點(diǎn),還在總結(jié)的深度和廣度上都更勝一籌, Claude的總結(jié)如下:

打開網(wǎng)易新聞 查看精彩圖片

我將Claude的總結(jié)列在下面,因?yàn)檫@個(gè)總結(jié)也是對(duì)DeepSeek當(dāng)下成功原因比較全面的總結(jié)了:

根據(jù)對(duì)話內(nèi)容,以下是deepseek成功和與眾不同的關(guān)鍵特點(diǎn):

技術(shù)創(chuàng)新方面:

  1. 在V3版本就實(shí)現(xiàn)了重要技術(shù)突破,使用工程和算法結(jié)合的創(chuàng)新方法,在算力受限情況下達(dá)到了GPT-4和Claude 3.5級(jí)別的基礎(chǔ)模型能力
  2. 首創(chuàng)將推理模型(reasoning model)和搜索(search)功能結(jié)合,提供了全新的用戶體驗(yàn)
  3. 創(chuàng)新性地解決了S800芯片內(nèi)存帶寬不足的問題,通過特殊的工程優(yōu)化方法提升性能
  4. 在資源受限條件下實(shí)現(xiàn)了高性能,展示了極強(qiáng)的工程創(chuàng)新能力

商業(yè)模式方面:

  1. 完全開源(MIT協(xié)議),打破了之前閉源模型的壟斷格局
  2. 母公司換方資金實(shí)力強(qiáng),可以不急于商業(yè)化,專注技術(shù)突破
  3. 沒有外部投資人約束,可以更專注于技術(shù)創(chuàng)新

影響力方面:

  1. 在短短十幾天內(nèi)實(shí)現(xiàn)爆火,用戶量超過了其他投入巨資的產(chǎn)品
  2. 獲得了包括之前對(duì)中國(guó)AI持懷疑態(tài)度的國(guó)際意見領(lǐng)袖的認(rèn)可
  3. 打破了"只有投入huge算力才能做好
  4. 引發(fā)了全球AI產(chǎn)業(yè)的深度討論和反思

獨(dú)特優(yōu)勢(shì):

  1. 作為中國(guó)團(tuán)隊(duì),在當(dāng)前地緣政治背景下反而更適合做純技術(shù)創(chuàng)新
  2. 技術(shù)實(shí)力獲得全球認(rèn)可,改變了此前國(guó)際社會(huì)對(duì)中國(guó)AI的認(rèn)知
  3. 展示了不同于主流商業(yè)路線的技術(shù)理想主義道路的可行性

這次成功引發(fā)了對(duì)AI發(fā)展路徑、商業(yè)模式、技術(shù)創(chuàng)新等多個(gè)層面的深度反思和討論,具有重要的里程碑意義。

寫在最后。

一番對(duì)比測(cè)試下來,DeepSeek R1 的 “推理能力” 和 “文字質(zhì)量” 依然可圈可點(diǎn),如果讓它發(fā)揮增加故事性,也稱得上足夠驚艷。但要論 “總結(jié)歸納” 技能,至少?gòu)倪@次測(cè)試來看,它還有明顯的提升空間。 當(dāng)然,這僅僅是我讓ima以及DeepSeek與本地知識(shí)庫(kù)搭檔的 “初體驗(yàn)”, 或許在未來的迭代中,ima和DeepSeek會(huì)給我們帶來更大的驚喜。 狂人馬斯克已加入廝殺,我們也該加油了!無論如何,AI的進(jìn)化速度,今年還會(huì)繼續(xù)超出我們的想象,不是嗎?