當(dāng)?shù)貢r(shí)間3月17日-21日,英偉達(dá)GTC 2025在圣何塞舉辦。但是在這場盛會(huì)的演講嘉賓名單中,很難找到High-Flyer或DeepSeek的字樣。DeepSeek旗下幾個(gè)社交媒體賬號(hào)也靜悄悄的。外媒正在炒作DeepSeek員工海外出行安全問題。
High-Flyer即幻方量化,它旗下的AI團(tuán)隊(duì),也就是DeepSeek的前身,早在ChatGPT尚未發(fā)布的2022年春天,就受邀在臺(tái)上宣講自己用英偉達(dá)A100搭建的萬卡集群。直至2024年春天, 。最早賞識(shí)DeepSeek的巨頭,正是英偉達(dá)。
GTC2022,幻方AI的黃盼盼(時(shí)任幻方AI的CEO)與張毅超(時(shí)任幻方AI的CTO)受邀在英偉達(dá)GTC的“金融AI”論壇上,做了主題為“分時(shí)調(diào)度AI算力”的演講,介紹如何用A100構(gòu)建(當(dāng)時(shí)的)超大規(guī)模智算集群,及最大程度地從中榨取算力。
GTC2023,幻方AI第二次在GTC上介紹了這個(gè)基于A100的智算基礎(chǔ)設(shè)施及其技術(shù)進(jìn)展,主題為“按需分配的AI算力”。當(dāng)時(shí)演講者為幻方AI首席架構(gòu)師何鶯。
GTC2024,團(tuán)隊(duì)成員陳德里首次以幻方AI兼DeepSeek研究員的新身份首次亮相,開始聚焦于如何訓(xùn)練一個(gè)價(jià)值觀對(duì)齊解耦化的大模型,主題為“和而不同:大語言模型價(jià)值觀對(duì)齊解耦化”。

(來源:DeepSeek官方微信公眾號(hào),GTC2024視頻)
從當(dāng)時(shí)三場演講背景判斷,更像辦公室,演講嘉賓 大概率沒有前往現(xiàn)場。
以DeepSeek為代表的中國企業(yè),在這場大模型的浪潮中,發(fā)揮了越來越重要的作用。這次,英偉達(dá)還特別安排了中國AI日(China AI Day),超過40場各行各業(yè)的中文線上會(huì)議。但是,上面沒有出現(xiàn)DeepSeek的名字,也沒有High-Flyer的。
在1000多場會(huì)議日程(Session Catalog)中,也沒有搜索到它們作為演講嘉賓所屬單位出現(xiàn)。倒是在其他幾家國外廠商的會(huì)議內(nèi)容概要中,見到了好幾次提及DeepSeek貢獻(xiàn)的??雌饋?,DeepSeek很可能像巴黎人工智能峰會(huì)那樣, 。
英偉達(dá)的GTC,是全球AI界頂級(jí)峰會(huì)。這幾年來,人人都在跪求AI芯片,沒有特別情況,每家企業(yè)每個(gè)大佬都樂得給黃仁勛捧個(gè)場。DeepSeek是英偉達(dá)A100芯片在亞太市場的第一批大客戶之一,公司創(chuàng)始人梁文鋒還直呼公司最大的困難就是缺卡;黃仁勛則盛贊它的創(chuàng)新,進(jìn)一步推動(dòng)了全球?qū)ψ约褿PU的需求。而且,DeepSeek也沒有顛覆CUDA,它“魔改”PTX,只是讓它變得比黃仁勛宣傳的更好用。
直至2025年1月20日,特朗普總統(tǒng)就美國的馬丁·路德·金日當(dāng)天——一個(gè)紀(jì)念公正與平等的日子——DeepSeek開源了推理模型R1,先后震動(dòng)了硅谷、華爾街與華盛頓。美國最領(lǐng)先的OpenAI與Anthropic,一致攻擊DeepSeek,并且向白宮建言對(duì)中國實(shí)施更嚴(yán)格的芯片等技術(shù)禁運(yùn)。華盛頓的正在抓緊制定AI行動(dòng)計(jì)劃。
Anthropic的CEO阿莫迪(Dario Amodei),既不認(rèn)為DeepSeek本身是對(duì)手,還聲稱重點(diǎn)也不是特別針對(duì)他們,但繼續(xù)鼓吹對(duì)華芯片出口管制。OpenAI指控DeepSeek蒸餾了自己的知識(shí),又在AI行動(dòng)計(jì)劃建議中稱DeepSeek 。
美國各州各機(jī)構(gòu)已經(jīng)獨(dú)立行動(dòng)。1月底,德克薩斯州州長禁止在政府設(shè)備上使用DeepSeek應(yīng)用;弗吉尼亞、愛荷華和紐約等州,以及國防部、NASA等機(jī)構(gòu)紛紛跟進(jìn);聯(lián)邦層面也有議員推動(dòng)類似措施。
《華爾街日?qǐng)?bào)》透露,特朗普政府考慮過至少三個(gè)選擇。最容易的就是發(fā)布行政令,禁止政府雇員下載DeepSeek應(yīng)用;稍難一點(diǎn)的,就是將其從美國應(yīng)用商店下架。這兩者它們都對(duì)TikTok做過。最困難的就是限制美國本土云服務(wù)提供商向其客戶提供DeepSeek模型。
政策的不確定性,會(huì)影響英偉達(dá)的決策。黃仁勛遲遲未介紹替代H20的下一代中國縮水版正是如此。關(guān)于美國即將擴(kuò)大芯片禁令,限制H20向中國銷售的傳言不斷。美國政府對(duì)DeepSeek態(tài)度,也將影響英偉達(dá)的公開活動(dòng)。
不過,即使沒有GTC的舞臺(tái),開源社區(qū)都相信DeepSeek會(huì)繼續(xù)盡可能地開放、開源。它最近還舉辦了開源周,一連五天,手把手教大家,如何從計(jì)算到通信到存儲(chǔ),優(yōu)化基礎(chǔ)設(shè)施。
有好事者甚至傳言,DeepSeek會(huì)在17日開源R2,也就是GTC開幕當(dāng)天。但DeepSeek迅速否認(rèn)了。
熱門跟貼