散英魂寄千萬雄鷹翱翔神州,
盡智魄載十億慧芯呼喚華夏。
——《國務(wù)院給予江上舟同志挽聯(lián)》
01
前沿導(dǎo)讀
美國斯坦福大學(xué)政治學(xué)教授艾米·澤加特在訪談中表示,據(jù)美國研究人員發(fā)現(xiàn),在Deep Seek發(fā)表于國際平臺的論文當(dāng)中,其背后的論文參與者具有明顯的中國本土化特征。
根據(jù)最新的一篇論文顯示,該論文的參與者有200多位,在這200多位的參與者當(dāng)中,有100多人只在中國學(xué)習(xí)和工作過,沒有任何海外深造的經(jīng)歷。

02
中國模式
deep seek的爆發(fā),讓中美兩國的ai領(lǐng)域出現(xiàn)了動蕩。美國不斷通過在芯片技術(shù)、制造設(shè)備、合作模式等多個方面限制中國企業(yè)在ai技術(shù)上面的發(fā)展競爭力,并且禁止美國企業(yè)將算力芯片提供給中國企業(yè)。
在沒有了先進(jìn)算力芯片的供應(yīng)下,以deep seek為首的中國ai企業(yè)通過技術(shù)優(yōu)化、針對性的推理調(diào)整,在使用了較少訓(xùn)練成本的前提下實(shí)現(xiàn)了與open ai相近的大模型性能。
deep seek的V3和R1兩款大模型技術(shù),其算力性能與訓(xùn)練成本都有著明顯優(yōu)勢。根據(jù)聊天機(jī)器人競技場的數(shù)據(jù)顯示,V3大模型在開源的排名當(dāng)中位列第一,在全模型的排名當(dāng)中位列第七,是中國大模型技術(shù)當(dāng)中排名最高的技術(shù)。

deep seek優(yōu)秀的表現(xiàn),對美國硅谷的ai技術(shù)領(lǐng)域產(chǎn)生了沖擊。
其優(yōu)秀表現(xiàn)的背后,是來自于中國國內(nèi)的一批高水平的年輕工程師。
根據(jù)北京大學(xué)新聞網(wǎng)的官方報道顯示,在deep seek團(tuán)隊當(dāng)中,羅福莉、邵智宏、朱琪豪、趙成鋼等關(guān)鍵的技術(shù)工程師,都是來自于中國本土的高學(xué)歷人才,并且許多人都曾經(jīng)通過在國家級科學(xué)競賽當(dāng)中的優(yōu)秀成績,而被國內(nèi)的高??粗?,重點(diǎn)培養(yǎng)。

deep seek的團(tuán)隊規(guī)模不大,只有將近140個人。無法與谷歌、微軟、英偉達(dá)等國際ai巨頭的企業(yè)規(guī)模相比,但是中國的ai團(tuán)隊貫徹了少而精的發(fā)展模式。
deep seek內(nèi)部負(fù)責(zé)訓(xùn)練推理架構(gòu)的趙成鋼,他曾經(jīng)在英偉達(dá)實(shí)習(xí)過,但是后來選擇放棄英偉達(dá)提供的全職工作機(jī)會,加入了deep seek。

大模型訓(xùn)練團(tuán)隊的負(fù)責(zé)人吳俁,他在進(jìn)入deep seek之前,任職于微軟亞洲研究院。微軟公司研發(fā)的人工智能小冰項目,其中就有他的參與。
deep seek團(tuán)隊的人員規(guī)模雖然不大,但是內(nèi)部的工程師和研發(fā)人員,大部分都是來自于清華北大等國內(nèi)的頂尖高校,有海外教育背景的人員數(shù)量較少,而且很多都是新人,并沒有從ai大企業(yè)工作過的經(jīng)驗(yàn)。
對于這種大膽采用新人的冒險做法,deep seek創(chuàng)始人梁文鋒解釋道:
我們的核心技術(shù)崗位,基本以應(yīng)屆和畢業(yè)一兩年的人為主。做一件長期的事,經(jīng)驗(yàn)其實(shí)沒那么重要,相比之下基礎(chǔ)能力、創(chuàng)造性和熱愛等更重要?;蛟S目前世界排名前50的頂尖AI人才還不在中國,但我們能自己打造這樣的人。
03
打造環(huán)境
梁文鋒對于公司發(fā)展的導(dǎo)向思維明確,那就是先打造一個良好的技術(shù)研發(fā)環(huán)境,然后做好打持久戰(zhàn)、走持續(xù)技術(shù)開發(fā)的發(fā)展思想。對于技術(shù)的長遠(yuǎn)化發(fā)展,需要有創(chuàng)造力的科研人員加入進(jìn)來。想要激發(fā)技術(shù)人員的創(chuàng)造力,其個人對于技術(shù)領(lǐng)域的興趣占核心因素。

只有真正熱愛ai技術(shù)的工程師,才能深入到整個技術(shù)的研發(fā)當(dāng)中,將大量有共同興趣的人聚集在一起,一起推動國產(chǎn)ai技術(shù)的發(fā)展。
梁文鋒的人才吸引方法,與當(dāng)初硅谷的建立如出一轍。美國硅谷是全球先進(jìn)技術(shù)的聚集地,吸引了來自于海內(nèi)外的各領(lǐng)域人才。其吸引人才的核心原因,就是因?yàn)楣韫鹊目蒲蟹諊谩?/p>
美國澤加特博士對于中美兩國的人才競爭發(fā)表了個人看法,并且她還指出,曾經(jīng)許多人認(rèn)為外國人來到美國接受教育后,便留在美國工作,這是一個非常普遍的誤解?,F(xiàn)在中國有著非常不錯的科研環(huán)境,也有著許多高水平的學(xué)校,中國學(xué)生不需要再來到美國深造,中國本土的高校企業(yè),會培養(yǎng)出一批競爭力很強(qiáng)的技術(shù)人才。

晶體管發(fā)明人之一的巴丁,曾經(jīng)在七十年代后作為代表來到中國,與中國的科研人員進(jìn)行學(xué)術(shù)交流。但是巴丁在回到美國后,對中國的科研環(huán)境進(jìn)行了批評,他認(rèn)為,中國的技術(shù)環(huán)境達(dá)不到美國硅谷的水平,并且看不到發(fā)展的前途。

以當(dāng)時的情況來看,巴丁說的句句露骨,但是現(xiàn)在的情況卻截然不同。
deep seek的出現(xiàn),證明了除美國硅谷外,來自于中國的技術(shù)團(tuán)隊也可以開發(fā)出具有顛覆性的技術(shù)產(chǎn)品。并且deep seek在國內(nèi)掀起來了一陣凝聚國產(chǎn)人才的發(fā)展浪潮,一批來自于中國的科研團(tuán)隊,將會在未來去挑戰(zhàn)美國的技術(shù)霸權(quán)。
04
參考資料
《觀察者網(wǎng)》:
往期經(jīng)典回顧:20萬+閱讀量
往期經(jīng)典回顧:40萬+閱讀量
往期經(jīng)典回顧:100萬+閱讀量
熱門跟貼