國(guó)產(chǎn)大模型DeepSeek超越ChatGPT,登頂蘋果中國(guó)和美國(guó)應(yīng)用商店免費(fèi)APP下載排行榜,成為了全球科技圈的熱議話題。

DeepSeek登頂蘋果美國(guó)區(qū)免費(fèi)APP下載排行榜

1月27日,蘋果App Store中國(guó)區(qū)免費(fèi)榜顯示,DeepSeek站上首位。同時(shí),DeepSeek在美區(qū)蘋果App Store免費(fèi)榜從昨日的第六位飚升至第一位,超越ChatGPT及Meta公司旗下的社交媒體平臺(tái)Threads,以及Google Gemini、Microsoft Copilot等美國(guó)科技公司的生成式AI產(chǎn)品。

打開網(wǎng)易新聞 查看精彩圖片

DeepSeek爆火后曾出現(xiàn)兩次宕機(jī)。

1月26日,DeepSeek曾出現(xiàn)短時(shí)閃崩現(xiàn)象。對(duì)此,DeepSeek回應(yīng)稱,當(dāng)天下午確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問量激增,服務(wù)器一時(shí)無法滿足大量用戶的并發(fā)需求。

今日又有消息稱DeepSeek服務(wù)狀態(tài)頁(yè)面顯示,DeepSeek網(wǎng)頁(yè)/API不可用,目前正在調(diào)查該問題。

和國(guó)內(nèi)AI公司背靠互聯(lián)網(wǎng)大廠不同,DeepSeek由量化對(duì)沖基金幻方量化運(yùn)營(yíng)。2016年,幻方量化推出首個(gè)AI模型,第一份由深度學(xué)習(xí)生成的交易倉(cāng)位上線執(zhí)行。到2017年底,幾乎所有的量化策略都采用AI模型計(jì)算。2023年,幻方量化宣布成立創(chuàng)新性大模型公司DeepSeek。

2024年12月,DeepSeek-V3首個(gè)版本上線,并同步開源,訓(xùn)練成本僅為557.6萬美元,整個(gè)訓(xùn)練只需要280萬個(gè)GPU小時(shí)。

1月20日,DeepSeek又正式開源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena綜合榜單上排名第三,與OpenAI的頂尖推理模型o1并列。

從硅谷到華爾街,DeepSeek掀起漣漪

DeepSeek的影響迅速蔓延至大洋彼岸的硅谷。據(jù)澎湃新聞援引Information網(wǎng)站報(bào)道,臉書母公司Meta成立了四個(gè)專門研究小組來研究量化巨頭幻方量化旗下的國(guó)產(chǎn)大模型DeepSeek的工作原理,并基于此來改進(jìn)旗下大模型Llama。

DeepSeek之所以引發(fā)科技圈關(guān)注最主要的原因在于其以極小的成本訓(xùn)練出能和OpenAI的ChatGPT 一較高下的人工智能大模型。

據(jù)每日經(jīng)濟(jì)新聞報(bào)道,DeepSeek的R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,僅是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。同時(shí),DeepSeek公布了API的定價(jià),每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。這個(gè)收費(fèi)大約是OpenAI o1運(yùn)行成本的三十分之一。

打開網(wǎng)易新聞 查看精彩圖片

受此消息影響,華爾街也作出相應(yīng)反應(yīng)。

據(jù)21世紀(jì)經(jīng)濟(jì)報(bào)道,美股大V“THE SHORT BEAR”在社交媒體上表示,DeepSeek創(chuàng)造了一個(gè)AI巨頭們的痛苦時(shí)刻,而投資者必須對(duì)此敲響警鐘。

“如果擊敗OpenAI所需要的金額是5500萬美元(包括5000個(gè)H800 GPU和500萬預(yù)訓(xùn)練費(fèi)用),那么這個(gè)行業(yè)的商業(yè)化會(huì)比很多人預(yù)想的要快很多。”

1月25日,AMD宣布,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型旨在與SGLang一起實(shí)現(xiàn)最佳性能。DeepSeek-V3針對(duì)Al推理進(jìn)行了優(yōu)化。這對(duì)于在AI競(jìng)賽時(shí)代一直頗為風(fēng)光的英偉達(dá)略顯尷尬。

據(jù)財(cái)聯(lián)社報(bào)道,本周一,在亞洲盤交易時(shí)段,美國(guó)股指期貨大跌,而這背后的主要原因,可能就是華爾街人士們擔(dān)心DeepSeek的AI模型可能會(huì)顛覆美國(guó)科技界。

與此同時(shí),在日本東京股市,英偉達(dá)的主要供應(yīng)商Advantest Corp.的股價(jià)一度暴跌了8.6%。

本土陣容打造國(guó)產(chǎn)大模型黑馬,實(shí)習(xí)生日薪最高上千元

1月26日,《黑神話:悟空》制作人馮驥評(píng)價(jià)DeepSeek:可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。

打開網(wǎng)易新聞 查看精彩圖片

而這一科技成果背后是一個(gè)完全本土化的陣容,據(jù)大象新聞報(bào)道,DeepSeek團(tuán)隊(duì)不到 140 人,但 “人才密度” 極高,成員多是來自清華、北大、北航等頂尖高校的應(yīng)屆博士畢業(yè)生、在讀生以及碩士生。值得一提的是,團(tuán)隊(duì)沒有“海歸”,完全本土人才。

“我們的核心技術(shù)崗位主要由今年或過去一兩年畢業(yè)的人員擔(dān)任”,DeepSeek創(chuàng)始人梁文峰在2023年接受媒體采訪時(shí)表示。

此前,DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉就曾被雷軍以千萬年薪招攬。

DeepSeek爆火后,媒體也發(fā)現(xiàn)DeepSeek正在招聘。招聘網(wǎng)站顯示,DeepSeek的北京子公司正在招人,現(xiàn)共放出了52個(gè)崗位,包括深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師以及資深ui設(shè)計(jì)師等,均為14薪。其中,薪資最高的為核心系統(tǒng)研發(fā)工程師(校招),薪資范圍為6萬元-9萬元;除此之外,大部分崗位的起薪在2萬元及以上。值得一提的是,該公司正在招聘實(shí)習(xí)生,AGI大模型實(shí)習(xí)生的工資為500元/天-1000元/天,數(shù)據(jù)百曉生實(shí)習(xí)生為500元/天-510元/天。

從OpenAi橫空出世,到DeepSeek以黑馬之姿震驚世界,AI時(shí)代一日一變,一切皆有可能。