在AI領(lǐng)域存在著“規(guī)模定律”,即模型性能會隨著模型參數(shù)、訓(xùn)練數(shù)據(jù)和算力的指數(shù)級增長而線性提高。過去幾年,AI模型主要通過預(yù)訓(xùn)練階段的規(guī)模堆積來提升能力,但這一路徑逐漸因數(shù)據(jù)耗盡和合成數(shù)據(jù)質(zhì)量問題而放緩,讓市場一度陷入了大模型發(fā)展滯緩、陷入瓶頸的懷疑。
在這一關(guān)鍵時刻,DeepSeek-R1橫空出世,通過精心設(shè)計訓(xùn)練流程和應(yīng)用新算法,極大地提高了算力使用效率,有效解決了產(chǎn)業(yè)發(fā)展的痛點,僅投入557.6萬美元,借助2048塊英偉達(dá)H800GPU,就完成了性能可對標(biāo)GPT-4o的模型訓(xùn)練,成本僅為OpenAI同類模型的十分之一,推理成本更是低至每百萬Token0.14美元,而OpenAI則高達(dá)7.5美元每百萬Token,讓用戶能用更低成本享受到近乎頭部模型的體驗。
DeepSeek的顛覆性意義深遠(yuǎn):它打破了以往算力和芯片投資“大力出奇跡”的固有觀念,告訴市場:AI競賽不只是芯片納米級技術(shù)的比拼,而是算法效率、生態(tài)活力與政策彈性的多維度較量。同時,通過成本優(yōu)勢和開源策略,實現(xiàn)了一定程度的AI平權(quán):在OpenAI等閉源模型禁止用戶蒸餾模型時,DeepSeek成功追趕,并將創(chuàng)新成果全部開源、鼓勵業(yè)界基于其成果進(jìn)行蒸餾,或許這才是真正的“OpenAI”。
其創(chuàng)始人梁文鋒曾表示:“我們希望更多人,哪怕一個小app都可以低成本去用上大模型,而不是技術(shù)只掌握在一部分人和公司手中,形成壟斷”。
在“規(guī)模定律”放緩的大背景下,DeepSeek成功追趕OpenAI等全球領(lǐng)先的模型,讓中美之間的大模型技術(shù)差距進(jìn)一步縮小,也得以讓外資重視起處于估值洼地的中國資產(chǎn),前期因中美芯片限售估值承壓的中國互聯(lián)網(wǎng)資產(chǎn)價值得到顯著提升。高盛發(fā)布研報稱:DeepSeek的崛起,為中概科技股帶來了中長期價值重估的機會;德意志銀行表示,2025年將是中國企業(yè)在全球崛起的一年,中國股票估值折價的現(xiàn)象將消失。
大多數(shù)全球AI從業(yè)者對于DeepSeek低價策略和開源的反應(yīng)是:興奮、激動,因為它大幅降低了AI技術(shù)的應(yīng)用門檻,讓下游企業(yè)和開發(fā)者能夠以低成本使用先進(jìn)的AI技術(shù),將AI行業(yè)推動進(jìn)入了一個更加開放、低成本、高普及率的新階段。早在之前,其創(chuàng)始人梁文鋒就曾表示:“希望構(gòu)建一種生態(tài),由DeepSeek負(fù)責(zé)基礎(chǔ)模型和前沿創(chuàng)新,其他公司在此基礎(chǔ)上開展toB、toC業(yè)務(wù)”。
DeepSeek通過“低成本+高性能+開源”組合,將推動各行業(yè)AI應(yīng)用的快速滲透與商業(yè)化落地:主要體現(xiàn)在技術(shù)普惠(降低門檻)、效率提升(開發(fā)與運營優(yōu)化)和生態(tài)共建(開源社區(qū)繁榮)三方面,同時重構(gòu)全球AI競爭格局,加速端側(cè)智能與行業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程。
熱門跟貼