
本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)綜合
亞洲對價格實惠的Nvidia替代品的需求正在增長。
美國芯片初創(chuàng)公司 SambaNova Systems 表示,亞洲對更實惠的人工智能解決方案的需求正在增長,以取代 Nvidia 昂貴的硬件,而中國 DeepSeek 等開源模型的出現(xiàn)為這種轉(zhuǎn)變增添了動力。
亞太地區(qū)副總裁 Toshinori Kujiraoka 表示:“亞太地區(qū)的需求顯著上升,尤其是今年?!?/p>
他表示,隨著企業(yè)尋求更便宜的 Nvidia 服務(wù)器替代品,以及像中國的 DeepSeek 這樣的易于使用的開源 AI 模型越來越受歡迎,SambaNova 的 AI 服務(wù)器解決方案在亞太地區(qū)的銷售額今年的增長速度是 2024 年的兩倍。
該公司沒有透露具體的銷售數(shù)字。
SambaNova 使用定制的 AI 芯片,其設(shè)計與 Nvidia 所推崇的 GPU 不同。定制芯片專為 AI 應(yīng)用量身定制,可在給定計算能力的情況下降低能耗。這使得該公司能夠以更具競爭力的價格提供產(chǎn)品。該公司銷售現(xiàn)場 AI 服務(wù)器,并通過云端提供計算能力。
除了定制芯片外,SamabaNova 的 AI 服務(wù)器還配備了 Meta 的 Llama 或 DeepSeek 等開源模型。該公司表示,客戶可以在一周內(nèi)部署預(yù)先訓(xùn)練好的 Llama 模型,而由于 Nvidia 的 AI 芯片過于流行,獲取這些芯片可能需要一年以上的時間。
能夠提供現(xiàn)場服務(wù)器使公司可以考慮在處理機密信息或敏感客戶數(shù)據(jù)的領(lǐng)域利用人工智能,例如核心銀行系統(tǒng)、金融機構(gòu)實時管理賬戶、交易和客戶記錄的中央平臺。
該公司最近向軟銀集團旗下電信公司軟銀公司旗下的一個未公開的數(shù)據(jù)中心投資了數(shù)十億日元,以增強其云服務(wù)。軟銀的數(shù)據(jù)中心將作為其計算中心,以滿足亞太地區(qū)的需求,并且該公司將繼續(xù)探索擴張機會。
副總裁表示,SambaNova 旨在滿足日益增長的易于部署的 AI 需求?!叭毡?、韓國和新加坡的企業(yè)一直在嘗試開發(fā)自己的生成式 AI 模型,但現(xiàn)在卻落后了,”他說道。盡管聘請了高薪工程師,“但他們的模型仍然難以達到 Llama 等開源替代方案的準確性。許多企業(yè)開始重新考慮采用開源 AI 模型是否更有意義?!?/p>
日本一家大型消費電子公司的AI技術(shù)人員表示,構(gòu)建自主研發(fā)的基礎(chǔ)模型(AI聊天機器人的基礎(chǔ)技術(shù))“風(fēng)險很高”,因為它需要十幾名高薪工程師,他們的收入遠高于普通員工。“技術(shù)進步如此之快,以至于人們懷疑在日本雇傭的工程師是否真的能夠長期留在公司,”這位工作人員說道。
Kujiraoka 補充道,DeepSeek 的崛起可能會加速向開源模型的轉(zhuǎn)變。這家中國初創(chuàng)公司今年早些時候震驚了科技界,其在某些功能上與 OpenAI 的聊天機器人相媲美,而成本僅為這家美國公司的一小部分。這引發(fā)了人們對 OpenAI 等封閉模型的技術(shù)進步能否在未來保持市場領(lǐng)先地位的質(zhì)疑。
SambaNova Systems 的芯片設(shè)計策略避開了目前主導(dǎo) AI 芯片需求的 GPU。相反,其芯片以更精簡的方式處理數(shù)據(jù),從而減少了數(shù)據(jù)存儲在芯片內(nèi)存中的時間。由于內(nèi)存使用是芯片能耗的主要貢獻者,因此與傳統(tǒng) GPU 相比,這種策略能夠?qū)崿F(xiàn)更快、更經(jīng)濟的 AI 處理。
該初創(chuàng)公司由 Rodrigo Liang 和斯坦福大學(xué)的教授于 2017 年創(chuàng)立,并于 2021 年獲得軟銀愿景基金的投資。
高盛預(yù)警:AI服務(wù)器市場“急剎車”
高盛最新發(fā)布的《全球科技:服務(wù)器總市場規(guī)模(TAM)更新報告》(GS-Global Tech Server TAM updates: Revising down AI Training Server outlook)指出,受產(chǎn)品迭代、供需不確定性及關(guān)稅風(fēng)險影響,2025-2026年AI訓(xùn)練服務(wù)器(尤其是機架級產(chǎn)品)的出貨量和市場規(guī)模預(yù)期被大幅下調(diào)。
高盛將2025年機架級AI訓(xùn)練服務(wù)器(以144 GPU等效計算)的出貨量從3.1萬臺下調(diào)至1.9萬臺,2026年從6.6萬臺降至5.7萬臺(Exhibit 2)。這一調(diào)整直接導(dǎo)致機架級服務(wù)器市場規(guī)??s水:2025年預(yù)期從880億美元腰斬至540億美元,2026年從1820億美元降至1560億美元(Exhibit 1)。
高盛認為雖然2025年第二季度對中國臺灣ODM/散熱供應(yīng)鏈來說將是強勁的季度,但高盛對全年出貨量持更為保守的態(tài)度,并預(yù)計產(chǎn)品轉(zhuǎn)型期可能在2025年第三季度再次對出貨量造成影響。
因此高盛相應(yīng)下調(diào)了中國臺灣ODM和散熱供應(yīng)鏈相關(guān)公司(廣達、鴻海、FII、緯創(chuàng)、艾維克、雙鴻)的目標(biāo)價,降幅在7%-21%之間,并將廣達電腦評級從"買入"下調(diào)至"中性"。此外,高盛認為對投資者而言,ASIC AI服務(wù)器相關(guān)企業(yè)表現(xiàn)普遍優(yōu)于GPU AI服務(wù)器供應(yīng)商,這一趨勢可能將持續(xù)。
高盛美國互聯(lián)網(wǎng)團隊預(yù)測,2025年美國頭部云服務(wù)商資本支出將同比增長41%,2026年放緩至15%;而中國云廠商2025年增速26%,2026年驟降至4%(Exhibit 4-5)。
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點,我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯(lián)系后臺。
熱門跟貼