打開網(wǎng)易新聞 查看精彩圖片

風(fēng)乍起,吹皺一池春水。2025年,DeepSeek引領(lǐng)的大模型風(fēng)潮激活了整個(gè)產(chǎn)業(yè)鏈,曾經(jīng)不溫不火的AI應(yīng)用市場(chǎng)也異?;鸨释悄芑?jí)的行業(yè)客戶更是躍躍欲試,帶動(dòng)AI私有化部署迅猛增長(zhǎng)。

打開網(wǎng)易新聞 查看精彩圖片

種種跡象表明,在技術(shù)降本、數(shù)據(jù)安全、業(yè)務(wù)轉(zhuǎn)型等多重因素的共振下,AI私有化部署將進(jìn)入高速發(fā)展期,有望形成覆蓋軟硬件銷售和全棧服務(wù)的萬(wàn)億級(jí)生態(tài)。

這是一條厚雪長(zhǎng)坡的超級(jí)賽道,但不同類型的客戶在征途中也面臨諸多挑戰(zhàn)。一方面,金融、醫(yī)療等重量級(jí)行業(yè)是AI私有化部署的中流砥柱,其核心業(yè)務(wù)亟需本地大模型的深度賦能,對(duì)算力基礎(chǔ)設(shè)施的高性能、低能耗寄予厚望;另一方面,大量的中小企業(yè)同樣是AI私有化部署的主力軍,其不僅需要高性價(jià)比大模型的鼎力支撐,更離不開推理服務(wù)器、AI一體機(jī)的迭代升級(jí)。

顯而易見(jiàn),當(dāng)AI私有化部署巨浪來(lái)襲,普惠的大模型并非獨(dú)舞者,算力底座也被推上風(fēng)口浪尖,必須經(jīng)受住紛繁場(chǎng)景的嚴(yán)峻考驗(yàn)。值得一提的是,大模型更需要高性能、高能效且可適應(yīng)復(fù)雜工作負(fù)載的新型算力。作為通用算力與AI算力的核心基石,CPU在變革浪潮中無(wú)疑扮演著舉足輕重的角色——無(wú)論是技術(shù)層面的不斷創(chuàng)新,還是對(duì)推理能力的持續(xù)加持,都將深刻影響AI在千行百業(yè)的落地進(jìn)程。

打開網(wǎng)易新聞 查看精彩圖片

誰(shuí)能真正為行業(yè)客戶提供澎湃的“芯”動(dòng)力?從早期的信息化建設(shè)到后來(lái)的數(shù)字化轉(zhuǎn)型,AMD EPYC始終是行業(yè)客戶的“貼心”伙伴,其第四代和第五代產(chǎn)品更像是為AI新時(shí)代量身定制的產(chǎn)品,堪稱各個(gè)行業(yè)進(jìn)行私有化部署、深化應(yīng)用創(chuàng)新的算力更優(yōu)解。

突破高性能與高能效無(wú)法兼得的兩難困境

對(duì)很多行業(yè)客戶而言,AI私有化部署常面臨兩難困境:為了加快核心業(yè)務(wù)與AI的融合速度,理應(yīng)選擇更高性能的算力底座;而追求高性能往往伴生難以承擔(dān)的高能耗,成本高企且無(wú)法達(dá)成綠色節(jié)能的預(yù)期目標(biāo)。

打開網(wǎng)易新聞 查看精彩圖片

盡管系統(tǒng)級(jí)產(chǎn)品可通過(guò)軟硬件優(yōu)化尋求性能與能耗間的動(dòng)態(tài)平衡,但要從根本上解決問(wèn)題,就必須追本溯源,在CPU等核心部件中謀求突破,為算力底座的躍遷奠定堅(jiān)實(shí)基礎(chǔ)。

在探索高性能與高能效兼得的道路上,第四代AMD EPYC是業(yè)界的開路先鋒。針對(duì)行業(yè)客戶的需求痛點(diǎn),其采用ZEN 4技術(shù)架構(gòu),IPC(每時(shí)鐘周期執(zhí)行指令數(shù))平均提升多達(dá)14%,更高的核心頻率促進(jìn)CPU整體性能大幅改善,可為金融等重點(diǎn)行業(yè)的AI私有化部署構(gòu)筑高性能底座;同時(shí),能效水平也處于領(lǐng)先地位,96核心的熱設(shè)計(jì)功耗只需360W,解除了很多行業(yè)客戶的后顧之憂。

翻過(guò)一座大山,還有更高的山峰等待跨越。AMD EPYC并未停止前行的腳步,第五代產(chǎn)品在高性能與高能效方面更上層樓。煥新上市的AMD EPYC 9005系列處理器配備多達(dá)192個(gè)“Zen 5”或“Zen 5c”核心,具有出色的內(nèi)存帶寬和性能,開創(chuàng)先河的小芯片架構(gòu)更成就高性能、高能效解決方案,可滿足性能優(yōu)先型、數(shù)據(jù)敏感型、綠色節(jié)能型等不同類型行業(yè)客戶的多元需求,助力企業(yè)解決AI私有化部署中的各種難題。

打開網(wǎng)易新聞 查看精彩圖片

值得關(guān)注的是,除了單機(jī)或多機(jī)的本地部署外,不少行業(yè)客戶還會(huì)建設(shè)規(guī)??捎^的私有云,滿足業(yè)務(wù)發(fā)展的需求。伴隨AI應(yīng)用的不斷深化,很多私有云數(shù)據(jù)中心的可用空間已接近飽和,電力也處于滿負(fù)荷運(yùn)轉(zhuǎn)狀態(tài)。AMD EPYC處理器憑借出色的性能和能效實(shí)現(xiàn)有效的工作負(fù)載整合,可在現(xiàn)有的數(shù)據(jù)中心內(nèi)騰出更多空間和電力來(lái)支持新的AI工作負(fù)載。

重塑AI推理爆發(fā)期的算力底座

如果說(shuō)化解高性能與高能效難以兼得的難題,是AI私有化部署開疆?dāng)U土的必要條件,那么在大模型迅速“下沉”、AI應(yīng)用全面爆發(fā)的關(guān)鍵節(jié)點(diǎn),為邁向深水區(qū)的AI推理找到適宜的算力平臺(tái),就變得尤為重要。

打開網(wǎng)易新聞 查看精彩圖片

事實(shí)上,從2024年起,AI推理的熱度就逐步升溫,但囿于算力成本、大模型效率等因素尚未達(dá)到“沸點(diǎn)”。低成本、高性能大模型的橫空出世無(wú)疑起到添薪加柴的作用——借助動(dòng)態(tài)推理、MoE架構(gòu)等算法創(chuàng)新,以及垂直領(lǐng)域優(yōu)化和生態(tài)建設(shè),AI推理效率得到2~3倍的提升,高性價(jià)比的解決方案點(diǎn)燃了行業(yè)客戶AI部署的熱情。

不過(guò),僅靠爆款大模型的單打獨(dú)斗還不足以讓AI推理登上巔峰,來(lái)自CPU等核心算力層的持續(xù)創(chuàng)新也是AI推理不斷進(jìn)化的原動(dòng)力。基于更高的CPU頻率、更快速高效的數(shù)據(jù)傳輸能力和更大的三級(jí)緩存,第四代AMD EPYC在AI推理領(lǐng)域已逐漸獲得廣泛認(rèn)可,為AI應(yīng)用的遍地開花做好了鋪墊。

機(jī)會(huì)總是留給有準(zhǔn)備的人。當(dāng)AI產(chǎn)業(yè)邁向新紀(jì)元,私有化部署蔚然成風(fēng),第五代AMD EPYC也應(yīng)運(yùn)而生,其既可打造性能出色的AI推理平臺(tái),又能勝任小型AI模型開發(fā)、測(cè)試和批量訓(xùn)練,可成為行業(yè)客戶攻堅(jiān)克難的利器。例如:在以FP32精度運(yùn)行XGBoost(Higgs數(shù)據(jù)集)時(shí),利用搭載192核AMD EPYC 9965處理器的雙路服務(wù)器機(jī)器學(xué)習(xí)吞吐量可大幅提升。

以持續(xù)的算力創(chuàng)新驅(qū)動(dòng)AI全面落地

不難看出,在AI私有化部署加速滲透的進(jìn)程中,大模型和基于CPU的算力底座堪稱“黃金搭檔”——不僅為更多行業(yè)客戶帶來(lái)普惠紅利,顯著降低大模型開發(fā)與AI應(yīng)用創(chuàng)新的門檻,而且探索出一條AI落地的嶄新路徑,讓算力與算法的協(xié)同進(jìn)化成為可能。

AI私有化部署的風(fēng)潮來(lái)勢(shì)迅猛,其間難免泥沙俱下,行業(yè)客戶唯有把握好航向,才能抵達(dá)智能化的彼岸。

從這個(gè)意義上講,第四代和第五代AMD EPYC猶如迷霧中的燈塔,以清晰的技術(shù)創(chuàng)新路線圖和務(wù)實(shí)的商業(yè)化策略,為行業(yè)客戶的數(shù)智化之旅保駕護(hù)航。除了為各種工作負(fù)載帶來(lái)領(lǐng)先性能和效率外,AMD EPYC還能幫助客戶在AI時(shí)代增強(qiáng)洞察能力、加快部署速度,進(jìn)而構(gòu)建起“CPU+”的全新算力生態(tài),讓AI落地不再遙遠(yuǎn)。

站在更開闊的視角,從底層算力基礎(chǔ)設(shè)施到中間層大模型,再到上層AI應(yīng)用,AI產(chǎn)業(yè)的整體架構(gòu)日趨成型,不同層級(jí)的良性互動(dòng)也漸入佳境。AI私有化部署只是打通AI產(chǎn)業(yè)鏈的一次“預(yù)演”,“芯”動(dòng)力未來(lái)的宏大敘事更值得期待。

作者關(guān)健,《IT創(chuàng)事記》合伙人、主筆:曾任《電腦商報(bào)》常務(wù)副社長(zhǎng)兼執(zhí)行總編、《中國(guó)計(jì)算機(jī)報(bào)》助理總編,媒體從業(yè)時(shí)間超過(guò)10年。

關(guān)健長(zhǎng)期關(guān)注科技產(chǎn)業(yè)動(dòng)態(tài)及趨勢(shì),與逾百位高科技公司領(lǐng)導(dǎo)者進(jìn)行過(guò)對(duì)話,亦在眾多科技會(huì)議與論壇中擔(dān)任嘉賓主持。

打開網(wǎng)易新聞 查看精彩圖片

—— 越看越精彩 ——

【IT創(chuàng)事記】聚焦于企業(yè)級(jí)科技生態(tài)、策略及商業(yè)知識(shí)。你可以在各主流媒體平臺(tái)看到IT創(chuàng)事記的同名文字專欄和【IT創(chuàng)事記·短視頻】專欄。如果你有相應(yīng)的內(nèi)容希望分享,記得在公眾號(hào)留言告訴我們。