2025年是AI應(yīng)用爆發(fā)的元年,當(dāng)全球AI競(jìng)賽步入“中國(guó)時(shí)刻”,一場(chǎng)深刻的技術(shù)變革正悄然改寫產(chǎn)業(yè)格局。在此關(guān)鍵節(jié)點(diǎn),行業(yè)面臨核心命題:如何跨越AI技術(shù)到規(guī)?;瘧?yīng)用的鴻溝?下一個(gè)顛覆性的AI超級(jí)應(yīng)用將誕生于何處?

4月18日,由36氪主辦的2025 AI Partner大會(huì)于上海模速空間盛大啟幕。本次大會(huì)以“Super APP來(lái)了”為主題,聚焦AI應(yīng)用對(duì)千行百業(yè)的顛覆性變革。大會(huì)分為“Super App來(lái)了”和“誰(shuí)是下一個(gè)超級(jí)應(yīng)用”兩大篇章,覆蓋“在AI世界中長(zhǎng)大”“2025卷AI就卷超級(jí)應(yīng)用”等七大話題,涵蓋10+場(chǎng)主題演講、3場(chǎng)圓桌對(duì)話與兩大優(yōu)秀AI案例企業(yè)名冊(cè)發(fā)布環(huán)節(jié),深度剖析AI技術(shù)如何重構(gòu)商業(yè)邏輯、重塑產(chǎn)業(yè)格局,探索AI超級(jí)應(yīng)用帶來(lái)的無(wú)限可能。

當(dāng)日,無(wú)問芯穹首席解決方案架構(gòu)師劉川林帶來(lái)了《以智能底座重構(gòu)AI產(chǎn)業(yè)生態(tài)》的主題分享。

以下為劉川林演講內(nèi)容,經(jīng)36氪整理編輯:

各位領(lǐng)導(dǎo)、嘉賓,下午好!非常榮幸受邀參與 36 氪的活動(dòng)。作為專注支撐 AI 超級(jí)應(yīng)用的AI算力運(yùn)營(yíng)商與基礎(chǔ)設(shè)施建造者,無(wú)問芯穹的技術(shù)能力覆蓋從算力優(yōu)化、模型開發(fā)到算法調(diào)優(yōu)的全鏈條,致力于為中國(guó) AI 市場(chǎng)構(gòu)建堅(jiān)實(shí)的技術(shù)底座,助力更多創(chuàng)新應(yīng)用破局而生。

打開網(wǎng)易新聞 查看精彩圖片

無(wú)問芯穹首席解決方案架構(gòu)師劉川林

今天的分享將圍繞三個(gè)核心展開:第一塊Infra 層的趨勢(shì)變革:探討模型開發(fā)、訓(xùn)練、推理環(huán)節(jié)的技術(shù)演進(jìn);第二塊無(wú)問芯穹的實(shí)踐路徑:解析我們?nèi)绾瓮ㄟ^技術(shù)創(chuàng)新培育 AI 超級(jí)應(yīng)用的生長(zhǎng)土壤;第三塊未來(lái)展望:挖掘行業(yè)需求,推動(dòng)跨時(shí)代 AI 原生應(yīng)用的誕生。

回顧人工智能的發(fā)展歷程,每一次重大突破都源于關(guān)鍵要素的升級(jí)。自GPT-3橫空出世以來(lái),在Scaling Law作用下,算法和算力都得到了空前的發(fā)展,而隨著公開可用的優(yōu)質(zhì)文本數(shù)據(jù)逐漸耗盡,Ilya就曾在去年預(yù)言,預(yù)訓(xùn)練時(shí)代即將結(jié)束。

以GPT系列為例,從GPT-4到GPT-5的迭代周期顯著拉長(zhǎng),預(yù)訓(xùn)練數(shù)據(jù)的稀缺性愈發(fā)凸顯。而DeepSeek的出現(xiàn),帶來(lái)了全新的技術(shù)范式——通過R1強(qiáng)化學(xué)習(xí),將訓(xùn)練、推理、對(duì)齊形成閉環(huán),實(shí)現(xiàn)模型性能的二次飛躍。其技術(shù)路徑可概括為:冷啟動(dòng)階段:基于R1 Zero模型,結(jié)合Reward Model和對(duì)齊算法完成初步強(qiáng)化;數(shù)據(jù)優(yōu)化階段:融入優(yōu)質(zhì)行業(yè)數(shù)據(jù)與通用數(shù)據(jù)集,提升模型泛化能力;閉環(huán)迭代:通過 “訓(xùn)練 - 推理 - 對(duì)齊 - 再訓(xùn)練” 的循環(huán),持續(xù)優(yōu)化模型表現(xiàn)。

這一變革對(duì) Infra 提出了雙重挑戰(zhàn):底層支撐:需構(gòu)建適配強(qiáng)化學(xué)習(xí)的AI Infra系統(tǒng),滿足大模型開發(fā)需求;應(yīng)用賦能:通過Infra優(yōu)化,幫助AI應(yīng)用實(shí)現(xiàn)更低延遲、更高效率、更優(yōu)成本,提升商業(yè)價(jià)(ROI)。

作為清華電子系孵化的企業(yè),我們依托軟硬件聯(lián)合優(yōu)化技術(shù)實(shí)力,構(gòu)建了貫穿上下游的技術(shù)生態(tài):算力層:融合多家國(guó)產(chǎn)芯片,通過異構(gòu)計(jì)算提供多樣化算力支持;平臺(tái)層(PaaS):打造高效易用的算力管理平臺(tái),提升資源調(diào)度效率;服務(wù)層(MaaS):提供穩(wěn)定的模型即服務(wù),降低應(yīng)用開發(fā)門檻。

在云端服務(wù)中,我們堅(jiān)持“三位一體”策略:多元異構(gòu)適配:兼容不同架構(gòu)芯片,保障算力彈性供給;軟硬協(xié)同優(yōu)化:深度整合硬件與軟件,釋放算力潛能;服務(wù)效能提升:通過智能化調(diào)度,確保資源高效利用。

受中美技術(shù)博弈與國(guó)產(chǎn)芯片崛起的影響,未來(lái)3年,國(guó)產(chǎn)芯片將成為大模型訓(xùn)練與推理的重要載體。為此,我們?cè)谏虾5鹊芈涞厍Э?jí)異構(gòu)混訓(xùn)任務(wù),攻克國(guó)產(chǎn)芯片兼容性難題,構(gòu)建“國(guó)產(chǎn)算力 + 國(guó)產(chǎn)應(yīng)用”的完整生態(tài)。通過統(tǒng)一調(diào)度框架,實(shí)現(xiàn)不同芯片間的協(xié)同計(jì)算,顯著提升訓(xùn)練效率。

針對(duì) DeepSeek 引發(fā)的計(jì)算范式變革,我們從三個(gè)維度優(yōu)化工程架構(gòu):訓(xùn)練框架創(chuàng)新:自研適配 LLM(語(yǔ)言模型)、MOE(混合專家模型)的訓(xùn)練框架,支持更高性能訓(xùn)練,并兼容多類型加速卡;通信效率優(yōu)化:通過計(jì)算與通信的深度重疊,減少數(shù)據(jù)傳輸延遲,在 MOE 模型訓(xùn)練中降低資源占用;動(dòng)態(tài)資源分配:基于MOE模型特性,實(shí)現(xiàn)專家模型的智能調(diào)度與PD 分離,提升整體架構(gòu)靈活性。

以生數(shù)科技為例,我們?yōu)槠涠嗄B(tài)模型訓(xùn)練提供一站式服務(wù):環(huán)境秒級(jí)啟動(dòng):快速部署訓(xùn)練環(huán)境,縮短項(xiàng)目周期;自動(dòng)化容錯(cuò):實(shí)時(shí)監(jiān)控訓(xùn)練過程,自動(dòng)處理異常情況;推理效率優(yōu)化:通過底層加速,提升模型部署后的響應(yīng)速度。

目前,我們已在上海模速空間落地算力生態(tài)服務(wù)平臺(tái),并在浙江省打造政企合作標(biāo)桿項(xiàng)目,通過技術(shù)支持,降低AI企業(yè)的創(chuàng)新成本。

在AI應(yīng)用場(chǎng)景中,推理效率直接影響用戶體驗(yàn)與商業(yè)價(jià)值。我們針對(duì)大語(yǔ)言模型與文生圖模型,推出定制化解決方案:以DeepSeek R1為例,其MOE架構(gòu)與FP8精度對(duì)部署資源要求極高。我們通過以下優(yōu)化實(shí)現(xiàn)效率突破:工程化改造:重構(gòu)服務(wù)框架,將推理速度提升至 30 Tokens / 秒;穩(wěn)定性保障:優(yōu)化調(diào)度算法,確保高并發(fā)場(chǎng)景下服務(wù)零中斷;效果對(duì)齊:在加速同時(shí)保持與官方模型的生成精度一致。用戶可通過我們的平臺(tái)一鍵調(diào)用R1服務(wù),大幅降低部署門檻。

針對(duì)AIGC應(yīng)用的流量波動(dòng)問題,我們基于 ComfyUI 構(gòu)建接口化服務(wù)。削峰平谷:動(dòng)態(tài)分配算力資源,避免流量低谷期的資源浪費(fèi);架構(gòu)解耦:通過標(biāo)準(zhǔn)化接口兼容新模型與框架,減少工程團(tuán)隊(duì)重復(fù)開發(fā);多模態(tài)支持:整合視頻、語(yǔ)音、圖文等多模態(tài)能力,實(shí)現(xiàn)全產(chǎn)業(yè)鏈無(wú)縫對(duì)接。實(shí)際案例顯示,某電商生圖企業(yè)采用我們的服務(wù)后,降低了成本,提升了推理速度,并且提升服務(wù)效能。

AI 技術(shù)的快速迭代中,唯有把握“變”與“不變”的平衡,方能搶占先機(jī):變:技術(shù)架構(gòu)、計(jì)算范式、模型形態(tài)持續(xù)演進(jìn);不變:用戶對(duì)高效、智能、個(gè)性化服務(wù)的核心需求始終存在。

我們期待與各行業(yè)專家深入交流,挖掘真實(shí)場(chǎng)景需求,共同推動(dòng) AI 原生應(yīng)用的創(chuàng)新突破。正如今天分享的嘉賓們所展現(xiàn)的,無(wú)論是電商商拍、教育賦能還是具身智能,每一個(gè)細(xì)分領(lǐng)域都蘊(yùn)藏著誕生超級(jí)應(yīng)用的潛力。我們?cè)敢运懔A(chǔ)設(shè)施為舟,與合作伙伴攜手,駛向 AI 產(chǎn)業(yè)的深水區(qū),打造跨時(shí)代的AI原生APP。