
4月1日-2日,一場(chǎng)全場(chǎng)干貨爆棚的生成式AI盛會(huì),在北京圓滿舉行。
開(kāi)年以來(lái),DeepSeek的異軍突起,改寫(xiě)了中西大模型競(jìng)爭(zhēng)敘事。生成式AI似乎猛然沖進(jìn)一個(gè)全新征程中,中國(guó)企業(yè)更是斗志昂揚(yáng)地踴躍創(chuàng)新,不僅領(lǐng)銜AI開(kāi)源盛世,還掀起了新一輪模型部署與AI應(yīng)用研發(fā)熱潮,在這千載難逢的歷史機(jī)遇期全速?zèng)_鋒。
為此,我們發(fā)起了一場(chǎng)聚焦前沿技術(shù)與產(chǎn)業(yè)趨勢(shì)的春日AI聚會(huì)——2025中國(guó)生成式AI大會(huì)(北京站)。
大會(huì)以“大拐點(diǎn) 新征程”為主題,兩天之內(nèi),超過(guò)50位產(chǎn)學(xué)研嘉賓密集輸出高濃度、高質(zhì)量的干貨信息,深度解構(gòu)DeepSeek引發(fā)的變革狂潮,全面展示覆蓋深度推理模型、多模態(tài)模型與世界模型、AI Infra(AI基礎(chǔ)設(shè)施)、AIGC應(yīng)用、Agents(智能體)、具身智能等領(lǐng)域的生成式AI最新進(jìn)展。

▲中國(guó)生成式AI大會(huì)主會(huì)場(chǎng)開(kāi)幕式、GenAI應(yīng)用論壇、大模型峰會(huì)、分會(huì)場(chǎng)技術(shù)研討會(huì)、展區(qū)人流密集
本屆大會(huì)主會(huì)場(chǎng)舉辦開(kāi)幕式、GenAI應(yīng)用論壇、大模型峰會(huì),分會(huì)場(chǎng)舉辦3場(chǎng)以DeepSeek R1與推理、AI智能體、具身智能大模型為主題的技術(shù)研討會(huì),期間既有同頻共振,又有激烈觀點(diǎn)交鋒,現(xiàn)場(chǎng)參會(huì)觀眾超過(guò)1500人。
展區(qū)亦是人頭攢動(dòng),從早到晚充斥著熱切的交流聲,Alluxio、Zenlayer、DriveNets、澳鵬數(shù)據(jù)、晴數(shù)智慧、中昊芯英、GMI Cloud、焱融科技、英博數(shù)科、華為云、研惠通、新晧誠(chéng)科技、楓清科技、科華數(shù)據(jù)、首都在線、清智圖靈等16家企業(yè)帶來(lái)最新技術(shù)產(chǎn)品展示。
這已經(jīng)是智一科技旗下智猩猩、智東西共同發(fā)起中國(guó)生成式AI大會(huì)的第四屆,也是AI青年學(xué)者密度最高的一屆。自2023年以來(lái),大會(huì)累計(jì)吸引了數(shù)千人線下參會(huì),線上觀看人次更是超過(guò)1000萬(wàn),成為國(guó)內(nèi)AI領(lǐng)域最具影響力的產(chǎn)業(yè)峰會(huì)之一。
▲聯(lián)想集團(tuán)Game of AI科普視頻在大會(huì)展播:聯(lián)想工廠制造控制塔MCT2.0,生成式AI在制造業(yè)首次落地
智一科技聯(lián)合創(chuàng)始人、CEO龔倫常在致辭環(huán)節(jié)宣布:今年,中國(guó)生成式AI大會(huì)正式升級(jí)為“智領(lǐng)未來(lái)”北京人工智能系列品牌活動(dòng)之一。
“智領(lǐng)未來(lái)”是北京市科委、中關(guān)村管委會(huì)打造的北京市人工智能領(lǐng)域的活動(dòng)品牌。此外,同樣作為“智領(lǐng)未來(lái)”北京人工智能系列品牌活動(dòng)之一的中國(guó)AI算力峰會(huì)將于今年6月在北京舉辦。
龔倫常還預(yù)告了將于今年舉辦的多個(gè)主題會(huì)議:4月底,中國(guó)汽車(chē)智能化創(chuàng)新峰會(huì)將在上海車(chē)展期間同步舉辦;9月,全球AI芯片峰會(huì)將在上海舉辦;11月,中國(guó)具身智能機(jī)器人大會(huì)將在深圳舉辦。歡迎感興趣的朋友們關(guān)注。
▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常致辭
一、開(kāi)幕式:突破大模型預(yù)訓(xùn)練瓶頸,為AI應(yīng)用爆發(fā)掃清障礙
進(jìn)入2025年,AI領(lǐng)域涌現(xiàn)哪些新關(guān)鍵詞?慢思考推理技術(shù)如何緩解大模型預(yù)訓(xùn)練瓶頸?怎樣讓機(jī)器人操作交互像跳舞一樣絲滑?Agents(智能體)落地企業(yè)需攻克哪些挑戰(zhàn)?國(guó)產(chǎn)算力怎么解鎖萬(wàn)卡集群難關(guān)?
在大會(huì)首日開(kāi)幕式上,產(chǎn)學(xué)研嘉賓圍繞深度推理模型、具身智能機(jī)器人、AI智能體、AI算力基礎(chǔ)設(shè)施、AI應(yīng)用,分享了對(duì)最新技術(shù)思路與推動(dòng)落地的觀察與思考。
1、人大趙鑫:慢思考推理技術(shù)如何緩解大模型預(yù)訓(xùn)練瓶頸?
中國(guó)人民大學(xué)高瓴人工智能學(xué)院教授趙鑫談道,大模型本質(zhì)上是一個(gè)條件概率生成模型,思維鏈會(huì)提升預(yù)測(cè)正確的可能性。
當(dāng)前訓(xùn)練模型性能增長(zhǎng)會(huì)出現(xiàn)邊際效益遞減,其中數(shù)據(jù)和算力是探索擴(kuò)展法則的主要限制,這也是為何當(dāng)下需要慢思考推理技術(shù)。
慢思考推理技術(shù)的基本思路是“搜索+學(xué)習(xí)”的結(jié)合,具體來(lái)看,包括基于多次采樣的方法、基于樹(shù)搜索的方法、基于SFT(監(jiān)督微調(diào))的方法、基于RL(強(qiáng)化學(xué)習(xí))的方法。
趙鑫教授團(tuán)隊(duì)在慢思考技術(shù)方面進(jìn)行了大量研究。在RL技術(shù)領(lǐng)域,找到可驗(yàn)證的訓(xùn)練數(shù)據(jù)非常重要,團(tuán)隊(duì)系統(tǒng)探索了類(lèi)R1模型的復(fù)現(xiàn)方法。
推理模型本質(zhì)上可以認(rèn)為是一個(gè)具備逐步推理/動(dòng)作規(guī)劃的“大腦”,未來(lái)推理模型可能會(huì)深刻影響現(xiàn)有智能體的設(shè)計(jì)模式。

▲中國(guó)人民大學(xué)高瓴人工智能學(xué)院教授趙鑫
2、清華許華哲:如何讓機(jī)器人的操作交互像跳舞一樣“絲滑”?
清華大學(xué)交叉學(xué)院助理教授、博導(dǎo)、星海圖聯(lián)合創(chuàng)始人許華哲談道,當(dāng)前機(jī)器人做跳舞、跑步、扭秧歌這類(lèi)事已經(jīng)很嫻熟了,有大量數(shù)據(jù)支撐,但在操作交互方面數(shù)據(jù)十分匱乏,還有很長(zhǎng)的路要走。
解決數(shù)據(jù)難題,讓機(jī)器人有觸覺(jué)是非常關(guān)鍵的,這樣數(shù)據(jù)才能更豐富,團(tuán)隊(duì)設(shè)計(jì)了仿真手套,可以讓機(jī)器人同步人手的操作。
有了數(shù)據(jù)還不夠,數(shù)據(jù)量也非常關(guān)鍵,為此,團(tuán)隊(duì)通過(guò)DemoGen的方式豐富數(shù)據(jù)量,借此機(jī)器人的泛化能力可以得到進(jìn)一步提升。相比傳統(tǒng)方式,通過(guò)DemoGen的方式獲得數(shù)據(jù)的速度快了上萬(wàn)倍。
未來(lái)讓機(jī)器人能夠泛化地去做更多的柔性操作,是團(tuán)隊(duì)努力的方向。
▲清華大學(xué)交叉學(xué)院助理教授、博導(dǎo)、星海圖聯(lián)合創(chuàng)始人許華哲
3、PINE AI李博杰:AI原生團(tuán)隊(duì)是組織形態(tài)的一場(chǎng)重大變革
PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰認(rèn)為,AI Agent在爆火的同時(shí),也面臨著企業(yè)知識(shí)孤島、GUI使用困難、缺少獨(dú)立測(cè)試環(huán)境、無(wú)法長(zhǎng)時(shí)間運(yùn)行等問(wèn)題。
要打造AI原生團(tuán)隊(duì),讓AI真正成為“數(shù)字員工”,需要為Agent打造類(lèi)似開(kāi)源社區(qū)的溝通文化,實(shí)現(xiàn)開(kāi)放透明的信息共享,并配備AI友好的團(tuán)隊(duì)協(xié)作工具接口、完善的測(cè)試環(huán)境與測(cè)試用例,同時(shí)讓每個(gè)員工都擁有AI助理。
從技術(shù)層面來(lái)看,未來(lái)Agent還需要在明晰需求、主動(dòng)溝通、主動(dòng)協(xié)作、長(zhǎng)期記憶、自我反思回溯與高精度內(nèi)部知識(shí)庫(kù)搜索等方面實(shí)現(xiàn)突破,才能真正實(shí)現(xiàn)從工具到團(tuán)隊(duì)成員的轉(zhuǎn)變。
▲PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰
4、壁仞科技丁云帆:64卡4TB顯存訓(xùn)練滿血DeepSeek-V3,異構(gòu)混訓(xùn)逐步邁向萬(wàn)卡集群
DeepSeek引爆了大模型落地元年。壁仞科技AI軟件首席架構(gòu)師丁云帆認(rèn)為,大模型落地需要工程和算法的協(xié)同創(chuàng)新,數(shù)據(jù)是燃料,算法是引擎,算力是加速器。
壁仞科技目前有萬(wàn)卡集群整體解決方案和智算生態(tài),希望通過(guò)軟硬協(xié)同&算法與工程協(xié)同,系統(tǒng)性地破解大模型算力難題:硬件集群算力方面,壁仞科技自主原創(chuàng)了GPU芯片架構(gòu),引領(lǐng)Chiplet技術(shù)趨勢(shì);軟件有效算力方面,有大模型訓(xùn)推一體平臺(tái),業(yè)界首次實(shí)現(xiàn)大模型訓(xùn)練自動(dòng)彈性擴(kuò)縮容。業(yè)界首創(chuàng)三級(jí)異步checkpoint,千卡集群千億參數(shù)可以實(shí)現(xiàn)自動(dòng)斷點(diǎn)續(xù)訓(xùn)小于5分鐘,大幅提升集群穩(wěn)定性。
大規(guī)模分布式優(yōu)化方面,壁仞科技針對(duì)國(guó)產(chǎn)GPU高效適配DeepSeek進(jìn)行了一系列技術(shù)優(yōu)化創(chuàng)新,64卡4096GB顯存即可支持DeepSeek-V3滿血版高效全參訓(xùn)練,而其他已公布方案至少需要256卡。
此外異構(gòu)聚合算力方面,壁仞科技自主原創(chuàng)了異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT,支持4種及以上異構(gòu)GPU協(xié)同訓(xùn)練同一個(gè)大模型,解決了異構(gòu)混訓(xùn)的關(guān)鍵技術(shù)挑戰(zhàn),已實(shí)現(xiàn)數(shù)千卡規(guī)模混訓(xùn),下一步將突破萬(wàn)卡混訓(xùn)。
▲壁仞科技AI軟件首席架構(gòu)師丁云帆
5、英諾天使基金王晟:AI應(yīng)用爆發(fā),需要新終端設(shè)備的出現(xiàn)
英諾天使基金合伙人王晟談道,2023年是大語(yǔ)言模型的爆發(fā)期,2024年則轉(zhuǎn)向多模態(tài)技術(shù),但2024年被寄予厚望的“AI應(yīng)用元年”并未如期而至,主要原因是缺乏新終端設(shè)備和新場(chǎng)景定義,當(dāng)前既有設(shè)備的場(chǎng)景需求已接近飽和。
▲英諾天使基金合伙人王晟
未來(lái),AI應(yīng)用的爆發(fā)可能需要于新終端設(shè)備、新計(jì)算能力的出現(xiàn)。能夠提供情緒價(jià)值的AI玩具和陪伴類(lèi)產(chǎn)品也擁有巨大的潛力,因?yàn)槿祟?lèi)為情緒價(jià)值買(mǎi)單的意愿非常強(qiáng)烈。
此外,AI公司的發(fā)展方向正從工具提供轉(zhuǎn)向智能代理,未來(lái)會(huì)成為“造人”的公司,讓AI能夠承擔(dān)更復(fù)雜的任務(wù),甚至取代人類(lèi)從事多種職業(yè)。2025年,AI領(lǐng)域的關(guān)鍵詞包括應(yīng)用、AI硬件、具身智能和世界模型,這些方向?qū)⒍x未來(lái)的技術(shù)和市場(chǎng)格局。
二、高端對(duì)話:中國(guó)AGI新征程全速起航,全產(chǎn)業(yè)鏈迎巨大發(fā)展機(jī)會(huì)
以《DeepSeek開(kāi)啟大模型下半場(chǎng) 中國(guó)AGI新征程全速起航》為主題的高端對(duì)話,由智一科技聯(lián)合創(chuàng)始人、智車(chē)芯產(chǎn)媒矩陣總編輯張國(guó)仁主持,彩云科技創(chuàng)始人兼CEO袁行遠(yuǎn),GMI Cloud創(chuàng)始人兼CEO Alex Yeh,PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰,智澄AI創(chuàng)始人及CEO胡魯輝,四位嘉賓分別作為AI應(yīng)用、算力云、Agent、具身智能企業(yè)代表進(jìn)行分享。

智一科技聯(lián)合創(chuàng)始人、智車(chē)芯產(chǎn)媒矩陣總編輯張國(guó)仁談道,今年春節(jié)以來(lái),從DeepSeek、人形機(jī)器人到通用Agent產(chǎn)品Manus,中國(guó)團(tuán)隊(duì)不斷造出現(xiàn)象級(jí)AI產(chǎn)品,2025年AI發(fā)展似乎進(jìn)入了“中國(guó)時(shí)刻”,隨著中國(guó)AGI新征程全速起航,中國(guó)市場(chǎng)、中國(guó)公司在全球AI格局扮演的角色和發(fā)展特征都備受關(guān)注。
▲智一科技聯(lián)合創(chuàng)始人、智車(chē)芯產(chǎn)媒矩陣總編輯張國(guó)仁
1、DeepSeek顯著提升成本效益
PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰認(rèn)為,DeepSeek-R1揭示了大模型訓(xùn)練的真實(shí)成本,讓世界了解到只要方法得當(dāng),便能訓(xùn)練出優(yōu)秀的模型。
GMI Cloud創(chuàng)始人兼CEO Alex Yeh談道,DeepSeek的開(kāi)源模型顯著降低了企業(yè)的部署成本,使企業(yè)能夠以低成本快速構(gòu)建應(yīng)用。
彩云科技創(chuàng)始人兼CEO袁行遠(yuǎn)更是用事實(shí)說(shuō)話,提到彩云科技旗下產(chǎn)品在切換到DeepSeek后,成本降低了90%,毛利率轉(zhuǎn)正。
▲彩云科技創(chuàng)始人兼CEO袁行遠(yuǎn)
2、中國(guó)開(kāi)源活躍度高,年輕人展現(xiàn)出后發(fā)優(yōu)勢(shì)
談及中美AI發(fā)展的差異,Alex Yeh觀察到,中國(guó)在開(kāi)源社區(qū)的活躍度和快速落地能力顯著優(yōu)于美國(guó),這也意味著中國(guó)在AI應(yīng)用爆發(fā)上會(huì)有巨大的機(jī)會(huì)。

▲GMI Cloud創(chuàng)始人兼CEO Alex Yeh
彩云科技旗下的產(chǎn)品正在出海。袁行遠(yuǎn)分享說(shuō),海外用戶對(duì)數(shù)據(jù)、隱私等問(wèn)題的關(guān)注度較高,與國(guó)內(nèi)用戶區(qū)別明顯。他認(rèn)為中國(guó)有望通過(guò)大量高質(zhì)量的人才儲(chǔ)備,在中美AI對(duì)決中取勝。
在李博杰看來(lái),AI行業(yè)領(lǐng)域知識(shí)獲取更便捷,對(duì)經(jīng)驗(yàn)的要求相對(duì)較少,使許多年輕的中國(guó)企業(yè)和研究者能展現(xiàn)出后發(fā)優(yōu)勢(shì)。
3、做基礎(chǔ)模型還是AI應(yīng)用?
針對(duì)做基礎(chǔ)模型還是AI應(yīng)用的選擇問(wèn)題,Alex Yeh認(rèn)為大廠偏重基礎(chǔ)模型的訓(xùn)練,而中小企業(yè)則應(yīng)專注于快速落地和應(yīng)用開(kāi)發(fā)。
AI訓(xùn)練需要消耗海量的數(shù)據(jù)與算力。智澄AI創(chuàng)始人及CEO胡魯輝相信,未來(lái)的創(chuàng)新將圍繞如何更高效地利用數(shù)據(jù)和算力展開(kāi),創(chuàng)業(yè)公司在未來(lái)十年也仍將有巨大的發(fā)展空間。

▲智澄AI創(chuàng)始人及CEO胡魯輝
彩云科技既做AI基礎(chǔ)研究,又開(kāi)發(fā)了彩云天氣、彩云小夢(mèng)等AI應(yīng)用。在袁行遠(yuǎn)看來(lái),在AI應(yīng)用落地的過(guò)程中,高性能底層模型已如“電力”般廣泛可及,行業(yè)重點(diǎn)逐漸從基礎(chǔ)算法轉(zhuǎn)變?yōu)閷?duì)應(yīng)用細(xì)節(jié)的極致追求。以天氣預(yù)報(bào)為例,通用AI模型無(wú)法敏銳地識(shí)別云圖中的細(xì)微變化和噪音,需要運(yùn)用大量的一線行業(yè)知識(shí)才能完美勝任。
4、未來(lái)兩年是垂直領(lǐng)域Agent的關(guān)鍵突破口
PINE AI正在打造能聽(tīng)、能看、能說(shuō)、能操作電腦的通用AI Agent,未來(lái)希望成為數(shù)字員工和個(gè)人助理。
李博杰說(shuō),Agent的形態(tài)正在變化,決策能力、通用性不斷增強(qiáng),未來(lái)兩年是垂直領(lǐng)域Agent的關(guān)鍵突破口,企業(yè)需要在這一階段積累品牌聲譽(yù)與網(wǎng)絡(luò)效應(yīng),為2027年左右通用Agent爆發(fā)做好準(zhǔn)備。
▲PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰
除了完成單一任務(wù)之外,通用Agent的價(jià)值還在于并行完成大量重復(fù)性工作,為生產(chǎn)、生活節(jié)省時(shí)間,提供便利。在李博杰看來(lái),這類(lèi)Agent有望在2025年初步落地,產(chǎn)生價(jià)值。
5、具身智能可能在五年內(nèi)實(shí)現(xiàn)
胡魯輝談道,大模型可能只是AI發(fā)展的一個(gè)階段性成果,AI發(fā)展正從生成式AI邁向物理智能,最終實(shí)現(xiàn)通用人工智能(AGI)。
李博杰也認(rèn)為,具身智能很有可能是AI到達(dá)甚至超過(guò)AGI的路徑。具身智能在與現(xiàn)實(shí)世界交互的過(guò)程中,獲得大量知識(shí)與數(shù)據(jù),助力模型能力持續(xù)提升。
Alex Yeh預(yù)測(cè)具身智能將在未來(lái)五年內(nèi)實(shí)現(xiàn),特別是在工業(yè)領(lǐng)域的應(yīng)用。
他提到多模態(tài)數(shù)據(jù)的整合將推動(dòng)AI向更高維度發(fā)展,為AGI的實(shí)現(xiàn)提供新的路徑。AI目前還缺少物理數(shù)據(jù),通過(guò)VR、AR等技術(shù)收集,并結(jié)合虛擬場(chǎng)景訓(xùn)練,可加速具身智能的發(fā)展。
針對(duì)近期資本退出人形機(jī)器人公司的爭(zhēng)議,胡魯輝相信行業(yè)共識(shí)能夠推動(dòng)科技發(fā)展、人類(lèi)進(jìn)步,堅(jiān)持長(zhǎng)期主義很重要,亞馬遜、微軟等大公司的成功都源于長(zhǎng)期堅(jiān)持。因此,投資應(yīng)注重長(zhǎng)期價(jià)值。
三、GenAI應(yīng)用論壇:從生活到企業(yè),如何用AI掀起生產(chǎn)效率變革?
伴隨著前沿模型快速迭代突破,AI應(yīng)用迎來(lái)前所未有的繁榮期,快速將AI技術(shù)轉(zhuǎn)化成能夠解決消費(fèi)級(jí)、生產(chǎn)級(jí)問(wèn)題,帶來(lái)實(shí)際價(jià)值的賦能工具。
在大會(huì)首日GenAI應(yīng)用論壇上,AI平臺(tái)、視頻生成、智算云、AI PPT、AI搜索、AI動(dòng)漫、端側(cè)芯片領(lǐng)域的嘉賓代表各抒己見(jiàn),剖析產(chǎn)業(yè)問(wèn)題,暢談落地思路,分享他們?cè)谡鎸?shí)應(yīng)用場(chǎng)景中的實(shí)踐經(jīng)驗(yàn)和對(duì)未來(lái)趨勢(shì)的研判。
1、楓清科技高雪峰:?jiǎn)我荒P蜔o(wú)法解決生產(chǎn)級(jí)問(wèn)題,AI落地產(chǎn)業(yè)有三要素
楓清科技Fabarta創(chuàng)始人兼CEO高雪峰認(rèn)為,單一產(chǎn)品、技術(shù)或模型難以解決復(fù)雜的生產(chǎn)級(jí)問(wèn)題,只有將各類(lèi)AI技術(shù)落地在企業(yè)、產(chǎn)業(yè)之中,帶來(lái)真正的高價(jià)值場(chǎng)景,融合為生態(tài)系統(tǒng),才能讓AI技術(shù)更富有生命力、更繁榮。
AI技術(shù)在產(chǎn)業(yè)中落地,有三個(gè)關(guān)鍵要素:知識(shí)引擎、行業(yè)大模型、智能體平臺(tái)。要把生成式AI技術(shù)應(yīng)用到產(chǎn)業(yè)端,最需要實(shí)現(xiàn)決策智能。
楓清科技采取了以數(shù)據(jù)為中心的AI平臺(tái)架構(gòu)落地的范式,還推出知識(shí)引擎和行業(yè)大模型雙輪驅(qū)動(dòng)的智能體平臺(tái),幫助企業(yè)實(shí)現(xiàn)多場(chǎng)景價(jià)值落地。該平臺(tái)通過(guò)多模態(tài)數(shù)據(jù)存儲(chǔ)和計(jì)算,智能化構(gòu)建企業(yè)知識(shí)庫(kù),支持精準(zhǔn)推理和復(fù)雜推理能力。
▲楓清科技Fabarta創(chuàng)始人兼CEO高雪峰
2、愛(ài)詩(shī)科技孫偉哲:視頻模型需兼顧趣味與速度,幫每個(gè)人成為生活的導(dǎo)演
愛(ài)詩(shī)科技是全球最早訓(xùn)練視頻生成大模型的團(tuán)隊(duì)之一,正以高頻的技術(shù)研發(fā)節(jié)奏,進(jìn)行底層模型的迭代。愛(ài)詩(shī)科技企服負(fù)責(zé)人孫偉哲分享說(shuō),針對(duì)短視頻時(shí)代用戶習(xí)慣的特點(diǎn),打造視頻生成模型需要兼顧趣味與速度,前者能促進(jìn)用戶的關(guān)注與傳播,而后者則是提升用戶體驗(yàn)的關(guān)鍵。
語(yǔ)言曾經(jīng)是傳遞信息的最好介質(zhì),但目前我們接受的大部分信息都來(lái)自于視頻。全球視頻創(chuàng)作需求已大量涌現(xiàn),日均視頻播放量達(dá)800億次,企業(yè)也需要通過(guò)AI技術(shù)實(shí)現(xiàn)視頻內(nèi)容生產(chǎn)的降本增效。愛(ài)詩(shī)科技希望通過(guò)視頻生成技術(shù),實(shí)現(xiàn)創(chuàng)作平權(quán),幫助每個(gè)人成為生活的導(dǎo)演。
愛(ài)詩(shī)科技的PixVerse是全球最早實(shí)現(xiàn)千萬(wàn)級(jí)MAU的視頻生成產(chǎn)品,并同步發(fā)力B端業(yè)務(wù),利用視頻生成技術(shù),為企業(yè)客戶在數(shù)字營(yíng)銷(xiāo)、信息流廣告、短劇創(chuàng)作與出海、游戲設(shè)計(jì)與開(kāi)發(fā)等領(lǐng)域提供助力,并提供了持續(xù)、精準(zhǔn)的運(yùn)營(yíng)服務(wù)。
▲愛(ài)詩(shī)科技企服負(fù)責(zé)人孫偉哲
3、GMI Cloud King Cui:推理服務(wù)成AI出海關(guān)鍵支撐,及時(shí)彈性擴(kuò)容是核心性能
GMI Cloud亞太區(qū)總裁King Cui談道,基礎(chǔ)模型能力提升和開(kāi)源生態(tài)的豐富,為AI應(yīng)用爆發(fā)提供了核心必要條件,這背后,為中國(guó)AI產(chǎn)品出海提供關(guān)鍵支撐的就是推理算力。
AI應(yīng)用往往會(huì)出現(xiàn)用戶規(guī)模和訪問(wèn)量短期暴漲等現(xiàn)象,因此提供及時(shí)性、擴(kuò)展性、穩(wěn)定性的推理服務(wù)至關(guān)重要。
GMI Cloud的目標(biāo)是打造更高性能的GPU推理云服務(wù),支持全球范圍自動(dòng)擴(kuò)縮容、一鍵部署推理模型、搭載自動(dòng)容錯(cuò)機(jī)制等。

▲GMI Cloud亞太區(qū)總裁King Cui
4、像素綻放PixelBloom蒲世林:AI帶來(lái)的效率革新符合發(fā)展趨勢(shì),需理性擁抱
像素綻放PixelBloom(AiPPT.com)聯(lián)合創(chuàng)始人蒲世林談道,隨著底層算力和模型層成本的顯著下降,AI應(yīng)用層迎來(lái)全面爆發(fā)的機(jī)遇。
像素綻放PixelBloom在AI PPT領(lǐng)域,通過(guò)ToC、To Partner ToC、ToB三種商業(yè)化路徑,既直接服務(wù)消費(fèi)者,也與頭部企業(yè)合作提升辦公效率;同時(shí)還開(kāi)放API能力,與聯(lián)想、釘釘?shù)扔布蛙浖S商深度集成,構(gòu)建開(kāi)放生態(tài),覆蓋辦公人群。
在進(jìn)軍海外市場(chǎng)時(shí),AiPPT.com注重做好本土化,提供多語(yǔ)言版本和本地化模板,滿足不同國(guó)家的市場(chǎng)需求,還通過(guò)孵化和并購(gòu)來(lái)擴(kuò)展產(chǎn)品矩陣。
在蒲世林看來(lái),AI技術(shù)帶來(lái)的效率革新符合人類(lèi)發(fā)展趨勢(shì),企業(yè)需理性擁抱AI,不低估但也別期待過(guò)高,通過(guò)實(shí)際應(yīng)用探索能力邊界,以抓住未來(lái)十年的AI紅利。
▲像素綻放PixelBloom(AiPPT.com)聯(lián)合創(chuàng)始人蒲世林
5、博查AI翁柔瑩:AI比人類(lèi)更需要搜索引擎
博查AI搜索聯(lián)合創(chuàng)始人兼CTO翁柔瑩認(rèn)為,AI時(shí)代,用戶的搜索習(xí)慣已由“關(guān)鍵詞搜索”轉(zhuǎn)變?yōu)椤白匀徽Z(yǔ)言對(duì)話”,內(nèi)容的生產(chǎn)、流動(dòng)、消費(fèi)也在發(fā)生變化,在AI為用戶整理、總結(jié)信息的過(guò)程中,內(nèi)容的消費(fèi)主體已經(jīng)變成了AI。
AI大模型的訓(xùn)練數(shù)據(jù)存在滯后性,必須通過(guò)聯(lián)網(wǎng)搜索來(lái)獲取最新的內(nèi)容,才能為用戶提供更好的信息服務(wù),從這一角度來(lái)看,AI比人類(lèi)更需要搜索引擎。
為AI打造的搜索引擎與傳統(tǒng)搜索引擎在架構(gòu)上有相似之處,依舊需要實(shí)時(shí)獲取高質(zhì)量信息。博查采用多模態(tài)混合搜索和語(yǔ)義排序技術(shù),能突破傳統(tǒng)搜索引擎的技術(shù)瓶頸,滿足大模型對(duì)于高質(zhì)量世界知識(shí)的需求,還打造了全球首個(gè)多Agent架構(gòu)的智能體搜索,為AI提供專業(yè)領(lǐng)域知識(shí)。
▲博查AI搜索聯(lián)合創(chuàng)始人兼CTO翁柔瑩
6、中文在線周立強(qiáng):AI降低動(dòng)漫短劇門(mén)檻,制作成本降低50%
中文在線AI動(dòng)漫部總經(jīng)理周立強(qiáng)談道,中國(guó)AIGC應(yīng)用市場(chǎng)正在加速發(fā)展,預(yù)計(jì)2024年至2028年年均復(fù)合增長(zhǎng)率將超過(guò)30%。作為勞動(dòng)密集型行業(yè),動(dòng)漫領(lǐng)域正受到AIGC相關(guān)工具的深刻影響。
傳統(tǒng)動(dòng)漫短劇制作通常包含原文理解、劇本改寫(xiě)等11個(gè)環(huán)節(jié),而AI已將流程壓縮至設(shè)定理解、生圖合成、后期處理等5個(gè)步驟。AI動(dòng)漫短劇的優(yōu)勢(shì)在于具備跨國(guó)傳播能力、支持工業(yè)化量產(chǎn),且制作成本顯著下降——單部作品的制作周期可縮短70%,成本降低約50%。
周立強(qiáng)指出,AI動(dòng)漫短劇已逐步突破單一流量變現(xiàn)階段。預(yù)計(jì)未來(lái)三年,掌握AIGC全鏈路能力的團(tuán)隊(duì)有望占據(jù)全球短劇市場(chǎng)30%以上的份額。
▲中文在線AI動(dòng)漫部總經(jīng)理周立強(qiáng)
7、光羽芯辰周強(qiáng):端側(cè)AI的發(fā)展促使手機(jī)架構(gòu)變革,可能孕育出新的大型公司
光羽芯辰創(chuàng)始人兼董事長(zhǎng)周強(qiáng)談道,過(guò)去幾年,AI經(jīng)歷了從低谷到高峰的周期,AI創(chuàng)新的核心在于實(shí)用性,只有當(dāng)技術(shù)可用且有價(jià)值時(shí),市場(chǎng)關(guān)注度才會(huì)提升。
早期AI應(yīng)用多局限于云端,而端側(cè)AI的興起使AI能夠深入生產(chǎn)生活各領(lǐng)域,比如應(yīng)用到工廠的機(jī)器人上,顯著提升生產(chǎn)力。大模型的出現(xiàn)增強(qiáng)了AI能力,但也暴露了硬件性能不足的問(wèn)題。
端側(cè)AI需要新的技術(shù)架構(gòu)以降低功耗、提升性能和帶寬。以手機(jī)為例,隨著AI未來(lái)的發(fā)展趨勢(shì),智能手機(jī)將進(jìn)化為AI手機(jī),將集成更多端側(cè)數(shù)據(jù),成為所有智能終端的中心,光羽芯辰的端側(cè)芯片以及創(chuàng)新的解決方案和架構(gòu)將極大的助力這一變革。
▲光羽芯辰創(chuàng)始人兼董事長(zhǎng)周強(qiáng)
8、Zilliz郭人通:對(duì)于Agent構(gòu)建,我們?nèi)绾斡行еС趾A繑?shù)據(jù)檢索,挖掘隱藏于長(zhǎng)尾的高價(jià)值信息?
Zilliz關(guān)注如何有效檢索海量數(shù)據(jù),發(fā)掘隱藏于長(zhǎng)尾的高價(jià)值信息。在OpenAI發(fā)布Deep Research功能之后,Zilliz也嘗試了復(fù)刻。
據(jù)Zilliz合伙人、產(chǎn)品總監(jiān)郭人通分享,對(duì)于Deep Research這類(lèi)Agent系統(tǒng),在數(shù)據(jù)基礎(chǔ)設(shè)施層面需要在數(shù)據(jù)建模、部署、緩存、多租、冷熱數(shù)據(jù)處理等方面做好優(yōu)化,聚焦信息檢索質(zhì)量,提高單位成本可支撐的檢索迭代輪次,以保證 Agent 對(duì)問(wèn)題的理解度以及對(duì)信息的挖掘深度。Zilliz目前已提供系統(tǒng)性解決方案。
對(duì)于提高查詢質(zhì)量,目前有一系列經(jīng)過(guò)生產(chǎn)驗(yàn)證的方法,包括查詢改寫(xiě),如多查詢條件生成、查詢拆解、意圖識(shí)別等,這有助于突破傳統(tǒng)RAG技術(shù)的搜索局限性。此外,帶正負(fù)樣本的查詢?cè)鰪?qiáng)、多模態(tài)搜索也能有效提升搜索質(zhì)量。
目前,許多企業(yè)已切入垂直Agent方向,海量領(lǐng)域數(shù)據(jù)也引發(fā)數(shù)據(jù)Infra的變革,基于S3構(gòu)建的數(shù)據(jù)Infra正逐漸獲得更多企業(yè)用戶的選用。今年下半年,Zilliz將推出面向AI應(yīng)用的數(shù)據(jù)湖解決方案,從五月開(kāi)始,Zilliz會(huì)面向業(yè)界進(jìn)行介紹,敬請(qǐng)關(guān)注。
▲Zilliz合伙人、產(chǎn)品總監(jiān)郭人通
四、大模型峰會(huì):判趨勢(shì),剖解法,全面直擊算法、算力、數(shù)據(jù)挑戰(zhàn)
大會(huì)第二天舉行的大模型峰會(huì),更加聚焦于大模型產(chǎn)業(yè)鏈底層技術(shù),從模型、中間件、云服務(wù)、知識(shí)圖譜、存儲(chǔ)、網(wǎng)絡(luò)、芯片、數(shù)據(jù)平臺(tái)等多維度切入,探討突破大模型算法、算力、數(shù)據(jù)關(guān)鍵瓶頸的可行路徑。
現(xiàn)場(chǎng),焱融科技首次發(fā)布了KV Cache在推理場(chǎng)景性能優(yōu)化數(shù)據(jù)。實(shí)測(cè)數(shù)據(jù)顯示:在長(zhǎng)上下文場(chǎng)景中,使用YRCloudFile KVCache可實(shí)現(xiàn)高達(dá)13倍的TTFT性能提升,延時(shí)縮短超4倍。
1、上交大戴國(guó)浩:全面直擊云邊端不同場(chǎng)景推理需求挑戰(zhàn),半分離式方案下周開(kāi)源
上海交通大學(xué)副教授、無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人戴國(guó)浩談道,真正能模仿人類(lèi)智力的模型往往是推理需求,但現(xiàn)有云側(cè)和端側(cè)很難滿足模型推理需求。
云側(cè)有PD融合式、PD分離式兩種技術(shù)路線,其中,PD融合式的技術(shù)路線將計(jì)算和存儲(chǔ)進(jìn)行融合的好處是內(nèi)存利用率更高、無(wú)需傳遞KV cache,但缺點(diǎn)是不同任務(wù)間干擾大;PD分離式技術(shù)路線,將計(jì)算和存儲(chǔ)資源分離的好處是計(jì)算單元容易隔離、抗干擾,但存儲(chǔ)冗余和不均衡會(huì)帶來(lái)額外開(kāi)銷(xiāo)。
因此,無(wú)問(wèn)芯穹取長(zhǎng)補(bǔ)短打造半分離式方案Semi-PD,實(shí)現(xiàn)計(jì)算分離存儲(chǔ)融合,Semi-PD將于一周后開(kāi)源整體代碼,月底開(kāi)源整個(gè)集群代碼,Semi-PD在一體機(jī)和分布式集群推理等場(chǎng)景下將帶來(lái)顯著性能提升。
其端側(cè)思路是通過(guò)輕量化方式讓終端負(fù)載變小,SpecEE技術(shù)引入機(jī)器學(xué)習(xí)、模型自適應(yīng)等,可以判斷是否在級(jí)聯(lián)結(jié)構(gòu)當(dāng)前層輸出了正確結(jié)果。該技術(shù)能無(wú)感兼容任何端側(cè)輕量化方案,整套代碼將在本月開(kāi)源。
▲上海交通大學(xué)副教授、無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人戴國(guó)浩
2、智澄AI胡魯輝:人形機(jī)器人“不好用”,與大模型數(shù)據(jù)挑戰(zhàn)有差別
智澄AI創(chuàng)始人兼CEO胡魯輝認(rèn)為,機(jī)器人將是未來(lái)AI生態(tài)中的重要組成部分,物理智能有望成為AI的下一波浪潮,實(shí)現(xiàn)更廣泛的通用人工智能。目前人形機(jī)器人泛化能力較差,直接導(dǎo)致成本高昂,歸根結(jié)底就是“不好用”。
與大模型一樣,物理智能面臨著數(shù)據(jù)、模型、環(huán)境、算力等方面的挑戰(zhàn),但挑戰(zhàn)的內(nèi)核有所區(qū)別。物理智能可用的數(shù)據(jù)量更少,需要在“機(jī)器人訓(xùn)練場(chǎng)”中采集數(shù)據(jù),機(jī)器人端側(cè)算力限制也對(duì)模型能效提出了要求。
智澄AI從世界模型的研發(fā)與人形機(jī)器人本體的打造兩個(gè)角度切入,打造的TR4機(jī)器人能以視覺(jué)+力度感知的方案實(shí)現(xiàn)物體抓握,無(wú)需依賴觸覺(jué)。
▲智澄AI創(chuàng)始人兼CEO胡魯輝
3、焱融科技張文濤:高性能全閃存儲(chǔ)在訓(xùn)練與推理中如何破解AI算力瓶頸?
焱融科技CTO張文濤分享說(shuō),針對(duì)大模型訓(xùn)練和推理的存儲(chǔ)解決方案,焱融科技通過(guò)Multi-Channel技術(shù)聚合多個(gè)網(wǎng)卡、帶寬等,提供高性能內(nèi)核私有客戶端,能夠滿足高性能元數(shù)據(jù)訪問(wèn)需求,為企業(yè)提供高效、靈活的存儲(chǔ)支持。
焱融科技在數(shù)據(jù)管理方面,采取智能分層和數(shù)據(jù)加載功能來(lái)優(yōu)化管理流程。此外,焱融科技順勢(shì)推出的DataInsight數(shù)據(jù)編排管理平臺(tái),幫助企業(yè)解決其應(yīng)用AI大模型中的海量歷史業(yè)務(wù)數(shù)據(jù)管理難題;支持多維度組合查詢,實(shí)現(xiàn)百億級(jí)數(shù)據(jù)秒級(jí)檢索。通過(guò)自研DataFlow技術(shù),用戶可自定義數(shù)據(jù)流動(dòng)策略,確保數(shù)據(jù)按需、快速嵌入業(yè)務(wù)流程。平臺(tái)還具備增量數(shù)據(jù)自動(dòng)感知能力,保障用戶從知識(shí)庫(kù)平臺(tái)訪問(wèn)時(shí)獲取最新數(shù)據(jù),進(jìn)一步提升數(shù)據(jù)流動(dòng)效率。
在運(yùn)維方面,焱融科技通過(guò)提供目錄集來(lái)做好多租戶管理和隔離,并設(shè)置了彈性數(shù)據(jù)網(wǎng)絡(luò),使一套存儲(chǔ)能夠支持多種網(wǎng)絡(luò)平面,并幫助管理員簡(jiǎn)化基礎(chǔ)設(shè)施建設(shè)。
其產(chǎn)品性能出色,依托于分布式元數(shù)據(jù)集群能夠支撐千億級(jí)海量文件,能夠支持高速無(wú)損網(wǎng)絡(luò)及多種接口,還適配多個(gè)國(guó)產(chǎn)化平臺(tái)。在本屆大會(huì)上,焱融科技還首次發(fā)布了KV Cache在推理場(chǎng)景性能優(yōu)化數(shù)據(jù)。
實(shí)測(cè)數(shù)據(jù)顯示:在長(zhǎng)上下文場(chǎng)景中,使用YRCloudFile KVCache可實(shí)現(xiàn)高達(dá)13倍的TTFT性能提升。在TTFT≤2秒的嚴(yán)苛約束下,其支持的并發(fā)數(shù)提升達(dá)8倍,且在高并發(fā)負(fù)載中延遲可降低4倍以上。張文濤談到Y(jié)RCloudFile KVCache可構(gòu)建PB級(jí)KVCache緩存層,有效突破GPU顯存限制,顯著提升緩存命中率與推理上下文長(zhǎng)度。
▲焱融科技CTO張文濤
4、Zenlayer陳秀忠:token洪流下算力網(wǎng)絡(luò)三大趨勢(shì),實(shí)時(shí)交互、分布式推理、高效IDC
Zenlayer行業(yè)拓展總監(jiān)陳秀忠談道,token是大模型世界的基礎(chǔ)單位,過(guò)去8個(gè)月,token使得整個(gè)網(wǎng)絡(luò)世界流量增長(zhǎng),達(dá)到移動(dòng)互聯(lián)網(wǎng)時(shí)代的3~4倍。
token的整個(gè)生命周期包括AI工廠生產(chǎn),再經(jīng)網(wǎng)絡(luò)傳輸給用戶,其在生產(chǎn)過(guò)程需要大量算力和電力,在傳輸和消費(fèi)環(huán)節(jié)需要靠近用戶的推理節(jié)點(diǎn)實(shí)現(xiàn)即時(shí)交互。
在token洪流下,未來(lái)的三個(gè)演進(jìn)趨勢(shì)包括實(shí)時(shí)交互的全球網(wǎng)絡(luò)、分布式推理的易用模型服務(wù)、高效的IDC?;诖?,Zenlayer構(gòu)建了覆蓋全球的專線網(wǎng)絡(luò)、覆蓋亞太地區(qū)的AI機(jī)房、在現(xiàn)有邊緣節(jié)點(diǎn)推出模型服務(wù)等。

▲Zenlayer行業(yè)拓展總監(jiān)陳秀忠
5、清程極智師天麾:如何打造國(guó)產(chǎn)模型與國(guó)產(chǎn)算力間的橋梁?
清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾分享說(shuō),在DeepSeek、QwQ等國(guó)產(chǎn)推理模型爆火之后,大模型私有化部署需求大幅度增加。在國(guó)外算力獲取困難、國(guó)產(chǎn)顯卡軟件生態(tài)不完善的背景下,打造連接國(guó)產(chǎn)模型與國(guó)產(chǎn)算力的橋梁尤為迫切。
清程極智已聯(lián)合清華大學(xué)開(kāi)源了赤兔推理引擎,支持在非Hopper架構(gòu)設(shè)備(如早期大部分英偉達(dá)GPU和大部分國(guó)產(chǎn)芯片)上原生運(yùn)行FP8模型,打破硬件綁定,提升算力使用效率,并能有效保留模型原有精度。
目前清程極智基于赤兔引擎推出多款大模型私有化部署方案,可根據(jù)不同場(chǎng)景需求提供針對(duì)性解決方案,結(jié)合企業(yè)業(yè)務(wù),提供從私有化部署到智能體開(kāi)發(fā)的一站式服務(wù)。
▲清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾
6、首都在線張振宇:以全棧國(guó)產(chǎn)化為特色,助攻生成式AI規(guī)?;涞?/strong>
首都在線集團(tuán)智算產(chǎn)品總經(jīng)理張振宇談道,隨著DeepSeek爆火,AI大模型國(guó)產(chǎn)化趨勢(shì)正在加速,推理市場(chǎng)將迎來(lái)大規(guī)模增長(zhǎng)。首都在線后續(xù)也會(huì)更聚焦于推理算力的布局。
此前首都在線智算云已成功應(yīng)用于多個(gè)生成式AI場(chǎng)景,如自然語(yǔ)言處理、圖像生成、視頻生成等,公司今年將持續(xù)優(yōu)化“一云多模、一云多芯、一云多池”的戰(zhàn)略布局,去構(gòu)建高度靈活的AI服務(wù)平臺(tái),我們的平臺(tái)不斷拓展支持的模型種類(lèi),為用戶提供更豐富的選擇,滿足不同場(chǎng)景需求。
首都在線Maas云平臺(tái)通過(guò)構(gòu)建云端協(xié)同調(diào)優(yōu)體系,以算力效能優(yōu)化為基礎(chǔ)、模型即服務(wù)(MaaS)平臺(tái)為核心,為AI開(kāi)發(fā)者及算力伙伴帶來(lái)創(chuàng)新性升級(jí),形成了閉環(huán)式技術(shù)解決方案,不僅有效提升了GPU利用率,降低了訓(xùn)練成本,能夠?yàn)榭蛻籼峁└痈咝?、靈活、低成本的算力服務(wù),還為大模型從實(shí)驗(yàn)室走向產(chǎn)業(yè)化提供了關(guān)鍵技術(shù)支撐。
▲首都在線集團(tuán)智算產(chǎn)品總經(jīng)理張振宇
7、海致科技李思宇:以圖為核心,打通大模型與多模態(tài)行業(yè)知識(shí)
海致科技技術(shù)總監(jiān)李思宇談道,大模型實(shí)際項(xiàng)目落地的Prompt提示詞工程,RAG檢索召回增強(qiáng)、Agent Function/Tool Call、SFT監(jiān)督微調(diào)訓(xùn)練四種基本方法,其關(guān)鍵是讓大模型結(jié)合多模態(tài)行業(yè)知識(shí)。
針對(duì)此,海致科技的思路是統(tǒng)一知識(shí)與數(shù)據(jù)認(rèn)知,其解決方案以圖為核心,結(jié)合工具將標(biāo)量數(shù)據(jù)和向量數(shù)據(jù)打通形成有機(jī)整體。
通過(guò)將大模型與知識(shí)圖譜融合,海致科技形成了基礎(chǔ)模型層、語(yǔ)義知識(shí)層、邏輯圖譜層、智能體應(yīng)用層,可基于基礎(chǔ)模型、元數(shù)據(jù)知識(shí)體系,在應(yīng)用層之上構(gòu)建智能體、工作流。
實(shí)際落地中,其解決方案接入警情案件等五情數(shù)據(jù),可融合跨不同事件、不同情報(bào)數(shù)據(jù),形成完整事件對(duì)象關(guān)系圖再以此進(jìn)行信息挖掘,實(shí)現(xiàn)匯聚非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)的整體圖譜。
▲海致科技技術(shù)總監(jiān)李思宇
8、中昊芯英朱國(guó)梁:Scaling Law延續(xù)下的AI芯片軟件棧重構(gòu)
中昊芯英軟件研發(fā)負(fù)責(zé)人朱國(guó)梁介紹,目前,Scaling Law正沿著測(cè)試時(shí)計(jì)算、強(qiáng)化學(xué)習(xí)與預(yù)訓(xùn)練三條路徑延續(xù)。需要不斷重構(gòu)AI芯片軟件棧來(lái)滿足新的算力挑戰(zhàn)。
對(duì)大部分廠商而言,超大Batch-Size依舊是優(yōu)先事項(xiàng),下一個(gè)Transformer級(jí)別的架構(gòu)尚未出現(xiàn)。
目前在推理方向優(yōu)化,探索方向包括KV緩存卸載、PD分離、稀疏注意力和MoE通信優(yōu)化等。
強(qiáng)化學(xué)習(xí)方面,隨著強(qiáng)化學(xué)習(xí)兩階段訓(xùn)練的范式形成,訓(xùn)練和推理協(xié)同調(diào)度需求不斷增長(zhǎng)。
預(yù)訓(xùn)練方面,需要在訓(xùn)練通信特征、訓(xùn)練通算重疊與訓(xùn)練容錯(cuò)等方面對(duì)現(xiàn)有軟件棧做出修改。
▲中昊芯英軟件研發(fā)負(fù)責(zé)人朱國(guó)梁
9、澳鵬董成:大模型愈往垂類(lèi)應(yīng)用端發(fā)力,對(duì)數(shù)據(jù)質(zhì)量要求愈高
澳鵬Appen中國(guó)及韓國(guó)區(qū)副總裁董成通過(guò)澳鵬在各領(lǐng)域大模型部署中數(shù)據(jù)訓(xùn)練的最佳實(shí)踐,重點(diǎn)分享了對(duì)大模型應(yīng)用趨勢(shì)的觀察。以AI Agent為代表,未來(lái),大模型必定應(yīng)用到具體的垂直領(lǐng)域中,比如金融、醫(yī)療、代碼、音樂(lè)、文學(xué)等。
這一趨勢(shì)對(duì)數(shù)據(jù)的高質(zhì)量、專業(yè)度、多垂類(lèi)提出了越來(lái)越高的要求。對(duì)此,澳鵬提供了多種AI輔助的前沿?cái)?shù)據(jù)采標(biāo)工具和方案,包括文本對(duì)話、多模態(tài)交互、思維鏈推理工具等。
董成認(rèn)為,AI大模型行業(yè)正經(jīng)歷顯著變化,Llama和DeepSeek等開(kāi)源模型在性能上逐漸趕上甚至超過(guò)閉源模型,一些企業(yè)也從閉源向著開(kāi)源方向轉(zhuǎn)變。同時(shí),大模型企業(yè)的研發(fā)越來(lái)越關(guān)注復(fù)雜任務(wù)方向,從最初的簡(jiǎn)單對(duì)話向模型推理、垂直領(lǐng)域應(yīng)用、多模態(tài)等方向發(fā)展。
▲澳鵬Appen中國(guó)及韓國(guó)區(qū)副總裁董成
10、云軸科技王為:AI實(shí)踐應(yīng)用分四級(jí),基礎(chǔ)設(shè)施構(gòu)建面臨四大挑戰(zhàn)
云軸科技CTO王為解讀了當(dāng)前AI基礎(chǔ)設(shè)施構(gòu)建面臨的挑戰(zhàn),包括模型尺寸增加、上下文窗口增加、全模態(tài)支持、多品牌算力支持等。
類(lèi)比自動(dòng)駕駛,AI實(shí)踐可對(duì)應(yīng)作為工具、作為參考建議、主導(dǎo)到端到端實(shí)踐的L1~L4級(jí)別。云軸科技已在AI輔助售后、代碼、文檔等方面有所應(yīng)用。其中AI輔助售后、代碼輔助處于參考建議階段,輔助文檔為主導(dǎo)階段,這背后凸顯出諸多基礎(chǔ)設(shè)施的構(gòu)建難題。
AI賦能企業(yè)內(nèi)部的技術(shù)架構(gòu)需要穩(wěn)固的智算底座、模型層,以及包含易用開(kāi)發(fā)、性能評(píng)測(cè)等工具的運(yùn)營(yíng)與應(yīng)用層。模型層的資源管理員主要關(guān)注底層資源使用情況,開(kāi)發(fā)者只需直接導(dǎo)入模型做精調(diào)、推理等賦能業(yè)務(wù)。

▲云軸科技CTO王為
11、Alluxio湯文軍:AI時(shí)代,高性能分布式緩存如何實(shí)現(xiàn)極致I/O優(yōu)化?
Alluxio解決方案架構(gòu)師湯文軍分享說(shuō),企業(yè)在搭建和優(yōu)化AI高性能數(shù)據(jù)訪問(wèn)平臺(tái)時(shí),面臨著數(shù)據(jù)方面的業(yè)務(wù)壓力、GPU稀缺昂貴且利用率不高、數(shù)據(jù)解決方案復(fù)雜等問(wèn)題。針對(duì)這些問(wèn)題,Alluxio推出了去中心化的Alluxio Enterprise AI產(chǎn)品方案。
具體來(lái)看,針對(duì)ML/AI GPU訓(xùn)練對(duì)I/O提出的諸多要求,Alluxio使用一致性哈希在worker節(jié)點(diǎn)上緩存數(shù)據(jù)與元數(shù)據(jù),這顯著減少了I/O RPC長(zhǎng)度,減少單點(diǎn)故障并降低了Master節(jié)點(diǎn)性能瓶頸;優(yōu)化性能時(shí),使用零拷貝優(yōu)化、并行與隨機(jī)讀優(yōu)化,解決了讀放大問(wèn)題。
最終,Alluxio實(shí)現(xiàn)了高性能、低延遲、高可用、容量線性擴(kuò)展等優(yōu)化效果,這套方案可應(yīng)用于數(shù)據(jù)預(yù)處理、模型訓(xùn)練、部署、推理等環(huán)節(jié),已在眾多場(chǎng)景實(shí)際落地,帶來(lái)GPU利用率、運(yùn)維成本等方面的顯著收益。

▲Alluxio解決方案架構(gòu)師湯文軍
12、澎峰科技張先軼:解讀AI算力部署進(jìn)階路,從一體機(jī)到專線模式
澎峰科技創(chuàng)始人&CEO張先軼分享說(shuō),用戶在AI算力部署上的策略通常從單機(jī)部署開(kāi)始,例如使用一體機(jī)。隨著需求的增長(zhǎng),用戶會(huì)逐步擴(kuò)展到私有化部署,通過(guò)MaaS平臺(tái)納管更多硬件設(shè)備,并分批建設(shè)算力資源,還可以將現(xiàn)有服務(wù)器納入管理,形成一種類(lèi)似擴(kuò)容的方案。
為了進(jìn)一步提升算力利用率和數(shù)據(jù)隱私安全性,用戶可以借助國(guó)產(chǎn)智算中心的模型的專線模式進(jìn)行混合部署。這種模式不僅能提高計(jì)算中心的資源利用率,還能在保障數(shù)據(jù)隱私的同時(shí),支持更多應(yīng)用場(chǎng)景。從商業(yè)模式上看,專線部署采用ToB性質(zhì)的計(jì)費(fèi)方式。未來(lái),用戶可以在此基礎(chǔ)上進(jìn)行私有模型的微調(diào)部署,支持更多應(yīng)用的開(kāi)發(fā)與擴(kuò)展。
▲澎峰科技創(chuàng)始人&CEO張先軼
五、圓桌討論:DeepSeek給AI Infra帶來(lái)新機(jī)會(huì),國(guó)產(chǎn)軟硬件發(fā)展正當(dāng)時(shí)
圓桌討論環(huán)節(jié)以《DeepSeek給AI Infra帶來(lái)的啟示與機(jī)會(huì)》 為主題,由騰訊云專有云及智算首席架構(gòu)師方天戟主持,回顧了過(guò)去兩個(gè)月AI從業(yè)者們圍繞DeepSeek、具身智能等展開(kāi)的一系列技術(shù)攻關(guān),北京智源人工智能研究院AI框架研究負(fù)責(zé)人敖玉龍、澎峰科技創(chuàng)始人兼CEO張先軼、沐冰數(shù)據(jù)CTO邸澤民、云軸科技CTO王為分享了對(duì)最新產(chǎn)業(yè)趨勢(shì)的觀察與思考。

1、DeepSeek開(kāi)源帶來(lái)震撼,一體機(jī)可滿足基礎(chǔ)需求
騰訊云專有云及智算首席架構(gòu)師方天戟強(qiáng)調(diào)DeepSeek具有技術(shù)創(chuàng)新性,基于H800在卡間通信受限的情況下,大幅壓縮了大模型成本,使模型本地部署成為現(xiàn)實(shí)。
沐冰數(shù)據(jù)CTO邸澤民認(rèn)為DeepSeek在開(kāi)源周中一系列開(kāi)源工作的最大的震撼在于展現(xiàn)了如何在資源受限的約束下,實(shí)現(xiàn)最優(yōu)解的工程能力,充分挖掘了現(xiàn)有算力的潛力。DeepSeek團(tuán)隊(duì)不僅想到了精妙的優(yōu)化技巧與方案,還完成了代碼與工程實(shí)現(xiàn),并將其完全開(kāi)源,十分令人尊敬。
▲騰訊云專有云及智算首席架構(gòu)師方天戟
談及近期銷(xiāo)售火爆的DeepSeek一體機(jī),方天戟認(rèn)為這有助于企業(yè)在保護(hù)數(shù)據(jù)安全的情況下快速用上DeepSeek,北京智源人工智能研究院AI框架研究負(fù)責(zé)人敖玉龍指出用戶需要關(guān)注DeepSeek一體機(jī)部署后的軟硬件更新問(wèn)題。
云軸科技CTO王為提到DeepSeek一體機(jī)為客戶提供了入門(mén)的解決方案,通過(guò)預(yù)裝模型和應(yīng)用降低了部署門(mén)檻,能夠快速滿足基礎(chǔ)需求。但隨著需求增長(zhǎng),客戶可能需要更復(fù)雜的算力調(diào)度和混合部署方案。
2、國(guó)產(chǎn)芯片軟硬件可用性提升,如何繞開(kāi)CUDA護(hù)城河?
敖玉龍記得在2017年-2018年,他嘗試將大規(guī)模并行技術(shù)運(yùn)用到AI計(jì)算中,但當(dāng)時(shí)相關(guān)技術(shù)尚未完善。過(guò)去幾年AI Infra快速發(fā)展,有力地支持了大模型的技術(shù)進(jìn)步。
在智源研究院的工作過(guò)程中,他接觸到了端側(cè)與服務(wù)器側(cè)的大量國(guó)產(chǎn)芯片。目前,國(guó)產(chǎn)芯片的硬件、軟件都已具備一定可用性,主要挑戰(zhàn)在于生態(tài)還相對(duì)落后,為此智源打造了開(kāi)源開(kāi)放統(tǒng)一軟件生態(tài)FlagOS來(lái)推動(dòng)國(guó)產(chǎn)芯片生態(tài)發(fā)展。
▲北京智源人工智能研究院AI框架研究負(fù)責(zé)人敖玉龍
在ChatGPT爆火之后,關(guān)于DSA特定領(lǐng)域芯片或ASIC專用芯片是否會(huì)消亡的討論不絕于耳。
邸澤民認(rèn)為,對(duì)于特定領(lǐng)域的計(jì)算負(fù)載而言,與GPGPU相比,DSA具有性能,成本與能效優(yōu)勢(shì)。從目前趨勢(shì)來(lái)看,Transformer這個(gè)模型架構(gòu)的有效性經(jīng)過(guò)了驗(yàn)證,短期內(nèi)出現(xiàn)顛覆性變化的概率不高,那么一定會(huì)有對(duì)Transformer架構(gòu)計(jì)算特點(diǎn)更有針對(duì)性設(shè)計(jì)的專用芯片出現(xiàn),不論是采用TPU的脈動(dòng)陣列、存算一體或者別的什么技術(shù)路線,ASIC夠有效降低推理計(jì)算成本,只有不斷降低推理成本,才更能讓大模型的應(yīng)用實(shí)現(xiàn)普惠。
▲沐冰數(shù)據(jù)CTO邸澤民
王為也提到一些優(yōu)化技術(shù)在GPGPU上效率不是特別高,所以AI推理往ASIC上發(fā)展的可能性非常大。國(guó)產(chǎn)算力在推理上替代能力很強(qiáng),在訓(xùn)練上還需要一定時(shí)間追趕,但應(yīng)該不會(huì)太久。
王為認(rèn)為,在AI訓(xùn)練方面,英偉達(dá)目前優(yōu)勢(shì)比較突出,因?yàn)橥ㄐ判阅?、通信?kù)等技術(shù)壁壘很高,但現(xiàn)在也有國(guó)產(chǎn)卡訓(xùn)練較大大參數(shù)模型的案例,因此假以時(shí)日還是可以趕上的。英偉達(dá)如今在數(shù)據(jù)發(fā)布上選擇性披露,著重在低精度上、稀疏算力上等,近年披露的數(shù)據(jù)逐漸偏向商業(yè)宣傳性質(zhì),詳細(xì)的技術(shù)披露較少,這使得評(píng)估其真實(shí)性能需要更多測(cè)試。

▲云軸科技CTO王為
邸澤民預(yù)測(cè)在AI訓(xùn)練場(chǎng)景,GPGPU依舊將會(huì)繼續(xù)占據(jù)主導(dǎo)地位。在他看來(lái),國(guó)產(chǎn)算力如果要通過(guò)對(duì)PyTorch、TensorFlow等框架兼容,并覆蓋數(shù)千個(gè)長(zhǎng)尾算子,以實(shí)現(xiàn)與英偉達(dá)的CUDA護(hù)城河的競(jìng)爭(zhēng)甚至替換,在短期內(nèi)是不現(xiàn)實(shí)的。但如果將這種兼容與替換目標(biāo)進(jìn)一步收斂、聚焦到特定的模型或者特定領(lǐng)域的模型訓(xùn)練,比如DeepSeek這樣的語(yǔ)言模型,國(guó)產(chǎn)廠商是有適配能力與突破空間的。除了框架與算子適配外,另一個(gè)難點(diǎn)在于進(jìn)一步提升通信庫(kù)的效率。
3、混合推理系統(tǒng)是必然趨勢(shì),具身智能將催化AI Infra演進(jìn)
澎峰科技創(chuàng)始人兼CEO張先軼談道,英偉達(dá)在硬件創(chuàng)新上的持續(xù)投入,使其在AI領(lǐng)域保持領(lǐng)先;英偉達(dá)在精度上的創(chuàng)新不斷提升了性能峰值,也為其他芯片公司設(shè)立了競(jìng)爭(zhēng)壁壘。
他判斷未來(lái)在大規(guī)模部署的情況下,混合推理系統(tǒng)是必然的,能結(jié)合不同硬件的優(yōu)勢(shì)以實(shí)現(xiàn)更高的性價(jià)比和性能。
▲澎峰科技創(chuàng)始人兼CEO張先軼
在混合云部署的實(shí)踐方面,張先軼認(rèn)為當(dāng)前對(duì)數(shù)字隱私要求不是特別高的客戶比較容易接受,可以利用智算中心的算力進(jìn)行補(bǔ)充,比如一些學(xué)?;蛑行端。大B端通常對(duì)私有化要求會(huì)更高。當(dāng)前做AI機(jī)器人的企業(yè),基本采用的是邊緣與云端結(jié)合的方式。
方天戟預(yù)測(cè),從長(zhǎng)遠(yuǎn)來(lái)看,相比大語(yǔ)言模型,具身智能可能會(huì)成為進(jìn)一步促進(jìn)未來(lái)AI Infra演進(jìn)的新應(yīng)用領(lǐng)域。
敖玉龍?zhí)岬骄呱碇悄軝C(jī)器人對(duì)端云協(xié)同、通信等方面提出了新要求,目前機(jī)器人的大腦模型往往部署在云端,控制運(yùn)動(dòng)的小腦模型部署在機(jī)器人本體,如何實(shí)現(xiàn)低延遲的協(xié)同需要進(jìn)一步探索。
結(jié)語(yǔ):中國(guó)生成式AI浪潮波濤洶涌
中國(guó)生成式AI的每一次突破,從來(lái)不是某家企業(yè)的獨(dú)角戲,而是產(chǎn)學(xué)研用協(xié)同攻堅(jiān)的交響曲。
開(kāi)年DeepSeek的爆火,成為中國(guó)乃至世界生成式AI產(chǎn)業(yè)的關(guān)鍵拐點(diǎn)。它顛覆了“堆砌算力”的固有路徑,開(kāi)辟出一條“效率優(yōu)先”的創(chuàng)新路徑,催化開(kāi)源、推理模型與AI Infra研發(fā)熱潮,更為端側(cè)AI與國(guó)產(chǎn)AI算力基礎(chǔ)設(shè)施的落地應(yīng)用注入了新動(dòng)能。
站在技術(shù)與產(chǎn)業(yè)共振的歷史節(jié)點(diǎn),我們每一個(gè)人,都正在見(jiàn)證和參與一場(chǎng)激動(dòng)人心的技術(shù)躍遷。
春天來(lái)了,生成式AI的浪潮更加波濤洶涌,未來(lái)正呼嘯而至。
下一站,也許是基礎(chǔ)模型的飛躍式進(jìn)化,也許是AI超級(jí)應(yīng)用橫空出世,也許是人形機(jī)器人的覺(jué)醒,也許是商業(yè)價(jià)值的裂變,也許是AGI新路徑的曙光。
生成式AI正以摧枯拉朽之勢(shì)重塑傳統(tǒng)產(chǎn)業(yè),創(chuàng)新火種從未如此燎原,我們無(wú)比期待看到,中國(guó)科技企業(yè)在時(shí)代的浪尖揚(yáng)帆起航。
熱門(mén)跟貼