“連續(xù)4周千卡不間斷訓(xùn)練、2個(gè)月完成模型迭代,先于Sora半年開(kāi)放使用……”
2024年初,Sora的驚艷亮相,將文生視頻技術(shù)推向AI領(lǐng)域競(jìng)爭(zhēng)的新高地。
彼時(shí),成立僅一年多的智象未來(lái),憑借在生成式AI和多模態(tài)領(lǐng)域的技術(shù)積累迅速響應(yīng),僅用短短2個(gè)月時(shí)間便推出全球首個(gè)上線(xiàn)開(kāi)放使用的圖像和視頻生成(DiT)架構(gòu)模型,并迅速在vivago.ai上線(xiàn)向全球用戶(hù)提供視頻生成服務(wù),把握了行業(yè)發(fā)展先機(jī)。

作為智象未來(lái)的堅(jiān)實(shí)后盾,商湯大裝置為其提供了超穩(wěn)定、超高效的AI基礎(chǔ)設(shè)施支持,以極致的資源利用助力智象未來(lái)快速完成模型迭代沖刺,在新一輪競(jìng)爭(zhēng)中鞏固核心競(jìng)爭(zhēng)力、開(kāi)拓應(yīng)用新場(chǎng)景。
智象未來(lái)技術(shù)總監(jiān)潘瀅煒博士表示:“作為AI創(chuàng)業(yè)公司,我們深知快速響應(yīng)行業(yè)變化的重要性。智象未來(lái)的模型迭代節(jié)奏快、訓(xùn)練強(qiáng)度大,對(duì)算力基礎(chǔ)設(shè)施的響應(yīng)速度、穩(wěn)定性和服務(wù)能力都有著極高需求。商湯大裝置‘靈活、穩(wěn)定、專(zhuān)業(yè)’的支持能力,為我們實(shí)現(xiàn)模型的多元化場(chǎng)景應(yīng)用、打通商業(yè)閉環(huán)提供了堅(jiān)實(shí)基礎(chǔ),是我們值得信賴(lài)的長(zhǎng)期合作伙伴?!?/p>
訓(xùn)練節(jié)奏按月迭代,算力需求“既要也要”
2023年3月,當(dāng)行業(yè)還在驚嘆于ChatGPT震撼的對(duì)話(huà)式體驗(yàn)時(shí),剛剛成立的智象未來(lái)憑借在視頻內(nèi)容理解和生成領(lǐng)域的厚積薄發(fā)和敏銳洞察,前瞻地瞄準(zhǔn)了圖像和視頻賽道的多模態(tài)技術(shù)方向,并在創(chuàng)立之初就制定了“1+3+N”的商業(yè)化布局策略,以1個(gè)大模型為基礎(chǔ),通過(guò)3條產(chǎn)品線(xiàn)形成市場(chǎng)觸點(diǎn),滿(mǎn)足N種使用場(chǎng)景。
早在2024年初Sora發(fā)布前,智象未來(lái)自研的智象大模型便已具備15秒的文生視頻能力。在Sora發(fā)布之后,其迅速推出智象大模型2.0及3.0版本,將模型架構(gòu)從U-Net升級(jí)至Diffusion Transformer (DiT),不僅將視頻生成時(shí)長(zhǎng)提升至分鐘級(jí)別,畫(huà)面自然度、內(nèi)容和角色一致性亦有顯著提升。更重要的是,智象大模型2.0率先實(shí)現(xiàn)開(kāi)放使用,成為全球首個(gè)開(kāi)放使用的圖像和視頻生成(DiT)架構(gòu)模型。目前,智象大模型已迭代至3.0版本,在架構(gòu)和應(yīng)用層面進(jìn)一步突破。通過(guò)引入全新擴(kuò)散自回歸架構(gòu)(DiT+AR),在提升生成質(zhì)量的同時(shí)降低推理能耗。在應(yīng)用層面,可廣泛應(yīng)用于運(yùn)動(dòng)鏡頭捕捉、影視特效制作、自然風(fēng)光模擬以及物理世界的數(shù)字重現(xiàn)等多個(gè)領(lǐng)域,展現(xiàn)了人工智能在創(chuàng)意產(chǎn)業(yè)與視覺(jué)藝術(shù)中的巨大潛力與應(yīng)用價(jià)值。

不同于語(yǔ)言等單一模態(tài)模型,多模態(tài)模型的訓(xùn)練更加復(fù)雜。其不僅需要融合文本、圖像、音頻等多種模態(tài)信息,實(shí)現(xiàn)跨模態(tài)的深度理解與交互,而且訓(xùn)練任務(wù)更加多樣。不僅如此,智象多模態(tài)大模型還幾乎保持每月進(jìn)行小版本迭代,每半年開(kāi)展大版本升級(jí)的節(jié)奏,更對(duì)算力提出了“既要也要”的嚴(yán)苛要求:
一是要高效:大模型訓(xùn)練,效率就是一切,每一次版本升級(jí)都是一場(chǎng)與時(shí)間的賽跑。尤其是面對(duì)智象大模型版本迭代時(shí)的擴(kuò)容需求,需要迅速調(diào)度充足算力資源,支持模型迭代沖刺。
二是要靈活:智象大模型具備圖片生成、視頻生成、圖像和視頻編輯等多種功能,不同模態(tài)信息的訓(xùn)練任務(wù)對(duì)算力需求各有不同,需要算力系統(tǒng)具備高度靈活性,能夠隨時(shí)根據(jù)訓(xùn)練任務(wù)的具體需要,匹配最優(yōu)算力方案。
三是要穩(wěn)定:大模型的訓(xùn)練需要連貫且穩(wěn)定的系統(tǒng)運(yùn)行,任何一次系統(tǒng)中斷都可能導(dǎo)致訓(xùn)練失敗和資源浪費(fèi),因此算力系統(tǒng)必須具備7×24小時(shí)不間斷運(yùn)行的絕對(duì)穩(wěn)定性,為模型迭代提供堅(jiān)實(shí)后盾。
靈活、穩(wěn)定、專(zhuān)業(yè),為模型迭代穩(wěn)定護(hù)航
作為“最懂大模型的AI基礎(chǔ)設(shè)施”,商湯大裝置以“靈活、穩(wěn)定、專(zhuān)業(yè)”三板斧,通過(guò)靈活的算力資源調(diào)度,連續(xù)4周千卡不間斷訓(xùn)練和專(zhuān)業(yè)高效的專(zhuān)家服務(wù),助力智象未來(lái)實(shí)現(xiàn)了20%的資源利用率提升,讓每一份算力都發(fā)揮到極致。
靈活:千卡算力按需調(diào)度,實(shí)現(xiàn)最高投入產(chǎn)出比
充足的算力儲(chǔ)備、極速靈活的響應(yīng)能力是商湯大裝置的核心優(yōu)勢(shì)之一。在2024年初,商湯大裝置運(yùn)營(yíng)算力規(guī)模已達(dá)到12,000 PetaFlops,目前更已提升至23,000 PetaFlops。
為滿(mǎn)足智象未來(lái)的模型迭代沖刺需求,商湯大裝置不僅快速調(diào)度了千卡級(jí)別的算力資源,還提供了彈性的算力支持,可按需分配資源規(guī)模,通過(guò)靈活調(diào)度為智象未來(lái)提供最適配的算力方案。針對(duì)圖片生成、視頻生成、圖像和視頻編輯等不同訓(xùn)練任務(wù),都能通過(guò)資源自主劃分、靈活任務(wù)搶占機(jī)制,按照任務(wù)優(yōu)先級(jí)靈活進(jìn)行資源分配,保證最大資源利用率,實(shí)現(xiàn)更高投入產(chǎn)出比、更高經(jīng)濟(jì)性的基礎(chǔ)。
穩(wěn)定:千卡4周不間斷,99.99%可靠性穩(wěn)定護(hù)航
在基于千卡集群的模型訓(xùn)練任務(wù)中,計(jì)算卡故障、通信異常等潛在問(wèn)題如同暗礁,隨時(shí)可能會(huì)導(dǎo)致訓(xùn)練中斷等穩(wěn)定性問(wèn)題,影響訓(xùn)練進(jìn)度。如果說(shuō)算力是大模型訓(xùn)練的核心“生產(chǎn)力”,那么穩(wěn)定性則代表著“安全感”。有安全感的生產(chǎn)力,才能真正提升生產(chǎn)效率。
從全程動(dòng)態(tài)監(jiān)控到多項(xiàng)保障機(jī)制,商湯大裝置以99.99%的可靠穩(wěn)定性,做到算力“零閑置”。在模型訓(xùn)練過(guò)程中,可實(shí)時(shí)監(jiān)控設(shè)備狀態(tài),精準(zhǔn)定位故障節(jié)點(diǎn),并在第一時(shí)間發(fā)出告警;通過(guò)故障節(jié)點(diǎn)自動(dòng)剔除機(jī)制,能夠迅速將問(wèn)題節(jié)點(diǎn)隔離,減少訓(xùn)練中斷風(fēng)險(xiǎn);通過(guò)空閑節(jié)點(diǎn)無(wú)縫接入機(jī)制,讓訓(xùn)練任務(wù)能夠從斷點(diǎn)處迅速續(xù)訓(xùn),避免時(shí)間浪費(fèi)。
得益于動(dòng)態(tài)監(jiān)控、異常檢測(cè)等多種手段,商湯大裝置以分鐘級(jí)的訓(xùn)練容錯(cuò)能力,助力智象未來(lái)成功實(shí)現(xiàn)了連續(xù)4周千卡不間斷訓(xùn)練的超穩(wěn)表現(xiàn),為模型迭代穩(wěn)定護(hù)航。
專(zhuān)業(yè):全鏈條專(zhuān)家服務(wù)支持,全程守護(hù)滿(mǎn)滿(mǎn)安全感
憑借在模型訓(xùn)練、AI Infra、模型量化推理等方面積累的深厚經(jīng)驗(yàn)與專(zhuān)業(yè)知識(shí),商湯專(zhuān)家服務(wù)團(tuán)隊(duì)以敏捷、專(zhuān)業(yè)的支持能力,協(xié)助智象未來(lái)高效精準(zhǔn)地完成問(wèn)題定位和溯源,高效完成各類(lèi)故障排查,并助力優(yōu)化訓(xùn)練流程、提升資源利用率。
全鏈路文生視頻解決方案,打通從數(shù)據(jù)到價(jià)值“最后一公里”
商湯大裝置解決方案專(zhuān)家孟凡笑認(rèn)為:隨著文生視頻模型研發(fā)和應(yīng)用需求不斷涌現(xiàn),行業(yè)所需的將不僅僅是高效、穩(wěn)定的算力支持,而是從數(shù)據(jù)處理、到模型訓(xùn)練,再到推理部署的全鏈路解決方案。

基于對(duì)文生視頻模型研發(fā)與應(yīng)用需求的深刻理解,商湯大裝置已形成涵蓋底層算力服務(wù)、IaaS服務(wù)以及文生視頻數(shù)據(jù)處理平臺(tái)的全鏈路文生視頻解決方案,以端到端的AI Infra能力打通從數(shù)據(jù)到價(jià)值的“最后一公里”。
在數(shù)據(jù)層面,可提供定制化的數(shù)據(jù)評(píng)估、視頻編碼、視頻超分等數(shù)據(jù)服務(wù),助力客戶(hù)應(yīng)對(duì)高質(zhì)量數(shù)據(jù)缺乏、數(shù)據(jù)處理難、存儲(chǔ)空間大等難題。同時(shí)提供私有化部署和公有云服務(wù)兩種靈活的服務(wù)模式,可滿(mǎn)足不同客戶(hù)需求。
在訓(xùn)練層面,可提供超大規(guī)模算力資源,并能根據(jù)任務(wù)需求進(jìn)行靈活調(diào)度,且支持多芯混訓(xùn)、資源提效、性能優(yōu)化,實(shí)現(xiàn)極致的算力資源利用和模型訓(xùn)練效果提升。同時(shí),還通過(guò)智能異常檢測(cè)、分鐘級(jí)自動(dòng)容錯(cuò)等多種手段組合,為模型訓(xùn)練提供極致穩(wěn)定性保障。
在推理層面,可提供從負(fù)載均衡調(diào)度、彈性擴(kuò)縮容到服務(wù)優(yōu)化、模型壓縮、算法優(yōu)化的全方位、分層推理優(yōu)化方案,實(shí)現(xiàn)高吞吐、低時(shí)延的推理性能,有效滿(mǎn)足文生視頻場(chǎng)景對(duì)推理的實(shí)時(shí)性要求。
同時(shí),作為全棧式解決方案的堅(jiān)實(shí)后盾,商湯大裝置的全鏈條AI專(zhuān)家服務(wù)以全流程技術(shù)支撐和行業(yè)深度適配為核心,全面覆蓋業(yè)務(wù)場(chǎng)景洞察和定義、數(shù)據(jù)處理與構(gòu)造、大模型評(píng)測(cè)與能力選型、模型微調(diào)、模型蒸餾,再到模型部署與維護(hù)等AI模型開(kāi)發(fā)和應(yīng)用全生命周期環(huán)節(jié),助力企業(yè)高效實(shí)現(xiàn) AI 應(yīng)用落地,在智能化轉(zhuǎn)型之路上穩(wěn)步邁進(jìn)。
深化合作、共探場(chǎng)景升級(jí),推動(dòng)文生視頻持續(xù)爆發(fā)
得益于模型的快速迭代,智象未來(lái)的商業(yè)化進(jìn)程迅猛發(fā)展,成立短短兩年以來(lái),已累計(jì)服務(wù)100多個(gè)國(guó)家和地區(qū)的1000多萬(wàn)用戶(hù)和4萬(wàn)多家企業(yè),智象大模型已廣泛應(yīng)用于影視、文旅、通信、營(yíng)銷(xiāo)、教育等場(chǎng)景。
未來(lái),商湯大裝置與智象未來(lái)還將進(jìn)行更深層次、更多維度的合作。除了算力層面,雙方還將針對(duì)視頻篩選、視頻編碼、視頻超分等數(shù)據(jù)處理,以及模型推理優(yōu)化等方面展開(kāi)交流與合作探討,打造更優(yōu)質(zhì)、更高效、更易用的文生視頻服務(wù),滿(mǎn)足各行業(yè)客戶(hù)日益增長(zhǎng)的多樣化需求。
熱門(mén)跟貼