
騰訊混元大模型遵循了騰訊一貫的“先普惠技術(shù),再構(gòu)建生態(tài)矩陣,最終實(shí)現(xiàn)商業(yè)化閉環(huán)”的理念。
文|胡嘉琦
ID | BMR2004
近日,騰訊公布了2024年第四季度及全年財(cái)報(bào),其2024年的研發(fā)支出創(chuàng)下707億元的歷史新高。
騰訊雄厚的資金投入正在加速其AI戰(zhàn)略進(jìn)程。通過利用“自研+開源 ”的混元大模型策略,這家科技巨頭正在推動(dòng)整個(gè)業(yè)務(wù)的變革性改進(jìn)。
騰訊董事會(huì)主席兼首席執(zhí)行官馬化騰表示:“幾個(gè)月前,我們重組了人工智能團(tuán)隊(duì),專注于快速產(chǎn)品創(chuàng)新和深度模型開發(fā)。通過增加與人工智能相關(guān)的資本支出,并加大力度開發(fā)和營銷人工智能原生產(chǎn)品,我們正在為實(shí)現(xiàn)可持續(xù)增長做好準(zhǔn)備。這些投資有望提高廣告效率,延長我們游戲產(chǎn)品的生命周期,而人工智能服務(wù)的不斷普及也將創(chuàng)造持久價(jià)值。”
騰訊方面向《商學(xué)院》記者表示,騰訊混元大模型已在 700 多個(gè)內(nèi)部場景中部署,促進(jìn)了多個(gè)業(yè)務(wù)領(lǐng)域的增長。同時(shí),騰訊積極整合前沿開源生態(tài)系統(tǒng),騰訊混元大模型全面開源。
01
自主研發(fā)的通用大模型
中國大模型技術(shù)首次在多模態(tài)領(lǐng)域?qū)崿F(xiàn)完整開源布局。
騰訊方面向記者表示,騰訊混元大模型是騰訊自主研發(fā)的通用大模型,作為國內(nèi)首個(gè)采用MoE架構(gòu)的萬億參數(shù)大模型,通過動(dòng)態(tài)路由機(jī)制實(shí)現(xiàn)計(jì)算資源優(yōu)化;通用任務(wù)調(diào)用3—5個(gè)專家模塊,專業(yè)任務(wù)激活“15+”模塊;推理效率較密集架構(gòu)提升3倍,訓(xùn)練成本降低40%。
騰訊混元大模型在云上提供Turbo、Pro、Standard、Lite、Vision等多個(gè)版本,同時(shí)在專屬模型上開放代碼生成、角色扮演、Functioncall(功能調(diào)用)等功能,使企業(yè)客戶與個(gè)人開發(fā)者能夠通過騰訊云實(shí)現(xiàn)API(應(yīng)用程序接口)直接調(diào)用,實(shí)現(xiàn)便捷的智能化升級(jí),目前已接入700余個(gè)騰訊業(yè)務(wù)和場景(如騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等)及騰訊旗下協(xié)作 SaaS (軟件即服務(wù))產(chǎn)品。
自2024年全面開源以來,混元大模型覆蓋文本、圖像、視頻和3D生成等多模態(tài)。在GitHub上總Stars數(shù)超2.3w,多次登頂趨勢榜,其中混元視頻生成模型2024年12月在Hugging Face登頂且GitHub Stars超8.5k,社區(qū)開發(fā)者自發(fā)改進(jìn)衍生版本逾900個(gè),而混元DiT文生圖模型的衍生模型數(shù)量更達(dá)1600余個(gè)。
記者了解到,近日,騰訊混元大模型旗下最新發(fā)布的Hunyuan3D-2.0系列開源模型,迎來了五款產(chǎn)品(Turbo、Pro、Standard、Lite、Vision)的全系列開源,構(gòu)建起完整的工具鏈體系,標(biāo)志著中國大模型技術(shù)首次在多模態(tài)領(lǐng)域?qū)崿F(xiàn)完整開源布局。從30秒生成高精度3D資產(chǎn)的開源框架,到覆蓋文本、圖像、視頻的全模態(tài)開源體系,騰訊混元大模型正以開放姿態(tài)引領(lǐng)一場全球范圍內(nèi)的數(shù)字創(chuàng)作革命。
這一突破得益于騰訊自主研發(fā)的3D生成加速框架FlashVDM,它打破了傳統(tǒng)3D生成模型的效率瓶頸,將大規(guī)模3D模型的生成時(shí)間壓縮至秒級(jí),為開源社區(qū)與工業(yè)界的應(yīng)用部署提供了可能。
Hunyuan3D-2.0推出了多種模型版本,以適應(yīng)不同應(yīng)用需求。例如,多視圖版本Hunyuan3D-2-MV能夠結(jié)合2—4張標(biāo)準(zhǔn)視角圖片,捕捉豐富的細(xì)節(jié),優(yōu)化3D生成模型產(chǎn)生的效果。與此同時(shí),mini系列模型通過架構(gòu)優(yōu)化與算力提升,降低了硬件要求,可在NVIDIA 4080顯卡甚至蘋果M1 Pro芯片上運(yùn)行,使3D模型的應(yīng)用更為廣泛。
騰訊自2024年11月發(fā)布第一代3D生成大模型以來,持續(xù)推動(dòng)行業(yè)創(chuàng)新。如今Hunyuan3D-2.0在文本一致性、幾何精度和畫面質(zhì)量等多項(xiàng)評(píng)測中超越業(yè)內(nèi)頂級(jí)大模型。伴隨模型升級(jí),面向創(chuàng)作者的騰訊混元3D AI創(chuàng)作引擎同步優(yōu)化,為游戲制作、3D UGC創(chuàng)作等提供更高效的生產(chǎn)工具。
02
打造生態(tài)矩陣
騰訊混元大模型實(shí)現(xiàn)了開源生態(tài)的商業(yè)模式創(chuàng)新,通過基礎(chǔ)模型開源吸引開發(fā)者。
隨著模型參數(shù)規(guī)模的增長進(jìn)入瓶頸期,掌控開發(fā)者生態(tài)成為模型的新“護(hù)城河”?;煸_源模型覆蓋文本、圖像、視頻、3D四大模態(tài),構(gòu)建了一個(gè)難以復(fù)制的生態(tài)矩陣。
Hunyuan3D-2.0的發(fā)布,騰訊正加速推動(dòng)3D內(nèi)容生成技術(shù)的應(yīng)用落地,為創(chuàng)作者與行業(yè)用戶帶來更加智能高效的3D生產(chǎn)工具。
目前,騰訊混元3D生成模型已在多個(gè)業(yè)務(wù)場景落地,包括用戶生成內(nèi)容(UGC)、商品素材合成、游戲3D資產(chǎn)生成等。在游戲領(lǐng)域,Hunyuan3D-2.0生成的3D模型已達(dá)到行業(yè)標(biāo)準(zhǔn),具備合理的幾何布線、精準(zhǔn)的貼圖及骨骼蒙皮適配能力,為3D資產(chǎn)生產(chǎn)提供了高效、低成本的新方案。
當(dāng)下,騰訊混元大模型實(shí)現(xiàn)了開源生態(tài)的商業(yè)模式創(chuàng)新,通過基礎(chǔ)模型開源吸引開發(fā)者,云端API按調(diào)用量收費(fèi),實(shí)現(xiàn)分層變現(xiàn);與英偉達(dá)合作優(yōu)化Hunyuan3D在A100顯卡上的性能,帶動(dòng)云服務(wù)銷售,實(shí)現(xiàn)硬件協(xié)同;開發(fā)者貢獻(xiàn)的改進(jìn)代碼經(jīng)審核后整合進(jìn)商業(yè)版本,形成技術(shù)升級(jí)閉環(huán),從而實(shí)現(xiàn)數(shù)據(jù)反哺。
以騰訊元寶為例,這款應(yīng)用的日活躍用戶在2025年2月至3月期間激增了20多倍。自2023年首次推出以來,騰訊混元大模型經(jīng)歷了快速迭代升級(jí)。最新版本被稱為“騰訊混元大模型 Turbo S”,可將初始響應(yīng)延遲降低44%,目前已在騰訊元寶等多個(gè)內(nèi)部產(chǎn)品中使用。
開源意味著要持續(xù)不斷的更新迭代。比如騰訊元寶自上線以來,已經(jīng)歷了多次更新。騰訊方面向記者表示,2月13日,騰訊元寶集成了完整版的DeepSeek-R1,支持騰訊混元和DeepSeek模型;2月19日,騰訊元寶逐步引入并全面部署混元T1深度思維模型;2月21日,DeepSeek和混元模型升級(jí),可理解圖像內(nèi)容;2月25日,騰訊元寶發(fā)布一鍵導(dǎo)出長圖功能;3月1日,騰訊元寶桌面版正式發(fā)布,同時(shí)發(fā)布的還有混元Turbo S模型的測試版。3月7日到3月13日期間,騰訊元寶推出更多增強(qiáng)功能,包括傳輸對(duì)話鏈接、大字體模式、拖拽上傳文件、發(fā)布并支持騰訊文檔等;3月18日,騰訊元寶此次更新整合了這些改進(jìn),增加了截圖請(qǐng)求、拖拽上傳文件、可調(diào)字體和暗色模式。騰訊表示將繼續(xù)改進(jìn)元寶的功能,并計(jì)劃在不久的將來推出更多人性化功能。
此外,騰訊云服務(wù)、騰訊會(huì)議、騰訊文檔等生產(chǎn)力工具也正在經(jīng)歷一場人工智能驅(qū)動(dòng)的重大變革。騰訊會(huì)議的人工智能助理、智能錄音、實(shí)時(shí)多語言翻譯等新功能已吸引了1500萬月活躍用戶。
目前,騰訊云通過“騰訊混元大數(shù)據(jù)+開源模式”的雙輪驅(qū)動(dòng)策略,已構(gòu)建覆蓋政務(wù)、教育、醫(yī)療、金融、媒體、移動(dòng)、文旅等30多個(gè)行業(yè)的多模態(tài)解決方案體系。這一舉措為深圳寶安區(qū)政府、深圳醫(yī)保、上海徐匯城市運(yùn)營中心、上海文廣新聞傳媒集團(tuán)、深圳大學(xué)、瑞金醫(yī)院、上海醫(yī)藥、榮譽(yù)、重慶農(nóng)村商業(yè)銀行等客戶帶來了創(chuàng)新和效率的提升。
例如,深圳寶安政務(wù)大模型率先整合“騰訊混元+DeepSeek”雙模型能力與私有化部署的寶安區(qū)專屬知識(shí)庫,構(gòu)建了“1+1+1>3”的應(yīng)用效果。
如今,寶安政務(wù)知識(shí)庫現(xiàn)已覆蓋 14 個(gè)區(qū)和 20 個(gè)行業(yè),擁有超過 30000 條政府服務(wù)記錄。此外,知識(shí)庫還包含 60 余項(xiàng)人工智能基礎(chǔ)能力,可快速部署公共服務(wù)查詢、企業(yè)支持、行政工作流、社會(huì)管理等 31 個(gè)業(yè)務(wù)場景的智能應(yīng)用。
在醫(yī)療領(lǐng)域,騰訊與明德醫(yī)療合作開發(fā)了全球首個(gè)針對(duì)重癥監(jiān)護(hù)病房的人工智能醫(yī)療模型,名為啟元重癥大模型,目前已在國內(nèi)部分醫(yī)院進(jìn)行臨床試驗(yàn)。
騰訊混元大模型全系開源備受業(yè)內(nèi)關(guān)注。科方得智庫研究負(fù)責(zé)人張新原在接受《商學(xué)院》記者采訪時(shí),以辯證視角肯定了該模型的開源策略,認(rèn)為其憑借強(qiáng)大的語言理解與生成能力、對(duì)海量文本數(shù)據(jù)的處理能力以及廣泛的應(yīng)用場景,在自然語言處理、機(jī)器學(xué)習(xí)、人工智能等領(lǐng)域表現(xiàn)出色;此外,其萬億級(jí)參數(shù)規(guī)模不僅提升了模型的計(jì)算和泛化能力,還賦予了極高的靈活性和可擴(kuò)展性,使其能夠針對(duì)不同需求進(jìn)行優(yōu)化。與此同時(shí),該模型在訓(xùn)練和部署上存在成本高、調(diào)試優(yōu)化難度大以及潛在缺陷等問題,需要更多測試和驗(yàn)證來保障穩(wěn)定性。
中關(guān)村物聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟副秘書長袁帥認(rèn)為,騰訊混元在中文創(chuàng)作、邏輯推理和任務(wù)執(zhí)行方面有優(yōu)勢,并強(qiáng)調(diào)通過開源可以降低技術(shù)門檻,促進(jìn)企業(yè)和開發(fā)者的二次開發(fā)與技術(shù)合作,從而進(jìn)一步推動(dòng)技術(shù)進(jìn)步和行業(yè)發(fā)展。
騰訊混元大模型遵循了騰訊一貫的“先普惠技術(shù),再構(gòu)建生態(tài)矩陣,最終實(shí)現(xiàn)商業(yè)化閉環(huán)”的理念,對(duì)于騰訊未來能否實(shí)現(xiàn)商業(yè)化落地,《商學(xué)院》記者將持續(xù)關(guān)注。
來源 | 2025年4月刊
熱門跟貼