国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

DeepSeek致謝騰訊大模型網(wǎng)絡(luò)提速技術(shù)方案貢獻，助力大模型通信性能提升30%

雷峰網(wǎng)

2025-05-07 19:20 ·北京 ·雷鋒網(wǎng)官方網(wǎng)易號

5月7日，記者獲悉，騰訊技術(shù)團隊針對DeepSeek開源的DeepEP通信框架進行深度優(yōu)化，使其在多種網(wǎng)絡(luò)環(huán)境下均實現(xiàn)顯著性能提升。經(jīng)測試，優(yōu)化后的通信框架性能在RoCE網(wǎng)絡(luò)環(huán)境提升100%,IB網(wǎng)絡(luò)環(huán)境提升30%，為企業(yè)開展AI大模型訓(xùn)練提供更高效的解決方案。相關(guān)技術(shù)方案獲得了DeepSeek公開致謝，稱這是一次“huge speedup”代碼貢獻。

自今年2月DeepSeek開源包括DeepEP在內(nèi)的五大代碼庫以來，該團隊便向業(yè)界展示了如何利用有限的硬件資源實現(xiàn)接近萬卡集群的性能。在這些技術(shù)中，DeepEP憑借突破性的方法提升了300%的通信效率，成功解決了MoE架構(gòu)大模型對英偉達NCCL的依賴問題。

但該技術(shù)在成本較低、適用面更廣的RoCE網(wǎng)絡(luò)環(huán)境中表現(xiàn)不佳，限制了其在更廣泛場景的應(yīng)用。這一痛點引發(fā)了開源社區(qū)的持續(xù)討論。

騰訊星脈網(wǎng)絡(luò)團隊基于在RoCE網(wǎng)絡(luò)領(lǐng)域的深厚積累，在DeepEP開源后便展開技術(shù)攻關(guān)，發(fā)現(xiàn)兩大關(guān)鍵瓶頸：一是對于雙端口網(wǎng)卡帶寬利用率不足，二是CPU控制面交互存在時延。

騰訊在RoCE網(wǎng)絡(luò)優(yōu)化方面的突破，首先體現(xiàn)在帶寬分配的智能化，通過拓撲感知的多QP建鏈技術(shù)，智能分配數(shù)據(jù)流，優(yōu)化了雙端口網(wǎng)卡的帶寬利用率，確保每條數(shù)據(jù)通道都能得到充分使用。此舉有效避免了帶寬浪費，為RoCE網(wǎng)絡(luò)的性能提升提供了有力支撐。

其次，騰訊還著力解決了GPU通信中的CPU控制瓶頸問題。通過基于IBGDA技術(shù)的優(yōu)化，騰訊使得“控制面”場景的操作也可以繞過CPU的“中轉(zhuǎn)”，進一步降低了延遲和能耗，提升了整體通信效率。

同時，GPU直接“對話”時存在的傳輸順序混亂難題，騰訊提出了“QP內(nèi)時序鎖”機制，使得多個GPU間的數(shù)據(jù)傳輸能夠精準、按順序完成，即使同時處理1000多個數(shù)據(jù)傳輸任務(wù)，DeepEP也能自動理順先后順序。

在騰訊的技術(shù)優(yōu)化下，DeepEP不僅在RoCE網(wǎng)絡(luò)實現(xiàn)性能翻倍，反哺到IB（InfiniBand）網(wǎng)絡(luò)時更使原有通信效率再提升30%。

（騰訊工程師在不同節(jié)點服務(wù)器上的測試數(shù)據(jù)）

目前該技術(shù)已全面開源，并成功應(yīng)用于騰訊混元大模型等項目的訓(xùn)練推理，在騰訊星脈與H20服務(wù)器構(gòu)建的高性能環(huán)境中，這套方案同樣展現(xiàn)出卓越的通用性。

打開網(wǎng)易新聞體驗更佳

熱搜

熱門跟貼

打開APP發(fā)貼

广宁县| 咸阳市| 乌苏市| 环江| 鄯善县| 酉阳| 孟津县| 沁源县| 三亚市| 巩留县| 穆棱市| 邵阳市| 呼和浩特市| 弥勒县| 沁水县| 宁阳县| 南阳市| 雷州市| 资源县| 嘉黎县| 弥渡县| 五家渠市| 搜索| 临城县| 威信县| 会泽县| 祁阳县| 广德县| 准格尔旗| 三穗县| 辛集市| 平舆县| 常熟市| 宁陵县| 盈江县| 安康市| 朝阳区| 黑山县| 馆陶县| 吉林省| 民乐县|

<del id="gi0mm"><tfoot id="gi0mm"></tfoot></del>

<fieldset id="gi0mm"><menu id="gi0mm"></menu></fieldset>