免费观看大片在线观看,成人综合婷婷国产精品久久蜜臀,亚洲国产欧美日产,一二三四视频在线社区中文字幕2,国产三p在线观看

千問(wèn)3登頂全球權(quán)威開(kāi)源模型榜

雷峰網(wǎng)

2025-05-06 18:14 ·北京 ·雷鋒網(wǎng)官方網(wǎng)易號(hào)

5月6日消息，國(guó)際權(quán)威大模型測(cè)評(píng)榜LiveBench公布了最新一期排名，阿里巴巴開(kāi)源的新一代通義千問(wèn)模型Qwen3（簡(jiǎn)稱千問(wèn)3）斬獲全球開(kāi)源模型冠軍，并在指令遵循（Instruction Following）這一關(guān)鍵能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等頂級(jí)閉源模型位列全球第一。

圖示5月6日LiveBench榜單官網(wǎng)截圖

據(jù)了解，LiveBench榜單由圖靈獎(jiǎng)得主、Meta首席AI科學(xué)家楊立昆（Yann LeCun）聯(lián)合紐約大學(xué)等機(jī)構(gòu)推出，從數(shù)學(xué)、推理、編程、語(yǔ)言理解等多個(gè)復(fù)雜維度全面評(píng)估大模型，并因其采用動(dòng)態(tài)更新的題庫(kù)而被譽(yù)為“全球首個(gè)無(wú)法作弊的模型基準(zhǔn)測(cè)試”。在最新一期的LiveBench榜單上，千問(wèn)3表現(xiàn)與o4-mini、Claude3.7等頂尖閉源模型相當(dāng)，并超越DeepSeek-R1取得了全球開(kāi)源模型冠軍。同時(shí)，千問(wèn)3還斬獲指令遵循這一細(xì)分領(lǐng)域的全球冠軍，這說(shuō)明千問(wèn)3具備全球頂級(jí)的語(yǔ)言理解和生成能力。

千問(wèn)3于4月29日凌晨開(kāi)源，是國(guó)內(nèi)首個(gè)“混合推理模型”，其參數(shù)量?jī)H為DeepSeek-R1的1/3，性能全面提升的同時(shí)成本還大幅下降，引發(fā)大模型產(chǎn)業(yè)鏈連夜適配和接入浪潮：英偉達(dá)、英特爾、高通、聯(lián)發(fā)科、AMD、ARM、華為昇騰、壁仞科技等芯片平臺(tái)都已完成了千問(wèn)3的適配，北上津杭等十余地算力平臺(tái)也已接入千問(wèn)3。截至目前，阿里通義已開(kāi)源200多個(gè)模型，全球下載量超過(guò)3億次，千問(wèn)的衍生模型數(shù)量超10萬(wàn)，遠(yuǎn)超美國(guó)Llama，成為全球第一開(kāi)源模型。

*附LiveBench榜單官網(wǎng)鏈接：https://livebench.ai/#/