美女黄频视频网站观看,亚洲小黄片www免费观看,久久深爱婷婷,国语精品自产拍在线观看网站,成人看片中文字幕

《科創(chuàng)板日?qǐng)?bào)》5月1日訊（記者黃心怡）阿里巴巴在“五一”節(jié)前開源新一代通義千問模型Qwen3，而且一口氣開源了 8 個(gè)版本。

阿里千問大模型官網(wǎng)用“思深，行速”來描述Qwen3，是指Qwen3 是中國(guó)公司推出的首個(gè)混合推理模型，在同一個(gè)模型中融合了 “推理” 和 “非推理” 模式，可以根據(jù)不同問題選擇 “快、慢思考”。

最新數(shù)據(jù)顯示，阿里Qwen 系列大模型已被累計(jì)下載 3 億次，基于 Qwen 的衍生模型數(shù)量超 10 萬個(gè)，為全球第一。Qwen3 發(fā)布也引來眾多開發(fā)者的使用和測(cè)評(píng)。

Qwen3 提供了不同參數(shù)的模型版本，包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。阿里方面稱，千問3的30B參數(shù)MoE模型僅激活3B就能達(dá)到上代Qwen2.5-32B模型性能，而千問3的稠密模型比如32B版本的千問3模型，可超越上一代Qwen2.5-72B性能。

多名開發(fā)者告訴《科創(chuàng)板日?qǐng)?bào)》記者，此次發(fā)布的千問3系列中的小參數(shù)量模型表現(xiàn)突出?！?strong>32B模型表現(xiàn)突出，小參數(shù)量跑出了優(yōu)秀的效果，對(duì)大模型應(yīng)用研發(fā)人員或公司來說是福利。畢竟大參數(shù)量還是成本太高。目前來看32B性價(jià)比最高，235B感覺相比千問2.5提升不太大，而32B能跑出目前效果確實(shí)很不錯(cuò)了?！?/p>

有業(yè)內(nèi)人士推測(cè)，千問3選擇在小參數(shù)模型發(fā)力，主要是為了蘋果生態(tài)而準(zhǔn)備。此前，阿里董事局主席蔡崇信確認(rèn)了回應(yīng)阿里與蘋果在手機(jī)上合作落地AI的傳聞。而今年4月的最新消息稱，蘋果果正積極推進(jìn)在國(guó)行版iPhone上引入AI功能的計(jì)劃，并計(jì)劃于2025年中期前登陸國(guó)行iPhone。

▍并非全面碾壓DeepSeek R1

盡管Qwen3發(fā)布后，有媒體報(bào)道其性能全面碾壓同樣開源的DeepSeek R1 。但《科創(chuàng)板日?qǐng)?bào)》記者注意到，每家大模型公司在公布自己大模型的測(cè)評(píng)數(shù)據(jù)時(shí)，可能用的都是不同的指標(biāo)，或者只公布自己得分高的測(cè)評(píng)測(cè)試。因此，比較公立的第三方測(cè)評(píng)比較有說服力。

著名華裔AI學(xué)者吳恩達(dá)的公司Artificial Analysis對(duì)包括Qwen3和DeepSeek R1在內(nèi)的大模型測(cè)試顯示，Qwen3只是在某些指標(biāo)上超越DeepSeek R1，并非全面碾壓。

在“GPQA 鉆石：博士級(jí)多學(xué)科”項(xiàng)目測(cè)試中，Qwen3 235B測(cè)試結(jié)果70分，和 DeepSeek R1 的 71分成績(jī)接近；在“LiveCodeBench：編碼能力”項(xiàng)目測(cè)試中，Qwen3 235B測(cè)試結(jié)果：71分，高于 DeepSeek R1 的 62分成績(jī)；在“MATH-500：高難度數(shù)學(xué)”項(xiàng)目測(cè)試中， Qwen3 235B測(cè)試結(jié)果93分，低于 DeepSeek R1 的 97分成績(jī); 在“MMLU：通用知識(shí)基準(zhǔn)” Qwen3 235B測(cè)試結(jié)果83分，接近 DeepSeek R1 的 84分成績(jī)；在“AIME2024：數(shù)學(xué)推理中等挑戰(zhàn)，泛化能力參考”項(xiàng)目測(cè)試中，Qwen3 235B測(cè)試結(jié)果84分，高于 DeepSeek R1 的 68分成績(jī)。

因此，業(yè)內(nèi)普遍的看法是，總體看Qwen3推理模型整體表現(xiàn)略好于R1，但相比R1也不算有太大突破，還稱不上“全面碾壓”。

▍小參數(shù)模型遠(yuǎn)超預(yù)期

另一名開發(fā)者告訴《科創(chuàng)板日本》記者，此次千問3系列的超大參數(shù)模型不及預(yù)期，但小參數(shù)的模型遠(yuǎn)超預(yù)期?！?B模型在數(shù)學(xué)能力上屬實(shí)驚到我了?！?/strong>

小參數(shù)量模型的特點(diǎn)是能夠主要用于端側(cè)部署，比如4B模型可用于手機(jī)端，8B可在電腦和汽車端側(cè)，32B可用于企業(yè)大規(guī)模部署，也適合有條件的開發(fā)者上手。

開放傳神（OpenCSG）聯(lián)合創(chuàng)始人陳冉認(rèn)為，通義大模型的出現(xiàn)充分驗(yàn)證大模型領(lǐng)域金律“模型天天變，不變的是數(shù)據(jù)沉淀“，也再次證明開源是技術(shù)創(chuàng)新的壓箱石。技術(shù)上，還在繼續(xù)努力推進(jìn)，目標(biāo)還是降本增效，種類齊全，但核心創(chuàng)新點(diǎn)還有待觀察。

《科創(chuàng)板日?qǐng)?bào)》記者注意到，在千問3發(fā)布后，上下游供應(yīng)鏈第一時(shí)間進(jìn)行適配和調(diào)用。英偉達(dá)、英特爾、聯(lián)發(fā)科、AMD等多家頭部芯片廠商紛紛適配千問3。

《科創(chuàng)板日?qǐng)?bào)》記者從英特爾方面獲悉，英特爾在車端艙內(nèi)對(duì)新發(fā)布的千問3系列模型，也已經(jīng)完成匹配。國(guó)產(chǎn)芯片廠商海光信息則宣布其DCU完成對(duì)Qwen3全部8款模型的適配+調(diào)優(yōu)，覆蓋235B、32B、30B、14B、8B、4B、1.7B、0.6B各種參數(shù)。

隨著算力成本的降低和性能的提升，業(yè)內(nèi)分析普遍認(rèn)為，千問3為即將到來的智能體Agent和大模型應(yīng)用爆發(fā)提供了更好的支持。阿里云智能集團(tuán)副總裁霍嘉在接受《科創(chuàng)板日?qǐng)?bào)》采訪時(shí)表示，“模型推理模型能力不斷提高，使得當(dāng)前在業(yè)內(nèi)有共識(shí)，今年會(huì)是 AI應(yīng)用爆發(fā)的真正元年。

▍通用Agent在工程和技術(shù)兩個(gè)方面仍面臨挑戰(zhàn)

華創(chuàng)證券在評(píng)價(jià)千問3大模型時(shí)稱， Agent訓(xùn)練與落地成為了 AI+ 敘事的下一重心。天風(fēng)證券認(rèn)為，AI Agent市場(chǎng)規(guī)模有望超萬億，通義千問已發(fā)布多行業(yè)垂直生態(tài)體系，有望成為B端Agent鏈主。

《科創(chuàng)板日?qǐng)?bào)》注意到，在第八屆數(shù)字中國(guó)建設(shè)峰會(huì)期間，中國(guó)一汽正式發(fā)布企業(yè)智能體OpenMind。這是汽車行業(yè)首個(gè)面向全集團(tuán)運(yùn)營(yíng)管理的AI Agent，正是基于阿里通義大模型打造。

此外，中國(guó)電信、螞蟻集團(tuán)等也紛紛發(fā)布了智能體相關(guān)平臺(tái)，以加速AI Agent在政務(wù)、金融等領(lǐng)域落地：中國(guó)電信正式發(fā)布星辰行業(yè)Agent平臺(tái)；螞蟻數(shù)科則發(fā)布了面向金融機(jī)構(gòu)發(fā)布智能體開發(fā)平臺(tái)Agentar。

不過，通用Agent在工程和技術(shù)模型兩個(gè)方面仍面臨挑戰(zhàn)。一名業(yè)內(nèi)人士表示，“實(shí)際上能夠處理通用或復(fù)雜任務(wù)的并不多。這些產(chǎn)品要么不夠通用，要么無法應(yīng)對(duì)復(fù)雜的任務(wù)。”

阿里云 CTO 和通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人近日在接受媒體采訪時(shí)透露，今年在大模型領(lǐng)域，相對(duì)確定的進(jìn)展是兩個(gè)主線，一是模型能力上，會(huì)繼續(xù)在類人思考和多模態(tài)上有提升；二是模型和底層云計(jì)算系統(tǒng)會(huì)更深度結(jié)合，能同時(shí)提升訓(xùn)練和推理效率，讓模型更好用、更普及。

在談及DeepSeek R1時(shí)，周靖人表示，DeepSeek看起來有算力、有 Infra 層、有模型，但不構(gòu)成一個(gè)完整的云服務(wù)。"我們的一個(gè)核心認(rèn)知是，大模型發(fā)展和云體系的支撐不可分割?！?/p>

談及國(guó)外內(nèi)大模型競(jìng)爭(zhēng)對(duì)手的你追我趕，他認(rèn)為，市場(chǎng)空間很大，歡迎一起來推動(dòng) AI 產(chǎn)業(yè)的發(fā)展。至于誰領(lǐng)先，他說：

“還是看市場(chǎng)反饋，把選擇權(quán)留給客戶?！?/strong>