4月30日,小米宣布開源首個為推理而生的大模型Xiaomi MiMo。據(jù)稱,其在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview。

受此消息影響,今日小米股價漲5.27%,金山云和金山軟件更是分別大漲14.20%和7.07%。業(yè)內(nèi)人士認為,小米作為國產(chǎn)頭部的手機品牌廠商,此次開源的小參數(shù)規(guī)模模型展現(xiàn)了較強的性能,為AI在手機端側(cè)的應(yīng)用和運行提供了更堅實的模型基礎(chǔ)。

隨著MiMo模型的開源,小米剛剛成立不久的小米大模型Core團隊也終于浮出水面。小米創(chuàng)始人雷軍曾在2023年表示,自2016年組建AI團隊以來,到2023年4月第一時間成立專職大模型團隊,經(jīng)過多次擴展,小米AI團隊相關(guān)人員規(guī)模已達3000多人,逐步建立了視覺、語音、聲學(xué)、知識圖譜、NLP、機器學(xué)習(xí)、多模態(tài)等AI技術(shù)能力。

小米大力“押寶”大模型早在去年底便已有消息傳出。DeepSeek-V3爆火之后,背后的AI“天才少女”羅福莉引發(fā)了大眾的關(guān)注,彼時就有媒體報道稱,雷軍以千萬年薪招攬DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉,領(lǐng)導(dǎo)小米AI大模型團隊。

值得一提的是,DeepSeek同日于AI開源社區(qū)Hugging Face上發(fā)布了一個名為DeepSeek-Prover-V2-671B的新模型。據(jù)悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多種計算精度,方便模型更快、更省資源地訓(xùn)練和部署,參數(shù)達6710億,或為去年發(fā)布的Prover-V1.5數(shù)學(xué)模型升級版本。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時支持超長上下文,最大位置嵌入達16.38萬,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提高推理效率。

中信建投研報表示,大模型能力不斷迭代增長,但模型之間差異在縮小。這些技術(shù)需要在終端設(shè)備上應(yīng)用落地,最終通過這些應(yīng)用/終端實現(xiàn)商業(yè)價值的轉(zhuǎn)化,從而形成一個從投資到變現(xiàn)的完整閉環(huán)。目前,Meta、字節(jié)、小米等巨頭已經(jīng)開始大力布局端側(cè)AI,搶奪AI Agent入口。除了手機、PC、眼鏡、耳機外,潛在的端側(cè)AI基數(shù)巨大,家電、機器人、智能車、教育辦公設(shè)備、玩具等都受益于端側(cè)AI的趨勢,AI嵌入將帶來廣泛的硬件升級。重點關(guān)注算力、存儲、連接、電力等硬件環(huán)節(jié)。

(聲明:文章內(nèi)容和數(shù)據(jù)僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。)

編輯|||金冥羽 杜波

校對|陳柯名

封面圖片來源:視覺中國

每日經(jīng)濟新聞綜合證券時報、財聯(lián)社、Wind等