4月30日,小米開源首個(gè)推理大模型“Xiaomi MiMo”,聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。目前,MiMo-7B 已開源4個(gè)模型至HuggingFace。

數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評(píng)集上,MiMo 用 7B 的參數(shù)規(guī)模,超越了OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規(guī)模的開源推理模型 QwQ-32B-Preview。

就在昨天,阿里巴巴宣布開源新一代通義千問模型Qwen3。千問3是國內(nèi)首個(gè)“混合推理模型”,將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型。另有市場消息透露,DeepSeek的R2也即將發(fā)布。