萬(wàn)萬(wàn)沒(méi)想到老外追國(guó)貨比我們還積極,更沒(méi)想他們?cè)谧返木故菄?guó)產(chǎn)大模型。在韓國(guó)網(wǎng)友一句“韓國(guó)沒(méi)有有競(jìng)爭(zhēng)力的開源基礎(chǔ)模式,即使存在的封閉模式開源,也似乎沒(méi)有什么競(jìng)爭(zhēng)力”的羨慕下,中國(guó)開源LLM模型秒變“別人家的小孩”。
國(guó)產(chǎn)大模型到底有多火?過(guò)去一年海外社交平臺(tái)上“千問(wèn)又開源新模型了!”“千問(wèn)新模型還挺好用!”這兩大主題討論帖頻頻出現(xiàn),海外網(wǎng)友瘋狂安利通義千問(wèn)大模型。通義Qwen1.5-72B模型在開放研究機(jī)構(gòu)LMSYS Org推出的基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena上,多次進(jìn)入盲測(cè)結(jié)果全球前10,受到海外開發(fā)者的追捧。
越南網(wǎng)友點(diǎn)贊Qwen-72B開箱即用,表現(xiàn)完全不輸GPT-4。一邊被Qwen-72B模型的多語(yǔ)言能力征服,一邊給非英語(yǔ)群體種草國(guó)產(chǎn)大模型。癡迷通義千問(wèn)大模型的海外網(wǎng)友,發(fā)現(xiàn)了Qwen-72B的隱藏技能:不需要寫任何特殊提示,Qwen-72B就能給出勝過(guò)專業(yè)醫(yī)療LLM給出的回答。當(dāng)有網(wǎng)友吐槽Qwen-72B模型太大,不能輕松測(cè)試時(shí),越南網(wǎng)友立刻推薦了通義開源大模型家族下的Qwen-14B,還有網(wǎng)友推薦Qwen1.5。
眾多大模型廠商中,通義千問(wèn)做到了全尺寸開源,大量海外開發(fā)者在線催更,網(wǎng)友稱這是“開放視覺(jué)語(yǔ)言模型的瘋狂進(jìn)步”。不得不說(shuō),我國(guó)的模型還是卷出來(lái)了!
最近通義千問(wèn)還開源了1000 億參數(shù)的Qwen1.5-110B,讓一眾海外開發(fā)者躍躍欲試,在全球最大開源社區(qū)HuggingFace排行榜上力壓Meta的Llama-3-70B 登頂?shù)谝弧?/p>
而阿里云在5月9日最新發(fā)布的通義千問(wèn)2.5,在理解能力、邏輯推理、指令遵循和代碼能力上也卷出了新高度,在中文語(yǔ)境下更是趕超GPT-4 Turbo,堪稱地表最強(qiáng)中文大模型。
老外們從懷疑到嘗試,從嘗試到催更,不斷被阿里云通義千問(wèn)大模型的實(shí)力征服。國(guó)產(chǎn)大模型的崛起,讓更多老外為東方力量?jī)A倒,直呼“真香”!
熱門跟貼