
Ollama v0.6.4 預(yù)發(fā)布版重磅更新!
Ollama作為當(dāng)前最熱門(mén)的本地大模型運(yùn)行框架,近日推出了v0.6.4 預(yù)發(fā)布版本,帶來(lái)了一系列關(guān)鍵修復(fù)和優(yōu)化!本次更新重點(diǎn)改進(jìn)了Gemma 3的性能表現(xiàn),并修復(fù)了多個(gè)影響體驗(yàn)的 Bug,AI 玩家們趕緊來(lái)一睹為快!
主要更新內(nèi)容
1./api/show 新增模型能力顯示(如視覺(jué)支持)
? 現(xiàn)在通過(guò)
/api/show
接口可以查看模型的完整能力,包括是否支持多模態(tài)(如圖像識(shí)別),方便開(kāi)發(fā)者更靈活地調(diào)用模型功能。
2.Gemma 3 內(nèi)存泄漏問(wèn)題修復(fù)
? 此前 Gemma 3 在長(zhǎng)時(shí)間推理時(shí)可能出現(xiàn)OOM(內(nèi)存不足)崩潰,v0.6.4 優(yōu)化了內(nèi)存管理,運(yùn)行更穩(wěn)定!
3.Gemma 3 多語(yǔ)言字符處理增強(qiáng)
? 修復(fù)了 Gemma 3 對(duì)**非英文字符(如中文、日文)**的識(shí)別和生成問(wèn)題,輸出質(zhì)量更高!
4.DeepSeek 架構(gòu)上下文偏移問(wèn)題修復(fù)
? 部分采用 DeepSeek 架構(gòu)的模型(如 DeepSeek LLM)在長(zhǎng)文本生成時(shí)可能出現(xiàn)**“上下文錯(cuò)亂”**,本次更新徹底解決!
5.Gemma 3 長(zhǎng)文本輸出優(yōu)化(512/1024 tokens 后質(zhì)量下降修復(fù))
? 在 v0.6.3 中,Gemma 3 生成超過(guò) 512 或 1024 tokens 后,回答質(zhì)量會(huì)明顯下降,新版本已修復(fù)該問(wèn)題,長(zhǎng)文生成更流暢!
6.? Linux 平臺(tái)新增 RDNA4 顯卡支持(AMD 用戶(hù)狂喜?。?/strong>
? 現(xiàn)在RDNA4 架構(gòu)顯卡(如 RX 7000 系列)在 Linux 上也能更好地運(yùn)行 Ollama!
如果你是 Ollama 用戶(hù),可以通過(guò)以下命令更新到最新預(yù)發(fā)布版本:
ollama upgrade
或手動(dòng)下載最新版本:Ollama GitHub Release[1]
為什么這次更新很重要?
?Gemma 3 用戶(hù):終于不用再擔(dān)心內(nèi)存爆炸或長(zhǎng)文本崩壞了!
?非英語(yǔ)用戶(hù):生成質(zhì)量提升,特別是中文、日文等復(fù)雜字符的處理更精準(zhǔn)。
?AMD 顯卡玩家:RDNA4 支持讓 Linux 用戶(hù)也能暢快跑模型!
Ollama v0.6.4 雖然只是預(yù)發(fā)布版,但已經(jīng)解決了多個(gè)關(guān)鍵問(wèn)題,特別是Gemma 3 和 DeepSeek 架構(gòu)的穩(wěn)定性大幅提升!如果你是 AI 開(kāi)發(fā)者或本地模型愛(ài)好者,強(qiáng)烈建議升級(jí)體驗(yàn)!
引用鏈接
[1]
Ollama GitHub Release: https://github.com/ollama/ollama/releases
我們相信人工智能為普通人提供了一種“增強(qiáng)工具”,并致力于分享全方位的AI知識(shí)。在這里,您可以找到最新的AI科普文章、工具評(píng)測(cè)、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,讓AI助力您的未來(lái)發(fā)展。
熱門(mén)跟貼