打開(kāi)網(wǎng)易新聞 查看精彩圖片

Ollama v0.6.4 預(yù)發(fā)布版重磅更新!

Ollama作為當(dāng)前最熱門(mén)的本地大模型運(yùn)行框架,近日推出了v0.6.4 預(yù)發(fā)布版本,帶來(lái)了一系列關(guān)鍵修復(fù)和優(yōu)化!本次更新重點(diǎn)改進(jìn)了Gemma 3的性能表現(xiàn),并修復(fù)了多個(gè)影響體驗(yàn)的 Bug,AI 玩家們趕緊來(lái)一睹為快!

主要更新內(nèi)容

  1. 1./api/show 新增模型能力顯示(如視覺(jué)支持)

  • ? 現(xiàn)在通過(guò)/api/show接口可以查看模型的完整能力,包括是否支持多模態(tài)(如圖像識(shí)別),方便開(kāi)發(fā)者更靈活地調(diào)用模型功能。

2.Gemma 3 內(nèi)存泄漏問(wèn)題修復(fù)

  • ? 此前 Gemma 3 在長(zhǎng)時(shí)間推理時(shí)可能出現(xiàn)OOM(內(nèi)存不足)崩潰,v0.6.4 優(yōu)化了內(nèi)存管理,運(yùn)行更穩(wěn)定!

3.Gemma 3 多語(yǔ)言字符處理增強(qiáng)

  • ? 修復(fù)了 Gemma 3 對(duì)**非英文字符(如中文、日文)**的識(shí)別和生成問(wèn)題,輸出質(zhì)量更高!

4.DeepSeek 架構(gòu)上下文偏移問(wèn)題修復(fù)

  • ? 部分采用 DeepSeek 架構(gòu)的模型(如 DeepSeek LLM)在長(zhǎng)文本生成時(shí)可能出現(xiàn)**“上下文錯(cuò)亂”**,本次更新徹底解決!

5.Gemma 3 長(zhǎng)文本輸出優(yōu)化(512/1024 tokens 后質(zhì)量下降修復(fù))

  • ? 在 v0.6.3 中,Gemma 3 生成超過(guò) 512 或 1024 tokens 后,回答質(zhì)量會(huì)明顯下降,新版本已修復(fù)該問(wèn)題,長(zhǎng)文生成更流暢!

6.? Linux 平臺(tái)新增 RDNA4 顯卡支持(AMD 用戶(hù)狂喜?。?/strong>

  • ? 現(xiàn)在RDNA4 架構(gòu)顯卡(如 RX 7000 系列)在 Linux 上也能更好地運(yùn)行 Ollama!

如何升級(jí)?

如果你是 Ollama 用戶(hù),可以通過(guò)以下命令更新到最新預(yù)發(fā)布版本:

ollama upgrade

或手動(dòng)下載最新版本:Ollama GitHub Release[1]

為什么這次更新很重要?

  • ?Gemma 3 用戶(hù):終于不用再擔(dān)心內(nèi)存爆炸或長(zhǎng)文本崩壞了!

  • ?非英語(yǔ)用戶(hù):生成質(zhì)量提升,特別是中文、日文等復(fù)雜字符的處理更精準(zhǔn)。

  • ?AMD 顯卡玩家:RDNA4 支持讓 Linux 用戶(hù)也能暢快跑模型!

結(jié)語(yǔ)

Ollama v0.6.4 雖然只是預(yù)發(fā)布版,但已經(jīng)解決了多個(gè)關(guān)鍵問(wèn)題,特別是Gemma 3 和 DeepSeek 架構(gòu)的穩(wěn)定性大幅提升!如果你是 AI 開(kāi)發(fā)者或本地模型愛(ài)好者,強(qiáng)烈建議升級(jí)體驗(yàn)!

引用鏈接

[1]Ollama GitHub Release: https://github.com/ollama/ollama/releases

我們相信人工智能為普通人提供了一種“增強(qiáng)工具”,并致力于分享全方位的AI知識(shí)。在這里,您可以找到最新的AI科普文章、工具評(píng)測(cè)、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,讓AI助力您的未來(lái)發(fā)展。