品玩4月2日訊,據(jù) AIBase 報(bào)道,MiniMax Audio正式發(fā)布了其全新的Speech-02系列語(yǔ)音模型,支持30多種語(yǔ)音,一次性可以輸入20萬(wàn)字符。為用戶帶來(lái)更真實(shí)、更流暢、更便捷的音頻體驗(yàn)。
全新的Speech-02系列是本次更新的核心亮點(diǎn)。據(jù)官方介紹,該系列在多語(yǔ)言覆蓋能力上實(shí)現(xiàn)了顯著提升,能夠更準(zhǔn)確、更地道地呈現(xiàn)多種語(yǔ)言的發(fā)音。Speech-02的人聲相似度高達(dá)99%,這意味著合成的語(yǔ)音聽起來(lái)更加自然、貼近真人. 此外,該模型還實(shí)現(xiàn)了零節(jié)奏故障,徹底解決了音頻播放過(guò)程中可能出現(xiàn)的卡頓和節(jié)奏不穩(wěn)問(wèn)題,保證了聽感的連貫性和流暢性。
除了核心的語(yǔ)音合成技術(shù)的提升,MiniMax Audio還推出了多項(xiàng)實(shí)用新功能。全新的“Read Anything”功能允許用戶通過(guò)上傳本地文件或粘貼網(wǎng)絡(luò)URL,即可隨時(shí)隨地收聽各類內(nèi)容,極大地拓展了用戶獲取音頻信息的渠道, 我們之前的對(duì)話]。無(wú)論是文檔、電子書還是網(wǎng)頁(yè)文章,用戶都可以輕松轉(zhuǎn)化為自己喜歡的音色進(jìn)行聆聽。

打開網(wǎng)易新聞 查看精彩圖片
熱門跟貼