品玩4月3日訊,據(jù) AIBASE 報道,字節(jié)跳動近日發(fā)布其最新的文本轉(zhuǎn)語音(TTS)模型MegaTTS3。根據(jù)技術(shù)社區(qū)反饋和官方信息,MegaTTS3 被譽為語音合成領域的一次重要進步。

MegaTTS3 是一款由字節(jié)跳動與浙江大學合作開發(fā)的開源語音合成工具,其主干模型僅包含0. 45 億個參數(shù),相較于傳統(tǒng)大型TTS模型顯得異常輕量。這一設計不僅降低了計算資源需求,還使其更適合在資源受限的設備上部署,例如移動設備或邊緣計算場景。

該模型支持中文和英文語音生成,并具備獨特的中英混合朗讀能力,能夠自然流暢地處理雙語文本。此外,MegaTTS3 還引入了口音強度控制功能,用戶可以通過調(diào)整參數(shù)生成帶有不同程度口音的語音,為個性化語音應用提供了更多可能性。技術(shù)專家在評論中特別指出:"支持口音強度控制,這一點非常亮眼。"

打開網(wǎng)易新聞 查看精彩圖片