
作者|冰拿鐵
編輯|星奈
媒體|AI大模型工場(chǎng)
還記得去年全網(wǎng)刷屏的“謝帝謝帝我要Diss你”嗎?當(dāng)下,朋友說(shuō)要寫(xiě)歌懟你時(shí),別以為他們?cè)谶^(guò)嘴癮——AI音樂(lè)大模型正讓每個(gè)嘴炮王者動(dòng)動(dòng)手指,即可秒變創(chuàng)作鬼才:
隨著AI重構(gòu)音樂(lè)創(chuàng)作生態(tài),樂(lè)理、和聲、編曲等專(zhuān)業(yè)鴻溝則正被技術(shù)填平,讓小白也能爆改“AI音樂(lè)家”,用音樂(lè)傳情達(dá)意,無(wú)論是“寫(xiě)歌diss你”,還是深情款款的“想把我唱給你聽(tīng)”,都能在AI加持下分分鐘實(shí)現(xiàn)?;诖?,AI音樂(lè)也被AIGC行業(yè)視為極具潛力的落地場(chǎng)景,相關(guān)概念股的市場(chǎng)熱度持續(xù)水漲船高。
然而,這樣一個(gè)“大眾”賽道,布局者卻寥寥無(wú)幾,尤其是國(guó)內(nèi),存在巨大空白待填補(bǔ)。好在昆侖萬(wàn)維等頭號(hào)玩家在產(chǎn)業(yè)爆發(fā)前夜,即敏銳預(yù)判到其潛力,并基于自身在AI、音樂(lè)等領(lǐng)域的深耕與積淀,搶先完成占位:
去年四月,昆侖萬(wàn)維發(fā)布了第一代音樂(lè)生成模型Mureka V1(SkyMusic),并在此后一年持續(xù)打磨技術(shù),迭代升級(jí),把“自己卷自己”演繹得淋漓盡致。
3月26日,昆侖萬(wàn)維震撼發(fā)布全新基座模型:Mureka V6,并同步發(fā)布了全球首個(gè)采用 CoT 技術(shù)的音樂(lè)模型Mureka O1,在強(qiáng)大推理模型賦能下,Mureka O1會(huì)在音樂(lè)生成過(guò)程中加入思考與自我批判,顯著提升音樂(lè)品質(zhì)、音樂(lè)創(chuàng)作效率和靈活性。

而無(wú)論是Mureka V6還是O1模式,可支持的歌曲創(chuàng)作曲風(fēng)和情緒均涉及20余種,包括爵士/Jazz、電子/electronic、流行/pop、鄉(xiāng)村country等;情緒涵蓋快樂(lè)、放縱、神秘、充滿(mǎn)活力、悲傷等,能想到的風(fēng)格無(wú)所不包!

Mureka V6進(jìn)入界面

Mureka O1進(jìn)入界面
這讓行業(yè)感嘆,隨著“會(huì)思考的AI莫扎特”上線(xiàn),過(guò)去AI音樂(lè)生成的“黑箱創(chuàng)作”、節(jié)奏斷層、風(fēng)格混亂、樂(lè)器編排打架等問(wèn)題將大幅減少,音樂(lè)界終于迎來(lái)了自己的“DeepSeek時(shí)刻”。
與此同時(shí),《Mureka》AI音樂(lè)人MV全網(wǎng)首發(fā),給網(wǎng)友帶來(lái)一場(chǎng)春日視聽(tīng)盛宴。

《Mureka》AI音樂(lè)人MV全網(wǎng)首發(fā),歌手:Mureka;該作品由AI生成,其中音樂(lè)由Mureka生成,視頻由SkyReels技術(shù)支持生成。
那么,“會(huì)思考的音樂(lè)家”表現(xiàn)如何?我們一起來(lái)看看吧!
一、零幀起手、多語(yǔ)言覆蓋、“氛圍感”BGM神器……“AI音樂(lè)家”Mureka強(qiáng)得可怕!
AI時(shí)代,不僅音樂(lè)無(wú)國(guó)界,音樂(lè)家也沒(méi)有門(mén)檻了!一番體驗(yàn)下來(lái),最驚艷我的是,Mureka上手性強(qiáng)、極易操作,是“零幀起手”的端到端創(chuàng)作神器,支持歌詞、作曲、編曲、人聲全流程生成,音樂(lè)小白也可以將自身情感注入AI生成的框架中,通過(guò)簡(jiǎn)單的流程生成滿(mǎn)意的作品,這將極大地拓展音樂(lè)創(chuàng)作者群體,讓普通人有機(jī)會(huì)參與到音樂(lè)創(chuàng)作中來(lái),促進(jìn)音樂(lè)內(nèi)容的多樣化和個(gè)性化。
比如,動(dòng)動(dòng)手指,即可給朋友生成一首講述雙方友情的春日詩(shī),暖她一整年~

當(dāng)開(kāi)車(chē)上高速時(shí),也可以來(lái)一首“充滿(mǎn)自由氣息的仿佛在公路旅行的流行搖滾”,一鍵擁有獨(dú)屬自己的《Take Me Home, Country Roads》!

再輸入“在人來(lái)人往的城市里,置身于餐廳中悠閑的品嘗美食時(shí)播放的爵士歌曲”,就是這么Chill~

EMO時(shí),生成一首“深夜的酒吧在迷幻的燈光下黯然神傷聽(tīng)到的靈魂歌曲”:

半夜失眠,輾轉(zhuǎn)反側(cè),思念已分手三年的前女友,這時(shí)不如化憂(yōu)傷為音樂(lè),把傷感釀成詩(shī),一鍵生成“懷念曾經(jīng)的感情的傷感R&B”:

同時(shí),輸入場(chǎng)景描述性Prompt,即可生成與特定場(chǎng)景完美契合的完整背景音樂(lè)。比如,選擇Mureka V6模型,選擇「純音樂(lè)」創(chuàng)作功能,在文本框內(nèi)輸入「Latin song」,點(diǎn)擊「創(chuàng)作」,Mureka快速為我們生成一首拉丁風(fēng)純音樂(lè),仿佛置身于海灘,感受到熱情且愜意的度假氛圍。真·氛圍感神器!

而對(duì)于“提示詞詞窮”的零基礎(chǔ)小白,Mureka還貼心準(zhǔn)備了提示詞模板,如“一首悠閑浪漫的歌曲,講述與心上人的深夜對(duì)話(huà)”一首充滿(mǎn)力量的主題曲,強(qiáng)烈的嗓音和鼓舞人心的節(jié)拍”……化身用戶(hù)最強(qiáng)嘴替。
此前很多用戶(hù)自我調(diào)侃,自己用AI時(shí)像極了“說(shuō)不明白訴求的甲方”。而Mureka預(yù)判了用戶(hù)的預(yù)判,激活用戶(hù)潛意識(shí)里的靈感,讓其直呼“對(duì)對(duì)對(duì),我就是要這種感覺(jué)來(lái)著!”

同時(shí),Mureka還有歌曲參考(Reference Fuction)模式,即將音樂(lè)本身作為提示,用戶(hù)可直接上傳音頻或Youtube鏈接作為創(chuàng)作提示,讓Mureka“有樣學(xué)樣”,最快速度get用戶(hù)心水歌曲的精髓。
比如,以《知否知否》為參考,上傳古詩(shī)詞歌詞,讓AI把古詩(shī)詞《行香子》《漠漠春陰酒半酣》唱出來(lái),結(jié)果可見(jiàn),AI音樂(lè)感情充沛、旋律動(dòng)人,已跨越“可用性”門(mén)檻,進(jìn)入“高音質(zhì)”階段,突破了以往AI音樂(lè)局限于背景音或機(jī)械合成的瓶頸,使得AI音樂(lè)從輔助工具升級(jí)為創(chuàng)作伙伴,并不斷拓展藝術(shù)邊界,詩(shī)樂(lè)相和,讓古詩(shī)詞完成多樣藝術(shù)表達(dá)。

也可以玩梗,以《好運(yùn)來(lái)》為參考曲目,給自家張姐麻辣燙店定制店歌。感受下這歡快の小曲,張姐聽(tīng)了瞬間喜笑顏開(kāi),立省大額推廣費(fèi):

當(dāng)然,在全球化時(shí)代,Mureka V6 還支持美歐亞主流10種語(yǔ)言(線(xiàn)上支持中英葡西日韓)的歌詞與音樂(lè)生成,涵蓋多種風(fēng)格與流派,滿(mǎn)足全球用戶(hù)需求。
如下,中文表現(xiàn)可圈可點(diǎn):

外語(yǔ)歌也不遜色,音色可控且保持一致性,不會(huì)讓聽(tīng)眾“出戲”,在人聲音質(zhì)、自然度等維度,一如既往地維持業(yè)內(nèi)領(lǐng)先的SOTA水平

此外,Mureka還支持音軌分離下載,提供音樂(lè)生成的獨(dú)立的人聲、伴奏等多軌輸出,方便用戶(hù)后續(xù)混音與二次創(chuàng)作,讓音樂(lè)專(zhuān)業(yè)玩家狂喜,開(kāi)啟“無(wú)限D(zhuǎn)IY”模式。
一番體驗(yàn)下來(lái),流程簡(jiǎn)單、風(fēng)格多樣的Mureka“人如其名”:據(jù)悉,Mureka名字的含義是Eureka flows music (尤里卡時(shí)刻),其中,Eureka源自希臘語(yǔ)的感嘆詞,意為我發(fā)現(xiàn)了,常用于表達(dá)靈感噴涌的時(shí)刻。
如今,Mureka加持下,每個(gè)創(chuàng)作者、音樂(lè)愛(ài)好者都能不斷迎接自己的“尤里卡時(shí)刻”,并在音樂(lè)靈感爆發(fā)時(shí)快速將其落地,并創(chuàng)作出屬于自己風(fēng)格的歌曲。
那么,讓用戶(hù)實(shí)現(xiàn)“音樂(lè)自由”背后,有著哪些硬核技術(shù)支撐?
二、極致體驗(yàn)背后:AI音樂(lè)的SOTA級(jí)玩家,帶來(lái)哪些技術(shù)顛覆?
在技術(shù)上,Mureka以先行者和領(lǐng)頭羊的姿態(tài)打出明牌。此前,業(yè)界關(guān)于音樂(lè)領(lǐng)域的算法工作非常少,只有少數(shù)幾個(gè)團(tuán)隊(duì)公開(kāi)了自己的工作成果。而此次,Mureka團(tuán)隊(duì)以論文形式公開(kāi)了Mureka O1的實(shí)現(xiàn)原理:

項(xiàng)目主頁(yè):MusiCoT.github.io
具體而言,作為中國(guó)首個(gè)實(shí)現(xiàn)音樂(lè)AIGC SOTA的大模型,Mureka集成了在自然語(yǔ)言處理和音頻生成技術(shù)上的最新突破,使得AI音樂(lè)創(chuàng)作表現(xiàn)達(dá)到新高度:
其中,在Mureka V6中,引入自研 ICL(in-context learning)技術(shù),使得聲場(chǎng)更加開(kāi)闊,人聲質(zhì)感和混音設(shè)計(jì)進(jìn)一步強(qiáng)化。當(dāng)然,重頭戲還在后面,即首次在音樂(lè)生成領(lǐng)域應(yīng)用先進(jìn)的Chain-of-Thought(CoT)技術(shù)的Mureka O1,讓AI音樂(lè)神器化身“會(huì)思考的AI莫扎特”:
Mureka O1 是基于 Mureka V6 之上的推理優(yōu)化版本,包含了Mureka團(tuán)隊(duì)最新發(fā)布的音樂(lè)生成領(lǐng)域的創(chuàng)新研究成果——MusiCoT,采取思維鏈Chain-of-Thought (CoT)方法。不同于傳統(tǒng)自回歸模型逐步生成音頻,MusiCoT首次在細(xì)粒度音頻token預(yù)測(cè)前預(yù)生成整體音樂(lè)結(jié)構(gòu),大幅提升生成音樂(lè)的結(jié)構(gòu)連貫性與樂(lè)器編排精準(zhǔn)度。
通俗地說(shuō),不會(huì)深度思考推理的AI音樂(lè)模型像沒(méi)有圖紙的施工隊(duì),直接開(kāi)始砌磚頭,逐段生成音樂(lè)片段,容易導(dǎo)致副歌和主歌風(fēng)格不搭、鼓點(diǎn)突然消失等問(wèn)題,就像房子蓋到一半發(fā)現(xiàn)廁所沒(méi)留水管。
思維鏈則爆改流程為“先通過(guò)縝密思考,畫(huà)個(gè)藍(lán)圖再施工”,規(guī)劃整首歌的“結(jié)構(gòu)藍(lán)圖”,比如前奏用鋼琴引入,主歌部分加入貝斯,副歌疊加弦樂(lè)和鼓,間奏來(lái)段吉他solo……相當(dāng)于先確定哪里是客廳、哪里是臥室,再基于架構(gòu)逐塊生成具體旋律。就像按圖紙精準(zhǔn)施工,確保每個(gè)樂(lè)器的出現(xiàn)時(shí)機(jī)、音量大小都嚴(yán)絲合縫,避免了傳統(tǒng)模型“打架子鼓時(shí)突然插進(jìn)嗩吶”的違和感,減少錯(cuò)拍、樂(lè)器沖突等車(chē)禍現(xiàn)場(chǎng),特別適合需要精細(xì)控制結(jié)構(gòu)的商用創(chuàng)作,比如游戲配樂(lè)或影視OST。
如此一來(lái),通過(guò)逐步反饋與優(yōu)化機(jī)制,Mureka顯著提升了歌詞旋律契合度、演唱準(zhǔn)確性和藝術(shù)表現(xiàn)力,同時(shí)保持了低延時(shí)音樂(lè)生成。
同時(shí),MusiCoT基于CLAP模型,無(wú)需人工標(biāo)注即具備高擴(kuò)展性,并顯著提高了生成音樂(lè)的可解釋性和質(zhì)量,讓AI進(jìn)化成“舉一反三的作曲小天才”。
如今,Mureka O1在與Suno V4等主流系統(tǒng)的客觀評(píng)測(cè)中表現(xiàn)卓越,不僅保持了低延遲音樂(lè)生成,還顯著提升了歌詞旋律契合度、演唱準(zhǔn)確性和藝術(shù)表現(xiàn)力,在發(fā)音唱對(duì)率、樂(lè)段準(zhǔn)確率、文本相關(guān)度、制作質(zhì)量等客觀指標(biāo)中,Mureka V6都顯著優(yōu)于Suno V4。


Mureka O1在文本生成音樂(lè)的客觀測(cè)評(píng)中得分(來(lái)源:Mureka官方測(cè)評(píng))
當(dāng)然,音樂(lè)作為“靈魂按摩器”,最重要的還是聽(tīng)感。在最新的音樂(lè)評(píng)測(cè)中,Mureka O1展現(xiàn)出卓越的音樂(lè)品質(zhì),在最終的整體聽(tīng)感評(píng)測(cè)超過(guò)了Suno V4。其中,Mureka O1在樂(lè)器演奏法多樣性和配器設(shè)計(jì)方面明顯超越Suno V4,在音質(zhì)、人聲質(zhì)感及BGM質(zhì)感上也實(shí)現(xiàn)了顯著提升。

Mureka O1在主觀測(cè)評(píng)中展現(xiàn)出卓越的音樂(lè)品質(zhì),整體聽(tīng)感評(píng)測(cè)超越Suno V4(來(lái)源:Mureka官方測(cè)評(píng))
沒(méi)有實(shí)感?放一個(gè)Mureka O1與Suno V4的對(duì)比,自行感受“降維打擊”級(jí)音質(zhì):

悅耳無(wú)需多言!綜上所述,MusiCoT正為高保真AI音樂(lè)生成開(kāi)辟全新路徑,推動(dòng)音樂(lè)AI創(chuàng)作邁入結(jié)構(gòu)化時(shí)代。
三、用戶(hù)價(jià)值、商業(yè)價(jià)值兩開(kāi)花:以音樂(lè)為媒,構(gòu)建“數(shù)字巴別塔”!
值得一提的是,除了遙遙領(lǐng)先的音質(zhì)外,Mureka還是全球首個(gè)開(kāi)放API服務(wù)的AI音樂(lè)生成平臺(tái)。秉承“期待AI音樂(lè)能在多種場(chǎng)景下創(chuàng)造更大的價(jià)值”的愿景,Mureka同時(shí)開(kāi)放兩大類(lèi)共計(jì)五種API服務(wù),不僅包括音樂(lè)音頻生成API(兩種),還有語(yǔ)音合成API(三種)。無(wú)論是開(kāi)發(fā)者,還是音樂(lè)平臺(tái),都可以將Mureka的音樂(lè)生成能力無(wú)縫集成到自己的產(chǎn)品或平臺(tái)中,應(yīng)用AI音樂(lè)功能拓展自己的商業(yè)價(jià)值。
對(duì)于企業(yè)而言,Mureka可以輔助音樂(lè)、視頻、播客、廣告等場(chǎng)景中的UGC/PGC音樂(lè)創(chuàng)作,讓企業(yè)以極低的成本,用自己創(chuàng)作的版權(quán)音樂(lè),訓(xùn)練屬于自己的音樂(lè)模型,用于發(fā)布會(huì)、宣傳MV等商業(yè)場(chǎng)景,降本增效;
而對(duì)于個(gè)人創(chuàng)作者來(lái)說(shuō),創(chuàng)造力將進(jìn)一步得到釋放。正如《AI紅利:創(chuàng)作者解鎖萬(wàn)億市場(chǎng)》中指出,創(chuàng)意將是AI時(shí)代最好的生意,AI必將重塑創(chuàng)作者經(jīng)濟(jì),解鎖一個(gè)萬(wàn)億規(guī)模的藍(lán)海市場(chǎng)——AI淘汰的是機(jī)器式創(chuàng)作,但會(huì)放大人類(lèi)獨(dú)有的創(chuàng)造力:“未來(lái)最好的行業(yè)將是內(nèi)容行業(yè),那些具備思想深度、情感共鳴能力和文化洞察力的創(chuàng)作者,將借助AI工具釋放更大的創(chuàng)造力,成為新時(shí)代的贏家?!?/p>
這和昆侖萬(wàn)維戰(zhàn)略思路不謀而合。昆侖萬(wàn)維對(duì)音樂(lè)領(lǐng)域AIGC的探索,早在2021年就已經(jīng)開(kāi)始。昆侖萬(wàn)維董事長(zhǎng)兼CEO方漢認(rèn)為,AI音樂(lè)生成技術(shù)的出現(xiàn),并不是為了“切走音樂(lè)行業(yè)的蛋糕”,而是使非專(zhuān)業(yè)人士也能輕松創(chuàng)作出具有一定水準(zhǔn)的音樂(lè)作品,提高行業(yè)整體的生產(chǎn)力和創(chuàng)新能力。
基于此,昆侖萬(wàn)維喊出“All in AGI與AIGC”——早在2022年12月時(shí),昆侖萬(wàn)維就正式發(fā)布了「昆侖天工」AIGC全系列算法與模型,并宣布模型開(kāi)源,成為國(guó)內(nèi)第一個(gè)全身心投入到AIGC開(kāi)源社區(qū)的公司。從音樂(lè)到視頻進(jìn)行大量研發(fā)投入,目的就是降低創(chuàng)作門(mén)檻,實(shí)現(xiàn)通用人工智能,讓每個(gè)人更好地塑造和表達(dá)自我。
這也符合行業(yè)發(fā)展的大勢(shì)所趨,即從“狂卷基礎(chǔ)模型”到“落地為王”。如今,以AI音樂(lè)為代表的AIGC勢(shì)不可擋,存在巨大產(chǎn)業(yè)藍(lán)海:在我國(guó),《2024中國(guó)音樂(lè)產(chǎn)業(yè)發(fā)展總報(bào)告》顯示,2023年中國(guó)數(shù)字音樂(lè)產(chǎn)業(yè)規(guī)模達(dá)到893.45億元,中國(guó)網(wǎng)絡(luò)音樂(lè)用戶(hù)規(guī)模達(dá)到7.26億。政策層面,《“十四五”文化產(chǎn)業(yè)發(fā)展規(guī)劃》明確提出,推動(dòng)人工智能技術(shù)與文化創(chuàng)作、傳播、消費(fèi)深度融合,促進(jìn)文化產(chǎn)業(yè)的智能化轉(zhuǎn)型,釋放利好信號(hào);
放眼全球,根據(jù)Fortune Business Insights數(shù)據(jù),2023年全球數(shù)字音頻工作站(DAW, Digital Audio Workstation)市場(chǎng)規(guī)模高達(dá)約30億美元,預(yù)計(jì)2026年約70%的DAW企業(yè)將使用AI技術(shù)輔助音樂(lè)創(chuàng)作。
這也在Mureka的用戶(hù)群體中得到了驗(yàn)證,目前,有超過(guò) 100 個(gè)國(guó)家和地區(qū)的用戶(hù)用Mureka。值得一提的是,作為最早開(kāi)拓海外市場(chǎng)的中國(guó)企業(yè)之一,昆侖萬(wàn)維當(dāng)前業(yè)務(wù)已覆蓋全球一百多個(gè)國(guó)家和地區(qū),全球平均月活躍用戶(hù)近4億,覆蓋AGI與AIGC、信息分發(fā)、元宇宙、社交娛樂(lè)及游戲等多個(gè)領(lǐng)域,讓行業(yè)看到了昆侖萬(wàn)維“以AIGC為媒,構(gòu)建數(shù)字巴別塔”的潛力:
在西方傳說(shuō)中,人類(lèi)在洪水之后試圖建造一座“通天塔”,然而,由于語(yǔ)言多樣性帶來(lái)的隔閡,人類(lèi)由言語(yǔ)不通演變成相互起了沖突,最終“高聳入云的塔轟然倒塌”。
而如今,AI時(shí)代,新的“數(shù)字巴別塔”在人類(lèi)精神平原上重新矗立——前有DeepSeek以開(kāi)源促進(jìn)AI普惠浪潮涌動(dòng)、讓世界驚嘆“中國(guó)時(shí)刻”,后有昆侖萬(wàn)維以前沿技術(shù)為槳,以音樂(lè)等世界通用語(yǔ)言為帆,“浮舟滄海,立馬昆侖”,探索AIGC應(yīng)用邊界。一言以蔽之,頭部企業(yè)正立足中國(guó)、揚(yáng)帆世界,駛向人類(lèi)文明融合互鑒的新彼岸。
文中音頻試聽(tīng)及視頻鏈接:https://mp.weixin.qq.com/s/mr0SyBi4TLbKYAaN0D9-DA
熱門(mén)跟貼