

會思考的AI已經(jīng)席卷到了音樂領(lǐng)域,這一次,引領(lǐng)這場變革的,也是一家來自中國的公司——昆侖萬維。
作者|伍月??
編輯|栗子??
生成式AI的發(fā)展已進入關(guān)鍵的應(yīng)用落地階段,AI正在從快速生成轉(zhuǎn)向深度推理。更聰明的AI不僅會回答問題,還能在推理過程中深思熟慮地推理和解決問題。
2025年春節(jié),DeepSeek R1驚艷全球,其突破性地將諾貝爾經(jīng)濟學(xué)獎得主卡尼曼提出的“慢思考”(System 2)理論工程化,通過動態(tài)思維鏈技術(shù)重構(gòu)模型推理范式,不僅推動OpenAI被迫開放思維鏈功能,更標(biāo)志著AI從“刺激-反應(yīng)”的直覺型生成,正式進化為具備自主推理能力的認(rèn)知主體。
當(dāng)全球目光聚焦于文本領(lǐng)域的突破時,會思考的AI已經(jīng)席卷到了音樂領(lǐng)域。這一次,引領(lǐng)這場變革的,也是一家來自中國的公司——昆侖萬維。
3月26日,昆侖萬維正式發(fā)布Mureka O1模型與Mureka V6模型。其中,Mureka O1作為全球首款音樂推理大模型,性能超越Suno、模型登頂SOTA。中國科技創(chuàng)新再次在AI音樂領(lǐng)域領(lǐng)跑全球。
具體來說,Mureka是昆侖萬維在2024年發(fā)布的一款A(yù)I音樂產(chǎn)品。第一代音樂生成模型Mureka V1(SkyMusic)發(fā)布于2024年4月,目前基座模型已經(jīng)迭代到第六版,也就是Mureka V6。而Mureka O1模型是基于Mureka V6的推理優(yōu)化版本,也是全球范圍內(nèi)首個引入CoT的音樂模型。
經(jīng)過「甲子光年」實際體驗,具備推理能力的Mureka O1在實際效果上的確更加驚艷,也是此次Mureka模型更新的最大看點。
比如,輸入相同的prompt給到Mureka O1和Suno V4,對比之下,Mureka O1生成的音樂在歌手聲音質(zhì)感、節(jié)奏、旋律上都明顯更勝一籌。
在「甲子光年」看來,一場音樂創(chuàng)作革命正在發(fā)生:AI不只是輔助工具,而是能根據(jù)簡單指令即興寫詞,還能理解布魯斯的憂郁藍調(diào)曲風(fēng)的智能創(chuàng)作伙伴。
如同DeepSeek在上線推理模型R1之后的爆火一樣,今天Mureka O1的問世讓我們感覺,AI音樂的“GPT時刻”正在到來。
1.Mureka O1 & Mureka V6一手實測:人人都能成為音樂創(chuàng)作者
前面提到,最新發(fā)布的Mureka O1模型是基于Mureka V6思維鏈的推理優(yōu)化版本,而Mureka V6是當(dāng)前Mureka的基座模型,支持純音樂生成,還支持10種語言的AI音樂創(chuàng)作,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、意大利語和俄語。

Mureka支持10種語言作曲,來源:Mureka官網(wǎng)
我們先來感受一下Mureka官方創(chuàng)作的作品demo。
Mureka O1和Mureka V6發(fā)布后的第一時間,「甲子光年」就進行了一手實測。
在對話框中輸入“小巷人家”這四個字后,Mureka便自動生成了一段生動的文字,詞句間洋溢著濃濃的煙火氣息:“雞鳴犬吠迎晨曦,日子悠然緩行,青石板路上苔痕碧綠,老樹垂下斑駁樹影?!?/p>
點擊創(chuàng)作鍵,不出一會兒,一段兩分半鐘的音樂便緩緩流淌而出。
由Mureka生成的《大街小巷》音樂
目前,可以直接通過Mureka的網(wǎng)頁端(官網(wǎng)界面:www.mureka.AI)體驗Mureka O1和Mureka V6。
打開Mureka官網(wǎng),可以直接到達創(chuàng)作頁面。歌曲創(chuàng)作有簡單模式和高級模式。高級模式下,輸入你想創(chuàng)作的歌曲名稱,可以直接讓AI生成相應(yīng)的歌詞。
在模型界面,用戶可以選擇Mureka O1、Mureka V6和Mureka V5.5多個模型進行創(chuàng)作。

Mureka支持模型切換,來源:Mureka官網(wǎng)
曲風(fēng)上,Mureka不僅可以支持“爵士(Jazz)、電子(Electronic)、流行(Pop)、鄉(xiāng)村(Country)、節(jié)奏布魯斯(R&B)、靈魂樂(Soul)、藍調(diào)(Blues)、搖滾(Rock)、舞曲(Dance)”等,還能直接讓用戶上傳參考歌曲,或者粘貼YouTube鏈接,讓AI根據(jù)用戶選擇定向生成不同的曲風(fēng)。在列表中可以看到,很多用戶上傳的歌曲列表。

用戶上傳參考歌曲,讓Mureka生成相似曲風(fēng)的音樂,來源:Mureka官網(wǎng)
詞曲都設(shè)置完成后,就可以點擊創(chuàng)作生成不同歌曲,每次Mureka都會生成兩首不同的歌供選擇。歌曲生成后,可以直接點擊發(fā)布分享歌曲鏈接,還可以根據(jù)歌詞讓AI生成對應(yīng)的視頻。

音樂生成后支持下載、視頻生成和發(fā)布,來源:Mureka官網(wǎng)
Mureka還推出了很多對于音樂工作創(chuàng)作者非常友好的功能。比如,Mureka不僅提供豐富的官方歌手音色選擇,還允許用戶上傳自己的聲音,通過AI學(xué)習(xí)和復(fù)刻,實現(xiàn)個性化音色定制。人人都能成為AI歌手的時代來臨,每個人都能輕松創(chuàng)作出具有個人特色的音樂作品。

上傳自己的聲音,定制自己的專屬音樂,來源:Mureka官網(wǎng)
歌曲生成后,用戶也可以下載分軌音頻和伴奏等,且能對音樂進行局部編輯,自定義自己想做的作品。

支持對歌曲的二次編輯,來源:Mureka官網(wǎng)
各種順滑的體驗之外,Mureka還搞了個大動作:開放API服務(wù)和模型微調(diào)功能。
Mureka是全球首批開放API服務(wù)的高質(zhì)量AI音樂生成平臺。更重要的是,不僅在全球范圍內(nèi)首次開放API服務(wù),Mureka還同步開放基于Mureka V6的模型微調(diào)服務(wù),成為全球首個開放模型微調(diào)功能的AI音樂生成平臺。

來源:Mureka官網(wǎng)
面向企業(yè)和開發(fā)者,Mureka開放了兩大類靈活的API服務(wù),具體包括音樂音頻生成API,還有語音合成API。
使用Mureka,音樂工作室就可以上傳版權(quán)作品,訓(xùn)練專屬廠牌風(fēng)格模型。這意味著,音樂工作室和眾多創(chuàng)業(yè)者可以直接通過Mureka API實現(xiàn)創(chuàng)作的工業(yè)化。
當(dāng)游戲公司利用該API批量生成1000個NPC(非玩家角色)的專屬背景音樂(BGM)時,音樂生產(chǎn)便真正融入了智能化的工作流之中。
之前,網(wǎng)友們調(diào)侃李榮浩詞曲創(chuàng)作一手包辦,一個人就是一支隊伍。而現(xiàn)在,AI技術(shù)的發(fā)展正使得這樣的個人全能現(xiàn)象變得更加普遍和可行。
音樂史上個人全能創(chuàng)作的時代正在逐步到來——零基礎(chǔ)用戶同樣能夠創(chuàng)作出熱門單曲,獨立音樂人正迎來黃金時代。
2.Mureka O1如何定義“音樂推理”?
DeepSeek R1的深度思考功能讓很多人都感受到了思維鏈的魅力。如今,包括OpenAI的O1在內(nèi)的很多語言模型都已經(jīng)上線深度思考功能,讓用戶通過思維鏈(簡稱CoT)直觀的看到大模型的動態(tài)思考推理過程。
實踐證明,CoT能顯著提升模型的推理能力,并促進模型的研究和迭代。
昆侖萬維的Mureka團隊開創(chuàng)性的把這種深度思考的“思維鏈(CoT)”能力引入了音樂生成模型上。在GitHub項目主頁:MusiCoT.github.io,可以看到論文和項目介紹。

https://arxiv.org/abs/2503.19611
MusiCoT利用了思維鏈Chain-of-Thought (CoT)方法,不同于傳統(tǒng)自回歸模型逐步生成音頻,MusiCoT首次在細(xì)粒度音頻token預(yù)測前預(yù)生成整體音樂結(jié)構(gòu),大幅提升生成音樂的結(jié)構(gòu)連貫性與樂器編排精準(zhǔn)度。
語言模型的CoT實踐在跨領(lǐng)域方面并不是一項可以拿來即用的技術(shù)。因為傳統(tǒng)的CoT方法通常是通過自然語言展示中間推理步驟,讓AI像人一樣,一步一步地解釋它是怎么想的,然后得出結(jié)論。
但在音樂領(lǐng)域,音樂的情緒、節(jié)奏、旋律比較復(fù)雜,沒辦法像分析文字那樣,一步步“思考”音樂。
Mureka團隊的工程師們想出了個聰明的辦法,為AI理解和生成音樂提供了一種新的“思考”方式。
傳統(tǒng)的AI作曲方式,就像寫日記一樣,一個音符接一個音符地寫,想到哪寫到哪,沒有整體規(guī)劃。
Mureka團隊引入了一種能"聽懂"音樂的AI翻譯器 CLAP模型,把一段旋律或節(jié)奏轉(zhuǎn)化一串“數(shù)字指紋”,同時還使用了RVQ技術(shù),像是一個“翻譯官”,把復(fù)雜的“數(shù)字指紋”翻譯成 AI 能夠理解的“標(biāo)簽”。
RVQ的粗到細(xì)粒度標(biāo)記化方法,就像是一個“分層翻譯”的過程:先翻譯出音樂的整體框架,比如歌曲的結(jié)構(gòu)、主要旋律等,就像是畫一個草圖; 然后再逐步翻譯出音樂的細(xì)節(jié),比如具體的音符、節(jié)奏變化等,就像是在草圖上添加細(xì)節(jié)。

Mureka自研基于MusiCoT的自回歸模型音樂生成技術(shù),來源:MusiCoT.github.io
如此,AI創(chuàng)作時,不再是生硬地拼湊音符,而是像音樂家那樣,先開始“畫藍圖”,想出一個大概的音樂結(jié)構(gòu),然后再慢慢細(xì)化,生成具體的音樂。
這是一種創(chuàng)新性的嘗試,且這種方式方式更貼近人類的創(chuàng)作流程,有助于產(chǎn)生更具整體性和連貫性的音樂作品。
這樣,Mureka O1就像一位不斷打磨作品的作曲家,能夠持續(xù)學(xué)習(xí),不斷推理,優(yōu)化自己的創(chuàng)作能力。
在最新的音樂評測中,Mureka O1在最終的整體聽感評測中已經(jīng)超過了Suno V4,在總分為10分評測中,拿到了6.93分,且在聲音質(zhì)感和背景音樂質(zhì)感上也超過了Suno V4。

Mureka O1在主觀測評中整體聽感超越Suno V4
此外,在客觀評測中,在音樂連貫性、歌詞發(fā)音準(zhǔn)確度、文本相關(guān)性、作品復(fù)雜度和質(zhì)量等維度上,Mureka O1表現(xiàn)明顯超越Suno V4。


相同prompt下生成歌曲的橫向?qū)Ρ?/p>
技術(shù)報告也顯示,同一段prompt輸入后,Mureka O1實現(xiàn)了行業(yè)領(lǐng)先的低延遲音樂生成。

Mureka O1實現(xiàn)了行業(yè)領(lǐng)先的低延時音樂生成
MusiCoT的創(chuàng)新技術(shù)實踐,不僅在技術(shù)層面實現(xiàn)了突破,更加提升了音樂生成的質(zhì)量和效率,讓音樂成為成為更加普及、更加多元、更加個性化的表達方式。
通過引入AI的深度思考能力,很多人也能夠生成超越人類固有思維模式的音樂作品,從而拓展音樂創(chuàng)作的邊界,探索全新的音樂風(fēng)格和表達方式。
3.AI音樂創(chuàng)作作曲革命:“智能創(chuàng)作大腦”重新定義音樂生產(chǎn)力
“Mureka”不僅僅是一個產(chǎn)品名,它也代表著在音樂的世界里,靈感抵達之際,創(chuàng)意的噴薄而出。它象征著一種頓悟,一種靈感迸發(fā)的瞬間,如同阿基米德在浴缸中發(fā)現(xiàn)浮力定律時喊出的“Eureka!”一樣,充滿了驚喜和激動。
這種靈感時刻,也恰如其分的隱含了MusiCoT的出現(xiàn),讓AI音樂呈現(xiàn)出了靈感與算法的共鳴。AI能夠像人類一樣,在音樂中表達情感和創(chuàng)意。
毋庸置疑,音樂創(chuàng)作將迎來巨變。
由于Mureka開放 API 服務(wù)和模型微調(diào)功能。開發(fā)者不僅可以將Mureka強大的AI音樂生成能力集成到各種應(yīng)用程序和平臺中;還可以據(jù)特定需求,對Mureka的AI模型進行個性化訓(xùn)練。任何音樂人都可以以極低的成本,用自己創(chuàng)作的版權(quán)音樂,訓(xùn)練屬于自己的音樂模型。已經(jīng)有游戲開發(fā)者在嘗試,通過微調(diào)模型,使其生成特定游戲風(fēng)格的背景音樂。即使沒有專業(yè)的音樂知識和技能,用戶也可以通過Mureka生成高質(zhì)量的音樂作品。
對于個人創(chuàng)作者而言,Mureka降低了專業(yè)音樂制作門檻,讓腦海中的“靈光一現(xiàn)”能夠快速轉(zhuǎn)化為作品,被更多人看見。更多人能夠參與到音樂創(chuàng)作中來,用音樂表達自己的情感和想法。對于專業(yè)的音樂制作人而言,Mureka更是一個激發(fā)創(chuàng)意的平臺,它能夠為音樂人提供豐富的靈感和創(chuàng)意,幫助他們突破創(chuàng)作瓶頸。
比如輸入prompt:love song,Mureka可以自動生成歌詞,點擊創(chuàng)作就生成了下面這首歌。
在更廣闊的文娛和內(nèi)容產(chǎn)業(yè),AI音樂將會被廣泛應(yīng)用,對于游戲、影視、廣告等領(lǐng)域而言,Mureka能夠提供高效、高質(zhì)量的配樂解決方案,縮短制作周期,降低制作成本,讓創(chuàng)作者能夠更專注于內(nèi)容創(chuàng)作本身。更多嶄新的音樂教育、音樂治療、音樂娛樂等業(yè)態(tài)會誕生,為人們帶來更加美好的音樂體驗。
昆侖萬維最新還發(fā)了一支《Mureka》的同名MV,歌曲由AI音樂人Mureka演唱,動畫部分則由AI視頻生成平臺SkyReels制作,進一步展示了AI音樂與AI視頻的融合潛力。
目前,Mureka產(chǎn)品已經(jīng)在全球化100多個國家被使用。Mureka向「甲子光年」談到他們的愿景:“音樂是情感表達最重要的手段之一,過去因為學(xué)習(xí)門檻過高,學(xué)習(xí)曲線過于陡峭,影響了人們使用音樂這一載體表達情感。AI 技術(shù)可以讓人們更好的使用音樂這一手段表達自己的情感?!?/p>
Mureka在音樂生成領(lǐng)域的驚艷背后,依托的也是在大模型全產(chǎn)業(yè)鏈進行布局的昆侖萬維。
昆侖萬維是國內(nèi)少數(shù)在AI領(lǐng)域全產(chǎn)業(yè)鏈布局的互聯(lián)網(wǎng)大廠。
昆侖萬維創(chuàng)始人周亞輝曾在朋友圈表示,昆侖萬維的AI戰(zhàn)略優(yōu)勢在于差異化,并強調(diào)公司找到了“小而大美的空間”。
此次,Mureka O1 & V6兩個模型的上線,不僅向外界展示了昆侖萬維在 AI 技術(shù)上卓越的創(chuàng)新能力,更印證了其“小而大美”戰(zhàn)略的成功實踐。
通過聚焦 AI 音樂生成這一細(xì)分領(lǐng)域,Mureka團隊創(chuàng)新性地引入“思維鏈(CoT)”等技術(shù),賦予 AI 更強的理解和創(chuàng)造力,實現(xiàn)了技術(shù)和應(yīng)用的突破。
據(jù)團隊透露,接下來,Mureka還將開發(fā)更多創(chuàng)新性的音樂創(chuàng)作功能,例如音樂生成的二次編輯、歌曲的創(chuàng)意再造等;同時也會積極拓展開發(fā)者生態(tài)和合作伙伴關(guān)系,通過開放平臺和合作,構(gòu)建一個充滿活力和創(chuàng)新力的音樂創(chuàng)作社區(qū)。
從DeepSeek到Mureka,中國AI在認(rèn)知架構(gòu)上的突破并非孤立存在,而是密不可分的。DeepSeek在通用AI領(lǐng)域的突破,為Mureka在音樂領(lǐng)域的創(chuàng)新,提供了頗具借鑒意義的方向。Mureka的創(chuàng)新實踐,是中國AI在認(rèn)知架構(gòu)突破的基礎(chǔ)上,針對音樂領(lǐng)域進行深度探索和創(chuàng)新的成果。不僅展示了中國 AI 在垂直領(lǐng)域的技術(shù)實力,也為 AI 音樂的未來發(fā)展,開辟了新的道路。
Mureka讓AI成為靈感之源,將音樂靈感的門扉向大眾敞開,未來,隨著AI技術(shù)的不斷進步,音符在科技與藝術(shù)的交融中,將會綻放更加耀眼的光芒。
(封面圖來源:昆侖萬維)
熱門跟貼