
昆侖萬(wàn)維并不是一家容易讀懂的公司。成立17年,上市整10年,從瀏覽器、社交、搜索、游戲,到近兩年涉足AI音樂(lè)、AI短劇等,它從未遠(yuǎn)離過(guò)大廠云集的風(fēng)口。
但能在巨頭臥榻之側(cè)長(zhǎng)久生存,昆侖萬(wàn)維總結(jié)出了一套獨(dú)特而實(shí)用的“中廠”生存哲學(xué):找準(zhǔn)細(xì)分市場(chǎng),不進(jìn)紅海;做好付費(fèi)賽道,堅(jiān)持盈利。
更多時(shí)候,昆侖萬(wàn)維貼緊大廠的節(jié)奏,又將觸角伸向其射程外的市場(chǎng)。2023年,乘著AI的東風(fēng),昆侖萬(wàn)維股價(jià)在幾個(gè)月時(shí)間里飆升了5倍。其實(shí),昆侖萬(wàn)維的生意早已遍布五大洲70多個(gè)國(guó)家。
“寧為雞口,不為牛后。”已加入昆侖萬(wàn)維17年的董事長(zhǎng)兼CEO方漢言簡(jiǎn)意賅地對(duì)《財(cái)經(jīng)天下》說(shuō)。他總結(jié),中廠要懂得從終局思考,在當(dāng)下的大模型軍備競(jìng)賽中,中廠更需要在自己熟悉的賽道中做到“SOTA”(State-of-the-Art,當(dāng)前最佳技術(shù)或最前沿水平)。
去年4月,昆侖萬(wàn)維發(fā)布了第一代音樂(lè)生成模型Mureka V1(SkyMusic)。經(jīng)過(guò)一年的改進(jìn)調(diào)試,3月26日,昆侖萬(wàn)維上線了最新版音樂(lè)大模型Mureka O1與基座模型Mureka V6?!拔覀冏詈笥昧薕1的名字,因?yàn)樗钦嬲娉^(guò)Suno的音樂(lè)生成模型。”方漢說(shuō)。
除了新上線的音樂(lè)模型,方漢也與《財(cái)經(jīng)天下》分享了他對(duì)當(dāng)下火爆的AI Agent賽道的理解:“一流的企業(yè)做協(xié)議,二流的企業(yè)做產(chǎn)品,三流的企業(yè)做市場(chǎng)?,F(xiàn)在大家不會(huì)再讓一個(gè)公司去壟斷所有,這里面(屬于中廠和創(chuàng)業(yè)公司的)機(jī)會(huì)跟空間就非常多。”

▲昆侖萬(wàn)維董事長(zhǎng)兼CEO方漢。圖源/受訪者
01、追逐SOTA紅利,節(jié)省營(yíng)銷
昆侖萬(wàn)維之所以選擇在音樂(lè)模型上“單點(diǎn)突破”,有內(nèi)外因的考慮?!埃ㄒ魳?lè)大模型)是一個(gè)比較窄的賽道,不像文本大模型那么熱。算力成本低也是一個(gè)重要因素?!狈綕h說(shuō)。
而在必要的訓(xùn)練數(shù)據(jù)上,昆侖萬(wàn)維也有不為人知的積累。2017年,K歌軟件在國(guó)內(nèi)蔚然成風(fēng),昆侖萬(wàn)維創(chuàng)始人周亞輝如法炮制,在海外孵化了音樂(lè)平臺(tái)StarMaker。
他曾直言:最好的商業(yè)就是不競(jìng)爭(zhēng)之地。彼時(shí),昆侖萬(wàn)維便繞開了國(guó)內(nèi)市場(chǎng),將StarMaker的重心錨定在了中東、非洲、東南亞等地。
同時(shí),為了解決大量歌曲缺少人聲伴奏版本的問(wèn)題,昆侖萬(wàn)維專門組建了AI作曲實(shí)驗(yàn)室StarX MusicX Lab,研發(fā)將近三年,將AI人聲消除技術(shù)做到了世界頭部水準(zhǔn)。
這不僅為StarMaker帶來(lái)了用戶,也打下了日后研發(fā)音樂(lè)大模型的技術(shù)基礎(chǔ)。“人類到現(xiàn)在為止,總共只生產(chǎn)了4000萬(wàn)首音樂(lè)。在這個(gè)過(guò)程中,我們對(duì)大量音樂(lè)進(jìn)行了處理,也收集了全球各地的公開版權(quán)音樂(lè)?!?/p>
2022年底,StarMaker累計(jì)注冊(cè)用戶達(dá)3.1億?!叭绻f(shuō)誰(shuí)家手上的全量音樂(lè)數(shù)據(jù)是最多的?我們可以說(shuō)跟騰訊、字節(jié)一樣,都是頭部梯隊(duì)?!狈綕h說(shuō)。
2021年開始,昆侖萬(wàn)維便已立項(xiàng)了音樂(lè)生成模型。早期模型多采用符號(hào)生成技術(shù),2024年4月,昆侖萬(wàn)維發(fā)布了第一代采用擴(kuò)散生成技術(shù)的音樂(lè)模型Mureka V1(SkyMusic),獲得了外界的不少好評(píng)。
對(duì)于新版Mureka O1,方漢給團(tuán)隊(duì)的定位非常明確:要從產(chǎn)品角度、技術(shù)角度全面超越Suno,在該賽道上做到SOTA。

為何要執(zhí)著追求SOTA?源于方漢對(duì)昆侖萬(wàn)維“中廠”的定位。“有了SOTA,你可以不用做任何營(yíng)銷,產(chǎn)品紅利會(huì)迅速地爆?!?/p>
他以DeepSeek-R1為例,憑借“推理大模型”的細(xì)分賽道SOTA,迅速搶占了中國(guó)文本大模型客戶端第一的位置。在國(guó)外拉到了好多客戶,也幾乎沒(méi)有花過(guò)PR費(fèi)用。“我們很清楚,這一波大模型你沒(méi)有SOTA,就拿不到技術(shù)跟產(chǎn)品紅利?!?/p>
而在音樂(lè)大模型的評(píng)測(cè)中,Mureka O1在人聲、BGM(背景音樂(lè))、混音等方面已經(jīng)領(lǐng)先Suno V4。同時(shí),在海量曲庫(kù)下,Mureka O1可支持10種語(yǔ)言,幾乎覆蓋了世界上90%的人群。

▲Mureka O1的多語(yǔ)言選擇。來(lái)源/官網(wǎng)
Mureka O1在技術(shù)層是如何做到SOTA的?方漢表示:Mureka O1的最大突破便是首次將“思維鏈(Chain of Thought,簡(jiǎn)稱‘CoT’)”技術(shù)引入到了音樂(lè)模型中。這也是方漢在研讀了DeepSeek-R1的技術(shù)報(bào)告后,得到的啟發(fā)。
CoT顧名思義,是在推理過(guò)程中加入了思考與自我批判。而市場(chǎng)的上一代音樂(lè)模型多基于Diffusion in Transformer(擴(kuò)散模型與Transformer架構(gòu)相結(jié)合的技術(shù)),比較隨機(jī)、無(wú)目的。
方漢形容,這會(huì)讓生成音樂(lè)的過(guò)程像“一錘子買賣”,一口氣來(lái)十幾首曲子,交給用戶人工調(diào)整。
在CoT支持下,Mureka O1會(huì)更有目的,能在生成之前預(yù)測(cè)整個(gè)音樂(lè)結(jié)構(gòu),通過(guò)O1自有的評(píng)分模型,挑出最好的結(jié)果交給用戶,從而讓生成質(zhì)量、歌詞旋律契合度、發(fā)音唱對(duì)率、藝術(shù)表現(xiàn)力大幅提高。
“預(yù)測(cè)的過(guò)程,就是MusiCoT框架的核心?!狈綕h說(shuō)。而評(píng)分模型則是基于StarMaker的用戶積累,對(duì)Mureka V1生成結(jié)果的打分形成。
“這個(gè)數(shù)據(jù)只有在線上大量地跑,跑幾千萬(wàn)首歌才能跑出來(lái)。我們?cè)侔堰@幾千萬(wàn)的數(shù)據(jù)篩選、清洗、人工標(biāo)注,最后得到真正用來(lái)訓(xùn)練的數(shù)據(jù)量其實(shí)不大——但那是最核心的數(shù)據(jù)。”
02、AI音樂(lè)要向誰(shuí)收錢?
除了技術(shù)作為底座,Mureka O1也添加了多項(xiàng)功能創(chuàng)新。
此前在StarMaker上,昆侖萬(wàn)維觀察到K歌產(chǎn)品里最受歡迎的歌手,往往是其音色與某一歌星相近的。因此在Mureka O1里,模型也為用戶提供了“音色克隆”功能。
Mureka O1還新開放了“微調(diào)API”。例如冬不拉這種小眾樂(lè)器很少出現(xiàn)在生成器選項(xiàng)中,但在Mureka O1上,用戶可以通過(guò)上傳大量由冬不拉演奏的音樂(lè)來(lái)微調(diào)模型,Mureka O1就能據(jù)此來(lái)生成高質(zhì)量的冬不拉音樂(lè)。
那么,Mureka O1音樂(lè)大模型的用戶群體是誰(shuí),商業(yè)模式又如何?方漢表示,最龐大的用戶基礎(chǔ)是C端愛好者。過(guò)去,生產(chǎn)一首專業(yè)音樂(lè)的成本要在10萬(wàn)元左右,AI音樂(lè)的介入將直接為他們降低創(chuàng)作門檻。
而在付費(fèi)端,昆侖萬(wàn)維主要瞄準(zhǔn)的是影視、游戲、音頻等領(lǐng)域的從業(yè)者,付費(fèi)用戶可獲得更高速度、優(yōu)先的AI生成機(jī)會(huì)。
這有些不同于Suno的“走量模式”——目前Suno的免費(fèi)會(huì)員每天最多生成10首歌曲;愿意支付每月8美元、24美元的付費(fèi)會(huì)員,每月分別可生成500首和2000首歌曲。
而昆侖萬(wàn)維除了會(huì)員付費(fèi),更傾向于為B端客戶提供專業(yè)功能,通過(guò)SaaS或PasS服務(wù)收費(fèi)。2024年,昆侖萬(wàn)維的音樂(lè)大模型得到了如中國(guó)聯(lián)通、中國(guó)移動(dòng),以及一些造車企業(yè)的大客戶,和海外小B客戶的合作。
方漢坦言,在國(guó)內(nèi)靠用戶訂閱付費(fèi)的商業(yè)模式還很難成立,堅(jiān)持服務(wù)于有付費(fèi)習(xí)慣的B端和C端用戶,也是昆侖萬(wàn)維堅(jiān)持出海的原因之一?!白鳛橐粋€(gè)中廠,不賺錢就活不下去,這是很實(shí)際的問(wèn)題。”

從商業(yè)模式上,昆侖萬(wàn)維認(rèn)為Mureka O1更適合“平替”的是數(shù)字音樂(lè)工作站(Digital Music Workstation)。
這個(gè)市場(chǎng)原來(lái)更多服務(wù)于專業(yè)人士,“大概一年40億美元規(guī)模,已經(jīng)比較成熟了。而我們就好比為他們提供了一個(gè)平民化工具,類似給視頻平臺(tái)提供了‘剪映’?!?/p>
未來(lái)音樂(lè)大模型的發(fā)展方向會(huì)是怎樣?中廠又該如何選擇賽道?“這就要對(duì)終局反復(fù)思考”,方漢說(shuō)。
“AGI是夢(mèng)想,但AIGC更容易賺錢,AIGC皇冠上的明珠一定是視頻生成?!倍谝曨l生成中,還需要音樂(lè)、音效、音頻來(lái)配合。
在整個(gè)視頻生成生態(tài)中,昆侖萬(wàn)維又要如何卡位?“我們有音樂(lè)數(shù)據(jù),先卡音樂(lè)的位置。有短劇方面的經(jīng)驗(yàn)和渠道,再去卡短劇這個(gè)位置,不斷地縮小我們的卡位?!?/p>
2月18日,昆侖萬(wàn)維在Hugging Face上開源發(fā)布了視頻生成模型SkyReels-V1,兩個(gè)星期左右,下載量超過(guò)了10萬(wàn)。
作為中國(guó)首個(gè)面向AI短劇創(chuàng)作的視頻生成模型,SkyReels-V1不僅支持文生視頻(T2V)、還能支持圖生視頻(I2V),是開源視頻生成模型中參數(shù)最大的支持圖生視頻的模型,在同等分辨率下各項(xiàng)指標(biāo)同樣實(shí)現(xiàn)了開源SOTA。

方漢表示,SkyReels-V1定位是在短劇場(chǎng)景,而非一般視頻生成?!案鼫?zhǔn)確地說(shuō),這是一個(gè)表演大模型,專門為使用者和觀眾生產(chǎn)最高質(zhì)量的短劇以及影視劇?!?/p>
03、中廠的卡位之路
在方漢的判斷中,音樂(lè)和短劇市場(chǎng)的上限還極大。
例如,視頻生成后,沒(méi)有音樂(lè),用各種各樣的AI工具去匹配,讓人去卡時(shí)間軸,還要卡得很準(zhǔn),是很困難的。而借助于音樂(lè)大模型,可以一攬子將視頻、配音、配樂(lè)全部生成,“保證你的點(diǎn)是準(zhǔn)的,這對(duì)于影視制作是非常強(qiáng)的協(xié)同”。
雖然與渠道之間的商業(yè)生態(tài),仍會(huì)存在漫長(zhǎng)的磨合過(guò)程,但對(duì)于廣大MCN,尤其是短視頻作者來(lái)說(shuō),AI音樂(lè)會(huì)讓素人創(chuàng)作型歌手更容易冒出來(lái),是確鑿無(wú)疑的。
對(duì)于很多音樂(lè)創(chuàng)作者認(rèn)為“AI音樂(lè)沒(méi)有靈魂”的疑問(wèn),方漢認(rèn)為,偏見需要時(shí)間去消除?!皣?guó)內(nèi)已經(jīng)有頂尖創(chuàng)作者,比如郭帆導(dǎo)演與我們聯(lián)系。2024年的春晚,也已經(jīng)出現(xiàn)了AIGC的內(nèi)容。比如任素汐跳舞的背景就是由AI生成的?!?/p>
作為“中廠”要如何處理與巨頭的競(jìng)爭(zhēng)關(guān)系,昆侖萬(wàn)維已習(xí)慣淡然處之。
“在AIGC上,中廠還是大有可為的。大廠本質(zhì)上是to C基因,就像字節(jié)做剪映一樣,它終歸是為自己的平臺(tái)去服務(wù)。對(duì)于其他客戶的需求,響應(yīng)得不會(huì)有那么多?!倍鋈f(wàn)維正因?yàn)槭恰靶S”,從而更加開放,“什么樣的視頻生成模型我們都會(huì)去適配。”
特別是在DeepSeek引發(fā)了新一輪技術(shù)創(chuàng)新之后,AIGC技術(shù)將更多落實(shí)到產(chǎn)品上,也讓中小廠的機(jī)會(huì)更多閃現(xiàn)出來(lái)。
方漢分享了一個(gè)行業(yè)觀察:2023年創(chuàng)業(yè)的AI企業(yè)CEO幾乎全是算法工程師,2024年開始有一些CEO是產(chǎn)品出身。“2025年往后,我覺得會(huì)有更多產(chǎn)品出身的人會(huì)去做AI產(chǎn)品。”
他表示:互聯(lián)網(wǎng)行業(yè)人士常說(shuō),一流的企業(yè)做協(xié)議,二流的企業(yè)做產(chǎn)品,三流的企業(yè)做市場(chǎng),在大模型領(lǐng)域也是如此。
例如,Anthropic做的MCP協(xié)議(模型上下文協(xié)議)在Agent領(lǐng)域應(yīng)用非常廣?!盎贛CP協(xié)議開發(fā)的Agent,我們看到的已經(jīng)有上萬(wàn)個(gè)了?!苯眨琌penAI、谷歌、阿里也都紛紛仿效Anthropic,宣布擁抱MCP,上線了新的服務(wù)平臺(tái)。
“Agent最后會(huì)都捆在一個(gè)模型當(dāng)中嗎?不可能,一定是所有的模型都適配。而從協(xié)議到生態(tài),還有很長(zhǎng)的路要走?!?/p>
方漢透露,有中國(guó)公司正在嘗試做Agent的工作流生態(tài)。接下來(lái),Agent要適配所有模型,要用什么協(xié)議來(lái)適配?千奇百怪的長(zhǎng)尾需求誰(shuí)來(lái)響應(yīng)?要用什么樣的工具去完成Agent Marketplace(用于展示和銷售各種AI Agents)?在上層如何去管理Agent Marketplace?“這就涉及很多路徑,有開源路徑,有閉源路徑?!?/p>
而AI生態(tài)的發(fā)展路徑勢(shì)必不會(huì)重復(fù)移動(dòng)互聯(lián)網(wǎng)的老路?!跋癜沧炕蛘遡OS商店那樣,是所有人都不想看到的,因?yàn)榇蠹以谏厦娉缘目囝^已經(jīng)夠多了?!?/p>
如何用更開放的生態(tài)來(lái)做Agent Marketplace,又要如何找用戶去收費(fèi)?類似Manus這樣的Agent只是剛冒出來(lái)的事物,走到通用Agent市場(chǎng)將是漫長(zhǎng)的過(guò)程。“大家不會(huì)再讓一個(gè)公司去壟斷所有,這里面的機(jī)會(huì)跟空間就非常多?!?/p>
作者 |林小葵,編輯 |李不清,圖片來(lái)源 | 視覺中國(guó),本內(nèi)容來(lái)自財(cái)經(jīng)天下WEEKLY
熱門跟貼