打開網(wǎng)易新聞 查看精彩圖片

經(jīng)濟觀察報 作者 周悅

1995年,方漢畢業(yè),進入中國高能物理研究所工作。中國第一條互聯(lián)網(wǎng)專線建成,正是從這里通向世界。他第一次握緊鼠標(biāo)上網(wǎng)時,像被電流擊中。

此后幾十年里,方漢一路做到昆侖萬維(300418.SZ)的董事長兼CEO,公司年營收超過50億元,但他很少再有那種感覺。

直到GPT-3生成的文字跳出屏幕時,他再次“過電”。在他50歲的時候,眼中出現(xiàn)了最大的機會——AI必將洗牌內(nèi)容行業(yè)。

或許真的體會到了“天命”,方漢“燃”起來了,每天少睡1—2小時,一年下來讀超過200篇論文,在一線敲代碼、搭團隊,面試算法博士。

為了追趕AI,昆侖萬維投入巨大——8億元砸向算力芯片,成為算力最充足的AI企業(yè)之一;2024年研發(fā)費用增至15.4億元,同比增長近6成。前者買燃料,后者煉大腦。

這樣的投入力度在業(yè)內(nèi)頗為罕見。年報顯示,2024年,昆侖萬維歸屬于上市公司股東出現(xiàn)虧損,這是昆侖萬維上市十年來的首次年度虧損。

在方漢看來,這更像是一種交換,換卡、換時間、換人才。

“這種交換有代價的,猶豫的成本更高?!狈綕h對經(jīng)濟觀察報說。

提前布局,使昆侖萬維成為最早發(fā)布自研模型的企業(yè)之一,奪得多個垂類領(lǐng)域首發(fā),為它帶來了增長。

2024年,昆侖萬維營收為56.6億元,同比增長15.2%;整體毛利率為73.6%,在互聯(lián)網(wǎng)行業(yè)中處于較高水平。

昆侖萬維可以燒錢,但不能亂燒,技術(shù)團隊最常受到方漢的靈魂拷問:“這個模型能排到全球前三嗎?”

全球前三,在這家企業(yè)里有著明確的定量指標(biāo),即權(quán)威技術(shù)測試指標(biāo)達到SOTA(最先進的模型)。

為了達成這個目標(biāo),昆侖萬維內(nèi)生Fast Fail(快速試錯)機制:所有項目必須在短時間內(nèi)驗證可行性,技術(shù)進不了前列,要迅速調(diào)整甚至叫停。

比如,去年方漢叫停了AI漫畫項目,盡管他們曾投入數(shù)百張算力卡,但模型能力始終達不到預(yù)期。資源被進一步集中到更具突破潛力的AI音樂、AI短劇、AI社交等領(lǐng)域。

這一策略使得昆侖萬維的AGI與AIGC業(yè)務(wù)也進入快速商業(yè)化通道:2024年,昆侖萬維的AI業(yè)務(wù)年化收入達到1.4億美元,成為海外收入增速最快的中國AI企業(yè)。

其中,AI社交在報告期內(nèi)單月最高收入突破100萬美元,成為海外收入增長速度最快的中國AI應(yīng)用之一;截至2025年3月底,昆侖萬維的AI音樂年化流水收入達到約1200萬美元。短劇平臺Dramawave年化流水收入達到約1.2億美元。

方漢說:“技術(shù)水平達不到前三,根本沒有參賽資格,砸再多錢營銷也守不住用戶。百團大戰(zhàn)、打車大戰(zhàn),太多企業(yè)都是這么死掉,昆侖萬維17年來看得太多。”

把擅長的事做到全球第一

2024年初,昆侖萬維投入數(shù)百張GPU訓(xùn)練AI漫畫生成模型,起初團隊非常興奮,準(zhǔn)備大干一場。

很快,他們意識到,AI漫畫所需的細分技術(shù),如漫畫風(fēng)格遷移、分格生成、劇情管理等并非主流。投入重金后,昆侖萬維的模型能力也無法從數(shù)千家文生圖企業(yè)中突圍。

更致命的是,漫畫的市場規(guī)模和用戶付費意愿有限,短期內(nèi)難以取得足夠回報。這個曾被寄予厚望的項目僅存活了3個月。

自去年以來,AI行業(yè)開啟淘汰賽。業(yè)界普遍認為推動大模型發(fā)展的第一定律放緩。這意味著投入與回報不再是一分耕耘,一分收獲,而是千分、萬分投入,回報可能不到一分。

選擇或比努力更重要。昆侖萬維放棄了AI漫畫,轉(zhuǎn)向音樂等賽道,首先聚焦在旗下坐擁3.1億注冊用戶的音樂平臺Starmaker身上。

早在2021年,Starmaker平臺日均上傳作品達200萬,為昆侖萬維帶來了廣告收入。這里有一個過去被忽視的需求:喜歡唱歌的人也想創(chuàng)作歌曲,但人們對成本這一“攔路虎”發(fā)怵。過去,做一首歌曲的成本達數(shù)萬元,請樂隊、租錄音棚、制作伴奏都需要錢。

團隊想到“用AI把創(chuàng)作成本打下去,下一個巨星為什么不能誕生在這里呢?”

正如賈斯丁·比伯在YouTube上翻唱歌曲的影片被星探發(fā)掘,這帶火了平臺也成就了巨星。

2024年4月,Mureka V1(SkyMusic)上線,這是全球最早上線的音樂生成工具之一。

一位中國用戶使用Mureka創(chuàng)作的38秒爆款歌曲《還我媽生鼻》一戰(zhàn)成名,5天播放量破百萬,沖上抖音娛樂榜及微博熱搜第一。

2025年3月26日,昆侖萬維正式發(fā)布Mureka O1模型與Mureka V6模型,支持西班牙語、日語、英語等10個語種歌曲生成。訪問用戶遍布超100個國家和地區(qū)。在第三方評測中,Mureka O1,擊敗美國音樂大模型Suno,登頂全球第一。

在Mureka上,一首4分鐘歌曲從生成到發(fā)布不到1分鐘,用戶側(cè)成本僅需1—7毛錢,企業(yè)側(cè)成本不到5分錢,這一價格低于同類應(yīng)用——用戶能省錢、昆侖萬維能賺錢。

發(fā)布當(dāng)周,Mureka官網(wǎng)十分火爆,用戶經(jīng)常會看到有幾十位創(chuàng)作者在等待生成歌曲,其中不乏許多海外用戶。

國際作者和作曲者協(xié)會聯(lián)合會預(yù)計,未來五年,人工智能生成的音樂和視聽內(nèi)容全球市場將增長20倍,收入規(guī)模從目前約30億歐元增至2028年的640億歐元。

此外,AI短劇方面,昆侖萬維在2024年8月,推出全球首個集成視頻大模型與3D大模型的AI短劇創(chuàng)作平臺SkyReels;在2024年下半年,發(fā)布DramaWave短劇內(nèi)容平臺,覆蓋不同消費層級的全球用戶群體。目前,昆侖萬維的業(yè)務(wù)覆蓋全球100多個國家和地區(qū),全球月活躍用戶接近4億。

方漢認為,AI音樂、AI短劇只是一塊拼圖。昆侖萬維還在持續(xù)投入AI社交、AI游戲等領(lǐng)域,最終都指向娛樂賽道。這些領(lǐng)域的共同特點是:用戶容錯度高、付費意愿強。而全球80億人口中只要有1%成為付費用戶,就將催生千億級市場。

在大廠抵達前把握窗口

一旦巨頭切入自己的細分市場怎么辦?這是每家AI公司的必答題。

作為一家中廠,方漢選擇用“苦功夫”和“靈活性”來迎戰(zhàn)大廠。

首先,他選定了相對冷門的AI音樂、AI短劇等娛樂賽道。相比對算力、數(shù)據(jù)需求高得驚人的文本大模型,這類模型的競爭尚未“卷”到極致,也沒有巨頭出現(xiàn)。

二是下苦功夫,建立護城河。

此前昆侖萬維曾購買了200萬首正版歌曲授權(quán),但音樂公司不提供母帶,團隊只能用算法一首首剝離人聲、重建伴奏,積累了海量數(shù)據(jù),其擁有的音樂語料僅次于騰訊、字節(jié)和網(wǎng)易。

大廠即便立刻進軍AI音樂,用人海戰(zhàn)術(shù)或者“鈔能力”,也同樣需要一首首積累數(shù)據(jù)。這意味著昆侖萬維還能吃到一段時間的紅利。

自10年前該公司就在非洲等海外市場投入大量精力,派工程師到蚊蟲肆虐、瘧疾頻發(fā)的當(dāng)?shù)孛迨謾C硬件環(huán)境。

他們發(fā)現(xiàn)許多手機在千元以下,必須優(yōu)化到音頻芯片層面,才能顯著提升音質(zhì)?!按髲S覺得太苦、太難,對難掙的錢興趣不大?!狈綕h說。

靈活性也是昆侖萬維的優(yōu)勢:從決策到拍板“All in AGI和AIGC”,他們只花了7天,隨后立刻買卡、加大研發(fā)開支。

2022年底,ChatGPT橫空出世時,別的公司還在觀望,他們用一個春節(jié)假期就明確了這件事。

在接下來三年中,他們內(nèi)部調(diào)配AI相關(guān)的資源也延續(xù)這種靈活,只需要碰頭開會,對齊、推演、復(fù)盤當(dāng)前的需求,隨后資源就會到位。

在內(nèi)部驗證效果好的AI算法或產(chǎn)品,即可獲得核心研發(fā)力量的增援;在市場上獲得用戶增長、訂閱增長等反饋后,即能拿到更多算力、人力資源。

相比之下,大廠往往得先兼顧國內(nèi)成熟業(yè)務(wù),流程復(fù)雜,審批周期冗長,出?;蚨唐陔y以盈利的項目更邊緣,可能數(shù)月甚至半年才能排到資源,容易錯過窗口期。

馬車夫追上汽車時代

方漢是中國第一批接觸互聯(lián)網(wǎng)的人,也是開源操作系統(tǒng)Linux的第一代中文核心作者之一,和他們那批人中的多數(shù)一樣,信奉開放、自由、去中心化。

面對AI沖擊,年過半百的方漢過去幾年一直在做兩件事:讀技術(shù)論文和招年輕博士。

他一年讀了超過200篇前沿論文,每周花大量的時間在看論文、研究技術(shù),壓縮休息時間,為此每天犧牲了一兩個小時睡眠時間。

方漢說:“我們都是舊時代的馬車夫,在汽車出現(xiàn)后,一定要努力地學(xué)開車,而不是去砸人家車?!?/p>

除此之外,他常常擠出午飯的時間,面試有潛力的博士,再小的項目都會問上至少1小時,從基礎(chǔ)公式推導(dǎo)到工程細節(jié)把控,篩出真正的創(chuàng)新者。

有意思的是,比起有大廠經(jīng)驗的老將,剛走出校園的博士更受青睞——方漢認為,他們未被行業(yè)慣性束縛,常帶來意想不到的突破。

一次內(nèi)部技術(shù)討論會上,一位新人博士提出了個大膽的想法:把文本模型的注意力機制“移植”到音樂生成上。這番設(shè)想起初聽來有些異想天開,但經(jīng)過交叉質(zhì)詢和推演后,反而衍生出一條全新的算法思路。如今該算法已成為Mureka模型的一個核心創(chuàng)新。

方漢認為,從技術(shù)背景來看,所有人都是在2023年才開始轉(zhuǎn)向GPT相關(guān)的架構(gòu)研究,相當(dāng)于站在同一個起跑線上。這一時間點后畢業(yè)的博士,更深耕、也更有價值。

昆侖萬維設(shè)立2050研究院,這里聚集了一批深諳神經(jīng)網(wǎng)絡(luò)和算法架構(gòu)的年輕研究員,目標(biāo)直指AGI(通用人工智能)。

如果說快速試錯體現(xiàn)了昆侖萬維的效率,那么設(shè)立2050研究院和堅持開源則保留了一抹理想主義色彩。

這里沒有短期的盈利考核焦慮,也無需層層審批的繁瑣流程——當(dāng)團隊在會議室里碰撞出可行的創(chuàng)意,算力資源和人力支持就能即刻就位。

極客式管理模式,讓需要長期培育的種子項目有了一定空間。從語言大模型到視頻生成算法,昆侖萬維近兩年已開放超過20個大模型以及高質(zhì)量的中文訓(xùn)練數(shù)據(jù)集,在開源社區(qū)累計下載量超過6萬。

其中,昆侖萬維開源的Skywork R1V多模態(tài)思維鏈推理模型達到開源SOTA,位列同類型開源模型全球第一。此外,大模型學(xué)習(xí)強化Skywork-Reward獎勵模型亦達到全球第一,成為數(shù)據(jù)科學(xué)競賽平臺Kaggle官方推薦的數(shù)學(xué)獎勵模型。

與很多同行不同,方漢認為,只有讓更多人參與,才能持續(xù)迭代增強模型,進一步沉淀用戶與影響力。通俗來講,做AI產(chǎn)品就像賣包子,只有開源基礎(chǔ)配方,才能催生千變?nèi)f化的創(chuàng)新。

這套被方漢稱為“包子鋪哲學(xué)”的開源戰(zhàn)略,正在創(chuàng)造生態(tài)。

以其2月18日開源的SkyReels V1視頻模型為例,自上線以來,已被下載3萬余次,在Github亦收獲逾千星的點贊,開發(fā)者們基于基礎(chǔ)模型開發(fā),滿足一些意想不到的長尾需求,反而幫昆侖萬維拓寬了商業(yè)場景,帶動AI短劇的訂閱用戶暴漲十幾倍。

“作為一家中型互聯(lián)網(wǎng)公司,昆侖萬維唯一的夢想是成為巨頭。”方漢對AI未來的判斷是,3—5年內(nèi),線下勞動力無法被完全替代;長遠來看,20年內(nèi)AGI的變革力會滲透至每一個行業(yè)。

“他們高估了短期,低估長期帶來的變革”。

打開網(wǎng)易新聞 查看精彩圖片

周悅

TMT編輯,關(guān)注科技、大健康交叉領(lǐng)域,擅長行業(yè)研究,深度報道。“新聞是歷史的初稿”。
歡迎聯(lián)系:zhouyue@eeo.com.cn。