編輯部 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
消費(fèi)者和創(chuàng)作者中間有巨大的gap,AI來(lái)了以后這個(gè)gap有可能被合到一起。
在今年的中國(guó)AIGC產(chǎn)業(yè)峰會(huì)上,貍譜App負(fù)責(zé)人一休以創(chuàng)業(yè)公司的視角,同與會(huì)嘉賓和在線觀眾一起分享了浸入AI產(chǎn)品創(chuàng)業(yè)的所思所感。
貍譜App是一個(gè)集同人創(chuàng)作、虛擬互動(dòng)和社區(qū)交流于一體的AIGC二次元社區(qū)產(chǎn)品,用戶群體主要是05后年輕人。產(chǎn)品上線后,僅4個(gè)月即達(dá)到百萬(wàn)月活。
一休表示,這個(gè)產(chǎn)品一開(kāi)始就不是想用AI做一個(gè)提升效率的工具,而是為更廣大的目標(biāo)人群提供通過(guò)AI從消費(fèi)者變成創(chuàng)作者的可能性。

為了完整體現(xiàn)一休的思考,在不改變?cè)獾幕A(chǔ)上,量子位對(duì)演講內(nèi)容進(jìn)行了編輯整理,希望能給你帶來(lái)更多啟發(fā)。
中國(guó)AIGC產(chǎn)業(yè)峰會(huì)是由量子位主辦的AI領(lǐng)域前沿峰會(huì),20余位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾超千人,線上直播觀眾320萬(wàn)+,累計(jì)曝光2000萬(wàn)+。
話題要點(diǎn)
- 虛擬類內(nèi)容在生成式AI賽道還沒(méi)有完全爆發(fā)。
- 切中「有創(chuàng)作欲且沒(méi)有很好的創(chuàng)作工具」這一消費(fèi)人群。
- 雖然技術(shù)在進(jìn)步,但還達(dá)不到一定的水平,需要在產(chǎn)品里做割舍。
- 打造爆款,首先要了解產(chǎn)品和平臺(tái)特性。
- 關(guān)注多模態(tài)生成的實(shí)時(shí)生成和精準(zhǔn)可控。
以下為一休演講全文:
提供通過(guò)AI從消費(fèi)者變成創(chuàng)作者的可能性
我簡(jiǎn)單介紹一下貍譜APP做什么的,用AI生成ACG內(nèi)容,二次元內(nèi)容的內(nèi)容社區(qū),功能主要有兩點(diǎn):
第一,生成動(dòng)漫圖片;第二,生成動(dòng)漫圖片后把圖變成視頻。中間還有很多圖和視頻的衍生玩法。簡(jiǎn)單來(lái)說(shuō)是這樣。
2022年,AI生圖能力出來(lái)以后,我第一時(shí)間就想到繪畫這件事情已經(jīng)被AI代替了。
我們反觀內(nèi)容或者信息量這個(gè)事情的歷史,手機(jī)攝像頭把真實(shí)世界創(chuàng)作門檻降到很低,包括剪輯的工具把現(xiàn)在所有UGC內(nèi)容信息量爆發(fā)出來(lái)了。
但這里面其實(shí)有一個(gè)信息量沒(méi)爆發(fā)出來(lái)——虛擬類的內(nèi)容。我們從中選擇了動(dòng)漫這個(gè)賽道,這個(gè)賽道有很高的制作門檻。
如果看整個(gè)動(dòng)畫行業(yè),產(chǎn)能非常有限、制作門檻非常高。即便畫畫這個(gè)東西就已經(jīng)把絕大部分的人砍掉了,動(dòng)畫制作里面也還有很多細(xì)分的分工,導(dǎo)致動(dòng)畫媒介越來(lái)越專業(yè)。
消費(fèi)者(即看動(dòng)畫的人)有很強(qiáng)的創(chuàng)作欲,但沒(méi)有很好的工具,也就是說(shuō)消費(fèi)者和創(chuàng)作者中間有巨大的gap。AI來(lái)了以后,這個(gè)巨大的gap有可能被合到一起的,就好像影視從業(yè)者和UGC人群之間的gap被手機(jī)攝像頭和剪輯工具彌合了。
所以我們切的是「有創(chuàng)作欲且沒(méi)有很好的創(chuàng)作工具」這個(gè)消費(fèi)人群。
市面上有很多AI創(chuàng)作工具給現(xiàn)有的創(chuàng)作者用的,比如一些設(shè)計(jì)師、剪輯師,用AI工具做效率提升。我想說(shuō)我們對(duì)標(biāo)的這一批消費(fèi)者不是原來(lái)的創(chuàng)作者,而是給大家提供通過(guò)AI從消費(fèi)者變成創(chuàng)作者的可能性。
需要在產(chǎn)品里做割舍
現(xiàn)在大環(huán)境的變化可能有兩個(gè):
一個(gè)是視頻模型的發(fā)展。
從去年開(kāi)始到目前為止,視頻模型還在較早期階段,但發(fā)展已經(jīng)非常迅速了。不管是數(shù)據(jù)還是模型的迭代,還是可控性或生成的質(zhì)量,在以一、兩個(gè)月或者兩、三個(gè)月的節(jié)奏迭代。
這對(duì)我們有什么影響呢?我們最開(kāi)始在視頻這一塊的預(yù)想類似于平行世界,可以改變視頻里面的一些元素,按照用戶自己的預(yù)想演進(jìn)。這有點(diǎn)像之前大家看到的一些AI鬼畜短片。
但實(shí)際過(guò)程會(huì)發(fā)現(xiàn)有一些點(diǎn)現(xiàn)有技術(shù)還不能完成,還是需要人工干預(yù)。也就是說(shuō)創(chuàng)作者雖然能有AI技術(shù)提高生產(chǎn)力,但不變的是自身還是需要掌握編劇能力。
我們不想沿著這個(gè)方向做生產(chǎn)力提升工具,所以沒(méi)有在這個(gè)方向上繼續(xù)探索,而是沿著之前的思路——希望有一群消費(fèi)者能夠有機(jī)會(huì)變成創(chuàng)作者。這是技術(shù)帶來(lái)的變化以及我們自己的變化。
第二個(gè)不得不提DeepSeek。
DeepSeek來(lái)了以后,它對(duì)于產(chǎn)品的變化有哪些?
一是像即夢(mèng)這種生成視頻或者生成圖片的平臺(tái),很大程度上借助了較為專業(yè)的prompt生成能力,生成效果更好。要知道,絕大部分人不會(huì)寫prompt。
這在貍譜App里也有應(yīng)用:現(xiàn)在,生圖和生成視頻還是需要prompt,有更好的讓普通人生成prompt的方式,對(duì)于AI生成很有幫助。
二是與我們最開(kāi)始設(shè)想有關(guān)。除了圖和視頻生成效果外,劇情內(nèi)容是很關(guān)鍵的部分。
我們用Claude 3.5、DeepSeek和自己的模型等寫劇情能力,發(fā)現(xiàn)AI寫劇情的能力還是沒(méi)有辦法媲美人類頂尖劇情創(chuàng)作者。如果它只是一個(gè)次級(jí)創(chuàng)作者,劇情的可消費(fèi)性就很弱——因?yàn)槿祟愂澜绮⒉蝗睂憚∏榈娜?,劇本生產(chǎn)力是足夠的,而消費(fèi)市場(chǎng)的大頭還是集中在頭部。
嘗試很長(zhǎng)一段時(shí)間后,我們決定先暫停用劇情生圖,因?yàn)槿绻麆∏椴粔蛴埠?,后面的東西都不成立。
這也是技術(shù)帶來(lái)的一些變化。雖然技術(shù)在進(jìn)步,但還達(dá)不到一定的水平,需要我們?cè)谧约旱漠a(chǎn)品里做一些割舍。
打造爆款,首先要了解產(chǎn)品和平臺(tái)特性
接著談?wù)勱P(guān)于制作爆款的經(jīng)驗(yàn)。
首先,這個(gè)爆款是來(lái)自于什么樣的渠道?是在抖音、小紅書(shū)還是在微信。
作為一個(gè)創(chuàng)業(yè)公司,一開(kāi)始從社交關(guān)系鏈爆起來(lái)很關(guān)鍵,而這個(gè)社交關(guān)系鏈很可能沉淀在微信上。
我們團(tuán)隊(duì)在很早的時(shí)候做了一、兩款跟貍譜App沒(méi)關(guān)系的小游戲,相當(dāng)于做的嘗試。
它們都切中兩個(gè)點(diǎn),第一個(gè)點(diǎn)是必須含有一些社交關(guān)系的影子。比如說(shuō)當(dāng)時(shí)做的小游戲《換你來(lái)當(dāng)?shù)?,游戲?nèi)容是自己當(dāng)?shù)B(yǎng)一個(gè)小兒子,切中的是男性大學(xué)生人群(男生的宿舍里總開(kāi)玩笑說(shuō)“你叫我爹”)。有社交關(guān)系在,就很容易從自己的社交關(guān)系傳播起來(lái)。
后來(lái)我們又做出了一款針對(duì)小紅書(shū)的爆款,切中的是年輕的白領(lǐng),他們對(duì)很治愈、很有情感溫暖的東西、毛絨絨的東西比較感興趣,把自己的情感在上面。
二次元人群和普通人群之間有一個(gè)共同點(diǎn),大家對(duì)于萌萌的、有溫暖氣息的治愈的東西都比較感興趣。所以我們當(dāng)時(shí)在小紅書(shū)上做了「一鍵把你變成Jellycat的鑰匙扣」,并做一個(gè)標(biāo)價(jià)。這個(gè)傳播較好,因?yàn)榭啥ㄖ苹u(píng)論區(qū)很多人問(wèn)哪里能買,希望能買到。
從這塊來(lái)說(shuō),首先要看產(chǎn)品本身針對(duì)的是什么樣的人群,所針對(duì)的這個(gè)人群訴求到底是什么;以及想要打造爆款的時(shí)候依托在什么平臺(tái),這個(gè)平臺(tái)的屬性是社交關(guān)系還是同好關(guān)系。
第三點(diǎn)是效果要比較好看,稍微有點(diǎn)獵奇和驚艷,這樣子大家才會(huì)有可能說(shuō)“沒(méi)有玩過(guò)”或者“有點(diǎn)驚訝”,然后傳播給自己身邊的人。
國(guó)內(nèi)AI產(chǎn)品經(jīng)歷一波流的困境無(wú)法承接爆發(fā)式的熱度,貍譜App其實(shí)也面臨這個(gè)問(wèn)題。
我們團(tuán)隊(duì)有制作爆款的能力,這是能力項(xiàng),作為創(chuàng)業(yè)公司能力要跟上。很多工具型產(chǎn)品其實(shí)爆款對(duì)它有一個(gè)脈沖式的沉淀,如果脈沖不及時(shí)跟上的話可能就一波流了。
作為創(chuàng)業(yè)公司,我們現(xiàn)在的迭代更新頻率并沒(méi)有很高,如果頻率增加了就更容易有用戶的積淀,在你這里不斷有一些新的東西讓用戶來(lái)嘗試。我們現(xiàn)在也要做的是把這個(gè)頻率增加上去,每一波都穩(wěn)步往上走,通過(guò)小的波峰催動(dòng)大的波峰,基線一直往上走。
關(guān)注多模態(tài)生成的實(shí)時(shí)生成和精準(zhǔn)可控
下一輪增長(zhǎng)的關(guān)鍵驅(qū)動(dòng)因素,我們還是關(guān)注多模態(tài)生成。
其中比較關(guān)注的點(diǎn),第一個(gè)是實(shí)時(shí)生成。
現(xiàn)在圖的生成速率已經(jīng)比較ok了,但視頻生成速率還是比較慢。有實(shí)時(shí)生成能力會(huì)完全改變現(xiàn)在媒介方式,會(huì)變成可交互式、邊消費(fèi)邊生產(chǎn)創(chuàng)作的過(guò)程。
第二個(gè)是精準(zhǔn)的可控性。
如果說(shuō)生成式AI第一個(gè)階段是prompt方式,第二個(gè)階段是輔助prompt的方式,第三個(gè)階段是文字的可控性(但不是精準(zhǔn)可控性),我認(rèn)為不久的將來(lái)會(huì)有精準(zhǔn)可控性的出現(xiàn)。
它的模式不完全是文字的方式,就像我們和人類設(shè)計(jì)師交流時(shí)不是直接說(shuō)“把xxx向右移動(dòng)3厘米”,而是“把xxx放到某個(gè)位置”,是視覺(jué)式而不是文字式的。我所說(shuō)的可控性,可以直接是手勢(shì)、行為加上語(yǔ)音的方式來(lái)實(shí)現(xiàn)精準(zhǔn)可控,再加上實(shí)時(shí)生成的話,玩法會(huì)非常多樣,自由度非常高。
以上兩個(gè)方向我比較關(guān)注。
熱門跟貼