用聲音,聽見真格。

「此話當(dāng)真」是一檔泛商業(yè)類播客,我們希望搭建這樣一個分享和交流的平臺,讓每一個對商業(yè)、科技、創(chuàng)投充滿好奇的人都能在這里有所收獲。每期播客將會由不同的真格投資人擔(dān)任主持,和各領(lǐng)域的領(lǐng)軍人物一起帶大家深入了解科技趨勢,以及創(chuàng)新技術(shù)的影響力。交流科技熱點,我們只想給你最專業(yè)的解讀。

當(dāng)然,我們希望這不僅僅是一個播客,更是一次創(chuàng)業(yè)的探索。真格,你的創(chuàng)業(yè)第一站!我們期待與你相遇,一同發(fā)現(xiàn)新的可能。

上個月底,OpenAI 宣布了一項驚艷全網(wǎng)的重大更新,將全新的圖像生成模型加入了 GPT-4o。4o 不僅能夠具備更強(qiáng)的編輯和合成能力,還能將文字的深入理解融入到圖像生成中,通過簡單的一行文字指令,就可以取代過去需要整合各種 AI 模型和工具的復(fù)雜創(chuàng)作工作流。毫無疑問,我們正在見證一個全新的視覺時代。

自 Sora 發(fā)布作為起點, AI 內(nèi)容生成技術(shù)已經(jīng)進(jìn)入了驚人的發(fā)展,從最初的短秒級視頻,再到如今更高畫質(zhì)、更強(qiáng)更可控的長視頻生成以及精準(zhǔn)編輯能力,AI 正在逐漸成為內(nèi)容生產(chǎn)的核心引擎。

本期「此話當(dāng)真」,我們邀請到了硅谷一線視頻生成模型初創(chuàng)公司 Luma.ai 的產(chǎn)品經(jīng)理 Barkley,以及國內(nèi)最活躍的頂尖 AIGC 創(chuàng)作者海辛和阿文。這是一場來自創(chuàng)意、產(chǎn)品與投資三重視角的交叉對談,我們圍繞三個主題展開討論:

首先是針對當(dāng)下 AI 視頻生成行業(yè)的整體觀察和技術(shù)回顧。前沿創(chuàng)作者們?nèi)绾卫斫獠⒂煤靡曨l生成工具?新一代的 AI 創(chuàng)意工作流會因為 4o 的發(fā)布有怎樣的變化?行業(yè)內(nèi)下一個突破會在什么地方?AI 視頻領(lǐng)域距離 AGI 時刻還有多遠(yuǎn)?

打開網(wǎng)易新聞 查看精彩圖片

主持人

謝巖 Monica:真格基金投資副總裁

嘉賓

Barkley:硅谷視頻模型初創(chuàng)企業(yè) Luma.ai 產(chǎn)品經(jīng)理,也是 Luma 團(tuán)隊的唯一 PM

海辛:實驗電影人、AIGC 藝術(shù)家、AI 時代的藝術(shù)創(chuàng)新者。早期為品牌創(chuàng)作 AI 短片,作品《To Dear Me》榮獲北影節(jié) AI 單元最佳影片,《故宮貓貓上班記》全網(wǎng)瀏覽量破億,制作龍年央視春晚 AI 動畫 MV《枕著光的她》等等

阿文:平面設(shè)計師、3D 藝術(shù)家、AIGC 藝術(shù)家。與海辛共同創(chuàng)作作品《To Dear Me》、《故宮貓貓上班記》、《枕著光的她》等等

時間軸

嘉賓介紹

04:45 海辛:電影轉(zhuǎn) AI 內(nèi)容創(chuàng)作者,用 AI 視頻生成的內(nèi)容做游戲

05:46 阿文:PPT 設(shè)計師,AI 也能做出很好的拼貼風(fēng)動畫

07:17 Barkley:從 TikTok 加入 Luma 的產(chǎn)品經(jīng)理

4o 圖像生成發(fā)布之后

11:38 解構(gòu)圖像分層:生成透明底的 png,解放生產(chǎn)力

13:26 Google Gemini VS GPT-4o 的生圖體驗對比

20:13 自回顧模型逆轉(zhuǎn)了之前擴(kuò)散模型的優(yōu)勢

22:40 像素之間的距離與語義之間的距離有多遠(yuǎn)?

30:23 4o 把圖片轉(zhuǎn)化成語言,視覺理解和視覺生成同樣重要

32:15 底層模型的研究最終會帶來技術(shù)層、應(yīng)用層、產(chǎn)品層的改變

33:23 國產(chǎn)視頻模型帶來實際生產(chǎn)力的提升,對 Sora 反而期望過高

過去一年的 AIGC 進(jìn)展的驚艷時刻

34:42 從 Sora 到可靈,再從 Midjourney 到 Google Whisk 到 GPT-4o

36:46 當(dāng)大一統(tǒng)模型足夠強(qiáng)大,工作流會直接被替代

38:22 4o 也有做不到的事情:高度自定義素材的無法延展、換臉只認(rèn)識名人 etc

42:42 做視頻生成屆的 agent 或許為時過早

AIGC 不只是降本增效,而是新的藝術(shù)形態(tài)

45:05 各家模型優(yōu)勢不一,充會員都充哭了

48:37 復(fù)雜鏡頭組接的視聽語言,需要有足夠的數(shù)據(jù)和時間訓(xùn)練

54:54 現(xiàn)階段無法被滿足的制作需求,很快就能在某一天被實現(xiàn)

57:20 學(xué)習(xí) AI 創(chuàng)作建議直接從源頭找資料,屏蔽信息噪音

59:57 AI 誕生之后變得更幸福了嗎?AI 不只是降本增效,而是新的藝術(shù)形態(tài)

01:03:02 AI 視頻生成應(yīng)用:3D 動畫、電影和廣告行業(yè)的反應(yīng)速度

視頻領(lǐng)域的 AGI 時刻是什么?

01:13:13 最容易被 AI 沖擊的是類似摳圖的單點工具

01:14:24 Adobe 反而比以前用得更多了:AI 破破爛爛,行活縫縫補(bǔ)補(bǔ)

01:16:30 未來的皮克斯可能會誕生在一個 AI 公司里

01:18:22 創(chuàng)作不再是有錢有權(quán)的人才能享有的特權(quán)

正在招募中,合伙人親自帶,創(chuàng)業(yè)和投資雙重體驗,有轉(zhuǎn)正機(jī)會。歡迎感興趣的同學(xué)投遞!

Luma AI 目前在招募 AI data 方面的人才,data PM/engineer 和 model infra 都有 opening,可在國內(nèi)遠(yuǎn)程。自薦/推薦歡迎 email:barkley@lumalabs.ai

海辛在開頭提到的解謎游戲 aka 銹滬:http://xhslink.com/a/VryqmhwpMmPab

同時也歡迎關(guān)注海辛和阿文與他們未來的創(chuàng)作:

微博、小紅書、視頻號、即刻搜索「海辛Hyacinth」、「Simon_」,X 搜索「ring_hyacinth」、「simonxxoo」

你可以通過小宇宙、蘋果 Podcast 、喜馬拉雅收聽我們。如果你對節(jié)目有任何的建議與期待,歡迎在留言區(qū)互動~

如果你有任何的創(chuàng)業(yè)想法或合作想法,歡迎發(fā)郵件到 media@zhenfund.com!

打開網(wǎng)易新聞 查看精彩圖片