
作者|冰拿鐵
編輯|星奈
媒體|AI大模型工場
起猛了,一覺醒來,周圍變宮崎駿宇宙了,微信好友列表“人均吉卜力畫風”:
這要追溯到前幾天,OpenAI 更新了GPT-4o模型,推出原生圖像功能,能夠更精準地根據(jù)文字指令生成圖片,只需要輸入“把圖片中的人物變成吉卜力工作室角色”,即可將照片一鍵變成與吉卜力工作室創(chuàng)作的《千與千尋》《龍貓》等動畫風格類似的圖片。
功能一經(jīng)推出,就引發(fā)全網(wǎng)社交媒體“AI 吉卜力風”潮流,就連 OpenAI CEO Sam Altman 也一度將自己的 X 平臺頭像改為“吉卜力版本”,GPT-4o 也在LMSYS 排行榜上升至第二。在一條爆火的帖子中,網(wǎng)友Grant Slatton稱,趕緊把你和老婆的合照轉化成吉卜力風格然后發(fā)給她,絕對是極大的加分項~

然而,就在我感嘆AI發(fā)展速度如此之快、準備自己也生成個宮崎駿風頭像時,隔壁工位的設計崗同事卻相當?shù)ǎ骸坝惺裁粗档么篌@小怪的,我一年前就能用AI生成宮崎駿畫風的圖了,還能做個畫本!還是有聲的視頻!”
被一番科普后,我才發(fā)現(xiàn),這個“悶聲開大”的產(chǎn)品,竟然是我日常寫稿、找素材時的老工作搭子:百度文庫!
事實上,早在2024年4月,百度文庫APP就悄悄上線了“AI有聲畫本”功能,輸入一個主題就能生成畫本,能選擇將近10種畫風,其中就包括最近大火的宮崎駿畫風。不止于此,在百度文庫APP,還能自由選擇角色或者上傳照片定義角色、選擇配音等,不僅能實現(xiàn)文生圖,還能將多圖變成畫本視頻,成為圖文聲并茂的“睡前故事”!
那么,最終效果究竟如何?我們一起來試試!
一、實測百度文庫AI有聲畫本:圖文聲并茂,一站式端到端交付!
只有模糊的靈感,但由于詞匯量匱乏寫不出完整的腳本?沒關系,點開AI有聲畫本,輸入“幫我寫一個龍貓式森林探險的故事大綱”,點擊左下角DeepSeek R1-滿血版,百度文庫即可調用DeepSeek,交付出起承轉合完整的腳本大綱。
其中不乏優(yōu)美的意境和生動的細節(jié),如“清理時毒藤蔓發(fā)瘋似的纏過來,小龍豬急得把草莓醬全潑了出去”“藤蔓碰到甜味居然縮回去了,原來它們最怕天然發(fā)酵的味道”“月亮泉恢復清澈后,整片森林開出了會唱歌的夜光花”……
可見,百度文庫將DeepSeek-R1模型的深度思考能力和自身強大的多模態(tài)能力進行了對齊,實現(xiàn)了文本-圖像-音視頻的深度同頻共振,好比文筆優(yōu)美的寫手和功底深厚的畫手雙劍合璧。
確認后,則進入制作畫本環(huán)節(jié),選擇宮崎駿畫風,一個《龍貓森林奇遇記》的畫本就生成了:
再來一個“人類與森林精靈共同修復被污染的魔法之湖”故事。值得一提的是,如果對畫本中的單張圖片不滿意,也可以用AI進行改圖,為二創(chuàng)、精調留足了空間。
再加上,百度文庫還有豬豬俠等大量版權角色,所以寶爸寶媽還可以腦洞大開,來個跨文化融合,讓豬豬俠一鍵穿越,在宮崎駿宇宙里寫作業(yè):
除了最近大火的宮崎駿畫風外,百度文庫還有畫風可供選擇。比如,選擇毛絨畫風,一鍵生成萌化老母親的小兔子:
再比如,生成3D動畫效果的《桃花源記》,寓教于樂,讓看不進去課本的娃愛上語文:
在生動的畫本故事之外,可以清晰地看到,百度文庫AI有聲畫本在多場景處理、人物一致性、故事完整性等方面都已經(jīng)達到遙遙領先,畫風也十分成熟多變。
不止于此,相較GPT-4o,百度文庫的獨家優(yōu)勢是一站式、端到端的交付:
GPT-4o的文生圖功能確實驚艷,能將用戶上傳的照片轉化為漫畫、動畫風格,甚至生成主題彩漫。但這種能力仍停留在單點優(yōu)化層面。生成單張圖片后,用戶若想創(chuàng)作完整故事畫本,仍需手動串聯(lián)圖片、添加配音、制作視頻,在多個工具間反復切換。
而在百度文庫上,則實現(xiàn)了一站式、端到端閉環(huán),還實現(xiàn)了DeepSeek深度思考與AI生圖、生視頻的多模態(tài)能力的夢幻聯(lián)動,解決了創(chuàng)作中多工具切換導致的內(nèi)容割裂問題。這種“一站式交付”的能力,恰恰是當前大多數(shù)AI軟件的生態(tài)短板。
這也讓行業(yè)感慨,未來的內(nèi)容競爭,不再是單一模態(tài)的較量,而是全鏈路生態(tài)的協(xié)同進化。
在欣賞這么多畫本之余,也不禁讓我們思考,這樣的AI有聲畫本,到底如何最大化的為我所用?

二、家庭教育、休閑娛樂、兼職賺錢……AI有聲畫本有望掀起全民創(chuàng)作浪潮
首先,就是家校共育背景下的家庭教育場景,通過AI,即使完全沒有繪畫基礎的父母,也可以一句話、幾分鐘就創(chuàng)作出圖文并茂、人聲朗讀的視頻畫本,幫助父母在家庭中低門檻地實現(xiàn)對孩子的常識教育,在其樂融融的親子互動中,開啟有愛的共創(chuàng)之旅。
當下,中國小孩每年的人均繪本閱讀量只有10本,而歐美國家小孩為50本左右。而百度文庫降低了繪本的閱讀門檻與成本,有望讓這一差距縮小甚至追平。

在學校教育領域,智能畫本可以作為教學工具,幫助教師創(chuàng)建互動教學內(nèi)容,提高學生的學習興趣和效果。例如,在語文、歷史課上,教師可以通過智能畫本展示歷史事件和人物,讓學生更加直觀地理解歷史背景和文化內(nèi)涵。
而對于打工人、學生黨而言,百度文庫還為更多“斜杠青年”提供了機會,用戶也能通過作品發(fā)布、分享獲取收益、兼職賺錢;自媒體博主可以使用智能畫本快速生成視頻畫本,將故事和想法轉化為視覺輸出,豐富創(chuàng)作內(nèi)容,提高創(chuàng)作效率,例如,一位美食博主可以利用智能畫本生成一道菜品的制作過程和成品展示,這將極大地降低內(nèi)容創(chuàng)作的門檻,吸引更多跨界“外行”涌入自媒體行業(yè)。
在休閑娛樂領域,用戶可以像此次出圈的“吉卜力畫風”事件所展現(xiàn)的一樣,一鍵生成自己的專屬虛擬形象,AI結合面部識別與風格遷移技術,創(chuàng)造出既保留個人特征又充滿未來感的“獨家Q版形象”。這種個性化生產(chǎn)模式正在改變內(nèi)容消費邏輯,用戶從被動接受者轉變?yōu)橹鲃觿?chuàng)造者。正如前段時間網(wǎng)上有個很火的議題“休閑時,輸出型愛好永遠比消費型輸入愛好讓人充實”,與AI共創(chuàng)無疑就是一個有趣的“輸出型愛好”。
而對專業(yè)作者來說,智能畫本還可以為藝術家提供創(chuàng)作靈感。藝術家可以用智能畫本嘗試不同的藝術風格和構圖方式,探索新的創(chuàng)作可能性……
再放眼產(chǎn)業(yè),AI繪圖同樣有望在未來大面積商業(yè)化,降本增效,驅動產(chǎn)業(yè)從“勞動密集型”轉向“創(chuàng)意主導型”轉型,縮短美術風格探索周期。
北京百納千成影視股份有限公司首席內(nèi)容官張苗曾說,“AI技術正加速在動畫工業(yè)滲透,例如,AI輔助的群集動畫生成效率有望提升50%以上,布料解算等復雜工序可能從數(shù)周壓縮至數(shù)天。這種技術演進將重構動畫電影的成本曲線。”
而想要從中脫穎而出、占位未來藍海,必須提前布局。放眼繪畫行業(yè),這在百度文庫等頭號玩家身上體現(xiàn)得很明顯:除了領先行業(yè)推出AI有聲畫本等功能外,早在去年4月,百度文庫同步推出了智能漫畫功能,并宣布與玄機科技達成戰(zhàn)略合作,在跨模態(tài) AI 技術、內(nèi)容及 IP 共創(chuàng)等方面展開深入探索,打造更多基于 AI 技術的新國漫 IP。
可以預見,在百度文庫技術不斷打磨、提升下,AI繪圖有望進一步走入千家萬戶,讓AI普惠具象化。
三、尾聲
Edelman公司全球技術負責人賈斯汀·威斯科特曾在文章中寫道,當下大多數(shù)大模型就像是有無限工具的瑞士軍刀——讓人興奮但不知所措。它對大多數(shù)人來說太廣泛、太抽象、太難以接近。一個空白的聊天框不是產(chǎn)品,而是作業(yè)。
誠如所言,當下,這一比喻深刻揭示了大模型應用落地的主要矛盾,即就是功能豐富性與普通用戶體驗割裂性之間的矛盾:大模型雖具備文本生成、邏輯推理、多語言處理等綜合能力,但普通用戶面對空白輸入框時,需將模糊需求轉化為精確指令,如同學生需自行拆解題干隱含條件,還需要多個工具中來回橫跳,最終才能完成屬于自己的AI作品。
而真正好用的AI產(chǎn)品,則應該足夠具體、應用場景足夠豐富,且能夠最大限度激發(fā)靈感、輔助創(chuàng)作,并讓每個靈感都能找到生長的土壤。此次GPT-4o以吉卜力畫風出圈背后,就是技術普惠與用戶需求的共振結果,其價值不僅在于降本增效,更在于激活了人類創(chuàng)意的無限可能,讓全民用起、玩起來。
百度文庫則更進一步,把創(chuàng)作門檻降至一句話,讓大多數(shù)人用得上、會用且愛用,趣味性和實用性皆拉滿。
“一句話生成畫本”魔法像是給用戶遞上一支智能畫筆,讓每個人都能在畫布上揮灑想象——從詩人將朦朧意象化為宮崎駿宇宙,到教師用豬豬俠講活課本故事,再到老人生成畫本“追憶似水年華”,孩童帶著對世界的溫柔與好奇、用稚嫩卻鮮活的語言構建童話世界……無一不讓外界看到,AI正在成為人類思維的延伸器,專業(yè)創(chuàng)作與大眾表達在數(shù)字世界中共生共舞、互相成就。
這種轉變的更深層意義,在于它打破了“AI技術不接地氣”的刻板印象。未來的創(chuàng)作圖景,將是全民智慧與AI的水乳交融,人類負責保持對世界的驚奇與探索欲,AI則化身成為最懂我們的創(chuàng)作伙伴,在數(shù)字與現(xiàn)實的交界處,共同培育出超越想象的靈感之花。這或許就是AI最動人的承諾:不斷完成從工具理性到人文溫度的躍遷,讓每個創(chuàng)意火花都能找到燃燒的舞臺,讓每個平凡日常的縫隙,都能悄悄開出小花、誕生非凡的創(chuàng)造。
文中視頻觀看鏈接:https://mp.weixin.qq.com/s/GtA-3CYOcrIFaCdZ4PN_ng
熱門跟貼