每年春節(jié)前夕,各家平臺紛紛推出花樣繁多的營銷活動,玩法更是推陳出新,好不熱鬧。今年卻有些不一樣,以百度搜索的「AI拜年」為例,融合了AI的能力,用戶只要上傳照片并輸入一句話prompt,就能生成一張年味十足的定制拜年賀卡。

也許你會好奇,AI生成的圖片會不會「AI味兒」很重?困擾已久的幻覺問題,怎么辦?AIGC的人物會不會有恐怖谷效應(yīng)?下面,跟隨K哥一起來測評吧。

01

當(dāng)AI有了「文化大腦」

現(xiàn)在,打開百度首頁,搜索“祝福語”,進(jìn)入到拜年的搜索結(jié)果頁,點擊“做賀卡”進(jìn)入到定制頁面,通過“創(chuàng)意照片”上傳你想要“玩”的圖片。圖片生成加上祝福語,你就擁有獨一無二的新年祝??ㄆ?。

打開網(wǎng)易新聞 查看精彩圖片

我驚喜地發(fā)現(xiàn),無論是出圖質(zhì)量還是準(zhǔn)確度,都十分優(yōu)秀,有別于市面上的一些文生圖大模型。于是,我繼續(xù)深入做些測評,K哥先上傳一張馬斯克的照片,然后輸入提示詞:圖中的人物在東方明珠吃火鍋。

打開網(wǎng)易新聞 查看精彩圖片

還不錯吧?再生成一張:在黃浦江的游艇上打摜蛋。哈哈哈哈,果然都是金錢的味道。

打開網(wǎng)易新聞 查看精彩圖片

大過年的,怎么能沒有餃子呢?幫我生成一張:在埃菲爾鐵塔包餃子。看這架勢,沒個三五年手藝包不出這形兒,AI也太懂人間煙火氣了。

打開網(wǎng)易新聞 查看精彩圖片

寫實的風(fēng)格,已經(jīng)難不倒AI了,接下來試試跨空間的創(chuàng)意。先來一張:沙漠里的天壇。雄偉壯觀、古樸典雅,真不愧是中國古代建筑的杰出之作。

打開網(wǎng)易新聞 查看精彩圖片

再畫一張:深山里的“上海三件套”。開始我是忐忑的,直到看到這張圖片,被徹底震撼了,連上海三件套都能理解到位、精準(zhǔn)出圖,請收下我的膝蓋。

打開網(wǎng)易新聞 查看精彩圖片

有山怎么能沒有水呢?再來一張:海邊的福建土樓。

打開網(wǎng)易新聞 查看精彩圖片

一番測評下來,我直呼:這個AI太有「文化」、太上頭了,根本停不下來?;诎俣人阉鞯膬|級圖片資源,結(jié)合強(qiáng)大的基礎(chǔ)模型能力,在春節(jié)這樣最具中國特色的傳統(tǒng)節(jié)日中,精準(zhǔn)的文化優(yōu)勢得以凸現(xiàn)。

看到這里,你一定跟我一樣好奇:為什么AI味兒、幻覺問題、恐怖谷效應(yīng)都神奇般的消失了?這背后的秘密就是AI生產(chǎn)力神器---百度iRAG。

02

百度iRAG,大揭秘

1)百度iRAG,究竟是啥?

iRAG(image based RAG),就是百度自研的檢索增強(qiáng)的文生圖技術(shù),將百度搜索的億級圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,就可以生成接近真實世界的圖片,整體效果遠(yuǎn)遠(yuǎn)超過文生圖原生系統(tǒng),去掉了AI味兒,也就解決了恐怖谷效應(yīng)問題,工程實現(xiàn)的成本還很低??偟膩碚f,iRAG具有無幻覺、超真實、沒成本、立等可取等特點。

通過以上測評,想必都對iRAG的能力有了認(rèn)識,百度基于iRAG技術(shù)打造了“AI拜年”產(chǎn)品,讓AI真正服務(wù)于春節(jié)這樣的傳統(tǒng)節(jié)日,普通用戶都可以用來生成想象力豐富的圖片,讓年更「好玩」,充分感受到AI技術(shù)的魅力。

2)iRAG解決了什么問題?

首先是幻覺問題,這也是大模型規(guī)?;涞貞?yīng)用的主要限制之一。大模型幻覺是指大模型在生成文本、圖像、視頻等內(nèi)容時,模型可能會產(chǎn)生不符合事實或不準(zhǔn)確的信息,也就是大家常說的:一本正經(jīng)的“胡說八道”。就目前來說,解決大模型幻覺的一種有效辦法是RAG(檢索增強(qiáng)生成)。

但是在文生圖片、文生視頻等多模態(tài)領(lǐng)域RAG的結(jié)合還不夠,幻覺問題非常普遍,比如某開源模型生成的北京天壇的照片有4層,而真正的天壇是3層,再比如會出現(xiàn)一個人類的手掌有6個手指等等。直到2024年百度推出了iRAG技術(shù),解決了多模態(tài)的幻覺問題。

其次,iRAG實現(xiàn)了準(zhǔn)確性上的突破,準(zhǔn)確性是評估AI生成圖像效果的首要標(biāo)準(zhǔn),生成的圖像必須真實反映現(xiàn)實世界。舉例來說,你想生成貝克漢姆的圖片,AI卻給你生成了梅西,這樣的大模型肯定是沒戲的。百度搜索收錄了海量特定事物的可信圖片資源,大模型與這個靠譜的“外掛知識庫”相結(jié)合,iRAG生成的圖像,準(zhǔn)確率更高、幻覺更少。

03

AI科技的車輪,滾滾向前

跟任何一次科技浪潮一樣,AI技術(shù)發(fā)展勢不可擋,并且越來越深刻地改變?nèi)藗兊纳詈蜕a(chǎn)方式。以百度iRAG為例,iRAG在影視作品、漫畫作品、連續(xù)畫本、海報制作等領(lǐng)域都有廣泛的應(yīng)用空間,不僅可以有效降低AI生圖的幻覺問題,而且生成的圖片更真實、自然,更重要的是大幅降低了創(chuàng)作成本。iRAG技術(shù),好比一個「產(chǎn)業(yè)加速器」,許多產(chǎn)業(yè)將發(fā)生變革。

舉例來說,在品牌宣傳領(lǐng)域,用傳統(tǒng)的方式拍一組汽車大片,找場景、拍攝、后期修圖等等,沒有幾十萬根本搞不定?,F(xiàn)在有了iRAG,一個人、一臺電腦就能輕松出圖,創(chuàng)作成本接近于0。

這場AI技術(shù)浪潮是不可逆的,K哥非??春胕RAG在各行業(yè)的應(yīng)用前景,我身邊的設(shè)計師朋友,80%都已經(jīng)在用AI提升工作效率。我們已經(jīng)進(jìn)入到一個“人人都是設(shè)計師”的時代,相信不久的將來,就連賣煎餅果子的老板都能用AI設(shè)計出自己的專屬菜單,iRAG將普惠每一位創(chuàng)作者。

結(jié)束語

正如百度創(chuàng)始人李彥宏所說的:“過去這24個月,對這個行業(yè)而言,最大的變化是什么?我的回答一定是,大模型基本消除了幻覺,回答問題的準(zhǔn)確性大幅提升了,這讓AI從‘一本正經(jīng)的胡說八道’,變得可用、可被信賴。” 在K哥看來百度iRAG技術(shù),無疑是2024年AI行業(yè)的一大亮點,也是最重要的AI技術(shù)創(chuàng)新之一。

有理由相信,iRAG與千行百業(yè)的場景融合,必定會迸發(fā)出更多創(chuàng)意和創(chuàng)新的火花,希望有更多人拿起AI工具,加入到創(chuàng)作者的行列,最后以一句史蒂夫·喬布斯的名言作為結(jié)尾,與你共勉:“創(chuàng)新,是領(lǐng)導(dǎo)者與跟隨者的區(qū)別所在?!?/p>