打開網(wǎng)易新聞 查看精彩圖片

普通用戶到底需要什么?

在 R1 推理模型大火之后,全民接力集成 DeepSeek,有硅基流動(dòng)這樣的大模型云服務(wù)平臺(tái)、有騰訊元寶這樣的 Chatbot,甚至微信這樣的頂流。但是,AI 圖片類產(chǎn)品卻鮮少有接入 DeepSeek R1 的新聞,而從 DeepSeek-R1 發(fā)布到 Krea 宣布上線新功能僅僅 10 天,這個(gè)反應(yīng)應(yīng)該是圖像產(chǎn)品中最快的。

用 DeepSeek 降低門檻,Krea 率先“吃螃蟹”

在 Krea 之前,集成了 Chatbot 的生圖和改圖功能已經(jīng)存在,最典型如 ChatGPT,但用過的讀者應(yīng)該有一些感受,雖然疊加了 Chatbot 理解用戶意圖的步驟,但不論是生圖還是改圖,效果都不盡如人意。(可見下文案例對(duì)比)

而 DeepSeek-R1 的引入,讓這類功能的使用體驗(yàn)有了一些變化,2 個(gè)點(diǎn),深度推理且低成本。前者解決了可控,后者決定了,新技術(shù)可應(yīng)用到商業(yè)產(chǎn)品中。

用戶用自然語言表達(dá)意圖時(shí),不會(huì)像精心編寫的 Prompt 那樣清晰,DeepSeek-R1 則重在理解用戶意圖,而且 Krea 還給為了接近可用狀態(tài)所需要的后續(xù)操作,加了 buff。

打開網(wǎng)易新聞 查看精彩圖片

如上面的視頻,加了 R1 就是為了降低門檻,讓用戶可以用自然語言生圖、改圖,所以后續(xù)的一些操作,例如改變風(fēng)格、圖片生成動(dòng)畫,Krea 都設(shè)置了便捷交互按鈕,但在交互上,其實(shí)是產(chǎn)品將按鈕功能“翻譯”成一句方便 R1 理解的話,從而讓生成結(jié)果接近用戶預(yù)期。

筆者也對(duì) OpenAI 新推出的 o3-mini 推理模型和加入 R1 的 Krea,進(jìn)行了生圖和改圖的對(duì)比測(cè)試。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

生圖指令:Help me generate a picture of a sunset, beach, blue sea, coconut trees;

修改圖片指令:remove all coconut tree,注:Krea 生圖模型默認(rèn)選擇Flux,ChatGPT 選擇的是 GPT-4o 普通模型和 o3-mini 推理模型,生圖模型為 DALL-E3

首先,筆者用相同的自然語言指令,讓 Krea Chat 和 ChatGPT(兩種模型)各生成一張圖片(如左圖),然后再向兩者同時(shí)下達(dá)改圖指令,要求將海灘旁的椰子樹去掉(結(jié)果如右圖)。

我們看到,Krea 和 o3-mini 模型都將椰樹去掉了,完成了任務(wù),GPT-4o 生成的畫面中卻仍有椰樹。而兩個(gè)推理模型相比,o3-mini 改出來的圖像雖然去掉了椰子樹,但畫面幾乎等同于“重新生成”,Krea 令人比較驚喜的一點(diǎn)是,在幾種樹中只去掉了椰子樹,而且保留了原圖像的大部分元素,起碼能算是改圖。

效果差異的背后有 R1 和 o3 推理模型的區(qū)別,其實(shí)也會(huì)有生圖模型 Flux 和 DALL·E 3 的區(qū)別,由于沒有辦法進(jìn)行交叉驗(yàn)證,究竟是哪些因素影響了不同產(chǎn)品的改圖表現(xiàn)尚未可知。

這次,Krea 將 R1 集成到產(chǎn)品中,還有另一個(gè)前提條件——成本。

打開網(wǎng)易新聞 查看精彩圖片

在考驗(yàn)自然語言推理的 Zebra Logic 測(cè)試中,DeepSeek-R1 評(píng)分雖不如 OpenAI-o1,但評(píng)分卻比其他非推理模型高很多

打開網(wǎng)易新聞 查看精彩圖片

注:上面測(cè)試中使用的 o3-mimi 上線時(shí)間晚于DeepSeek-R1,API 價(jià)格也高于 DeepSeek

雖然 OpenAI o1 是最早上線的推理模型,但由于其昂貴的使用價(jià)格,用于改善生圖效果并不現(xiàn)實(shí),DeepSeek-R1 則完完全全將價(jià)格打了下來。

而 Krea 引入 R1,除了讓生圖和改圖更接近用戶預(yù)期之外,另一個(gè)層面的顯著收益是,讓使用門檻降了下來,不論是不用再去精心編寫 prompt,還是點(diǎn)一下就能進(jìn)行后續(xù)步驟,都對(duì)普通用戶更加友好。

訪問量增長停滯,Krea 急于破圈

白鯨出海的老讀者,應(yīng)該知道我們?cè)谶^去半年一直在更新 AI 圖片出海洞察系列,Krea 是我們覺得在一眾圖片編輯產(chǎn)品中,有自身獨(dú)特定位和特色的一個(gè)產(chǎn)品。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

12 月圖片編輯(上)/生成(下)產(chǎn)品的人均訪問次數(shù)和人均訪問時(shí)長數(shù)據(jù),注:Krea 功能覆蓋圖片生成、修改、與增強(qiáng),很難單純的將其分類到生圖/修圖類別,所以這里我們分別與修圖和生圖產(chǎn)品進(jìn)行對(duì)比|白鯨出海制圖

從人均訪問次數(shù)和時(shí)長的角度看,Krea 的數(shù)據(jù)還是不錯(cuò)的,表明獲得了一些用戶的認(rèn)可。但從流量的角度,一款口碑還可以、使用數(shù)據(jù)也不錯(cuò)的產(chǎn)品,卻一直橫盤狀態(tài),甚至在 2024 年下半年一直下滑。

打開網(wǎng)易新聞 查看精彩圖片

直到 1 月份,Krea 頻繁更新,上線了實(shí)時(shí) 3D 生成和快速定制化訓(xùn)練 Avatar,2 個(gè)比較破圈的功能,其流量在 1 月轉(zhuǎn)好。

這其中的原因,與 Krea 相對(duì)獨(dú)特的使用體驗(yàn)所吸引到的大多是偏專業(yè)的用戶有關(guān)(下文會(huì)詳細(xì)解釋),在流量下滑的情況下,Krea 嘗試破圈尋找增量用戶。Krea 的創(chuàng)始人 Victor Perez 也在一個(gè)播客中表示:“目前 Krea 的用戶中專業(yè)人士占比很高,但就團(tuán)隊(duì)的計(jì)劃而言,則更希望去做真正面向普通人的 AI 工具。”

秉持著這個(gè)理念,Krea 的產(chǎn)品設(shè)計(jì)與迭代方向,一直致力于簡化操作、優(yōu)化用戶的交互體驗(yàn),以吸引更多元的用戶,引入 DeepSeek 驅(qū)動(dòng)的 Krea Chat,其實(shí)也是這一思路的延續(xù)。

靠實(shí)時(shí)生圖解決“可控性”問題,Krea 賺到了“第一波用戶”

Krea 成立于 2022 年,創(chuàng)始人 Victor Perez 從創(chuàng)業(yè)孵化器 HF0,獲得了數(shù)百萬美元的初期投資,并創(chuàng)立了 Krea。(注:HF0 是位于舊金山的一個(gè)創(chuàng)業(yè)孵化器,他們會(huì)為創(chuàng)業(yè)者提供一個(gè)為期 12 周的封閉工作空間,并視創(chuàng)始人在這期間的表現(xiàn),為創(chuàng)業(yè)項(xiàng)目提供投資,額度超100萬美元以,上不封頂,占有初創(chuàng)公司 5%的股權(quán)。)

Krea 自己本身并沒有自研模型,走的是“開源模型+優(yōu)化工程&UI”的路徑,結(jié)合筆者的體驗(yàn)和創(chuàng)始人分享,Krea 的核心差異點(diǎn)是“精準(zhǔn)控制”,而為了實(shí)現(xiàn)精準(zhǔn)控制,Krea 著重在交互優(yōu)化上下了功夫,而目前主打的實(shí)時(shí)生圖功能,就很能體現(xiàn)這一思路。

Krea 落地頁
打開網(wǎng)易新聞 查看精彩圖片
Krea 落地頁

Krea 于 2023 年初開始封閉測(cè)試,實(shí)時(shí)生圖功能也誕生于封測(cè)時(shí)期。根據(jù)創(chuàng)始人 Victor 的分享,實(shí)時(shí)生圖的靈感來源于“投屏”,他想到,在用戶生成圖片時(shí),可以將結(jié)果實(shí)時(shí)顯示出來,然后再讓用戶照著結(jié)果,進(jìn)一步與 AI 進(jìn)行交互,形成獨(dú)特的用戶體驗(yàn)”。

一位 Krea 的投資者的陳述|圖片來源:YC
打開網(wǎng)易新聞 查看精彩圖片
一位 Krea 的投資者的陳述|圖片來源:YC

隨后,他用了一夜時(shí)間寫好了 Demo,并將測(cè)試視頻發(fā)在了 Twitter 上,很多用戶表示非常感興趣,并希望試用這個(gè)程序。用戶的反饋?zhàn)?Victor 信心倍增,經(jīng)過幾個(gè)月的開發(fā),當(dāng) 2023 年 11 月 Krea 正式上線時(shí),實(shí)時(shí)生成功能成了主打功能。一位 Krea 的投資人表示,他就是看中了 Krea 低延遲的實(shí)時(shí)生圖,才投資了 Krea。

圖片來源:AI 產(chǎn)品榜(2023 年 12 月)
打開網(wǎng)易新聞 查看精彩圖片
圖片來源:AI 產(chǎn)品榜(2023 年 12 月)

在推出實(shí)時(shí)生圖功能 1 個(gè)月后,2023 年 12 月,Krea 的網(wǎng)站流量就增長了 191%,達(dá)到了 365 萬,下一個(gè)月(2024.1)訪問量又提升了 22%,接近 450 萬。

打開網(wǎng)易新聞 查看精彩圖片

注 1:我在這里選擇的一張參考背景,但很多創(chuàng)作者會(huì)選擇直接在黑色背景上進(jìn)行創(chuàng)作,注 2:如果上傳參考圖片或者風(fēng)格,Krea 中會(huì)出現(xiàn)了權(quán)重控制,是一個(gè) 0-1 的浮點(diǎn)數(shù)值,數(shù)值越接近 1,最終輸出會(huì)與參考圖像/風(fēng)格越接近。

實(shí)時(shí)生圖界面中,畫布被分成了兩部分,左邊是創(chuàng)作區(qū),右邊是成品區(qū),用戶在下方輸入 Prompt,初版的圖像就顯示在右側(cè)了。除了 Prompt 外,用戶可以上傳參考圖片,選擇預(yù)設(shè)風(fēng)格(官方和社區(qū)訓(xùn)練好的 Lora)來控制生圖效果,并調(diào)節(jié)各個(gè)風(fēng)格/圖像的“權(quán)重”,以更精準(zhǔn)地控制輸出。(Krea 的文生圖功能也有類似的設(shè)計(jì))

打開網(wǎng)易新聞 查看精彩圖片

通過圖形和涂鴉,可以控制畫面中重要物體的形狀、位置、顏色,注:AI Strength 越高,AI 創(chuàng)作的權(quán)重越大,越低,則更忠實(shí)于用戶繪制的內(nèi)容

隨后,用戶可以在左側(cè)的創(chuàng)作區(qū)“手繪”涂鴉或插入圖形(矩形、三角形和圓形),來控制畫面中人物或物體的位置和形狀,并通過調(diào)整 AI Strength 參數(shù)來平衡自己的“創(chuàng)作”和 AI 的“發(fā)揮” ,所有改動(dòng)都會(huì)實(shí)時(shí)顯示在右側(cè)。

根據(jù) Krea 創(chuàng)始人給出的數(shù)據(jù),實(shí)時(shí)顯示的延遲大概在 40 毫秒左右,當(dāng)用戶拖動(dòng)圖形時(shí),Krea 也會(huì)以每秒 4-5 幀(相當(dāng)于 250 毫秒左右處理一張圖像)的速度連續(xù)處理圖像。創(chuàng)始人解釋道,實(shí)時(shí)生圖本來對(duì)算力的要求就很高,如果算上高并發(fā),需要的算力儲(chǔ)備就更大了,40 毫秒的延遲,用戶既不會(huì)感到特別卡頓,還能盡量節(jié)省算力。

一位自稱是 Krea 員工的 Reddit用戶的分享|圖片來源:Reddit
打開網(wǎng)易新聞 查看精彩圖片
一位自稱是 Krea 員工的 Reddit用戶的分享|圖片來源:Reddit

在工程方面,Krea 堅(jiān)持自己部署模型,以減少使用第三方托管平臺(tái)帶來的延遲,團(tuán)隊(duì)也花了大量時(shí)間圍繞算力、模型等基礎(chǔ)設(shè)施進(jìn)行了開發(fā)與優(yōu)化,讓 Krea 在更大用戶量的情況下,也能維持低延遲。

打開網(wǎng)易新聞 查看精彩圖片

而在用戶完成一版設(shè)計(jì)之后,還可以把右側(cè)的“成品圖”拖動(dòng)到左邊,并以這版圖像作為基礎(chǔ),進(jìn)一步進(jìn)行修改和優(yōu)化,實(shí)現(xiàn)多次迭代。與 Krea Chat 相似,實(shí)時(shí)生圖也算是文生圖功能的變種和延伸,用戶通過圖形、涂鴉來精準(zhǔn)地按自己意愿修改圖像,并可以多次迭代,以減少生圖模型不可控性的影響,相比無限抽卡,這種模式看上去更有效率。

但相比 Krea Chat,讓用戶通過圖形和涂鴉去控制生圖效果的門檻其實(shí)不低,無論是筆者本人,還是試用過 Krea 的編輯部同事都有相同的感覺,“知道這個(gè)實(shí)時(shí)生圖功能很好,但就是不知道它對(duì)自己來說能做什么用?!?/p>

從數(shù)據(jù)來看,到 2024 年 2 月(實(shí)時(shí)生圖上線 3 個(gè)月后),Krea 的訪問量已經(jīng)突破了 600 萬,相當(dāng)于過去一年時(shí)間,Krea 的訪問量都沒有突破這個(gè)“天花板”。

為專業(yè)用戶打造完整工作流的 Krea,能吸引普通用戶嗎?

Krea 落地頁
打開網(wǎng)易新聞 查看精彩圖片
Krea 落地頁

除了上面介紹的實(shí)時(shí)生圖和 Krea Chat 功能外,Krea 提供文生圖、改圖、圖像增強(qiáng)等圖像功能。此外,還給到了一個(gè)生成視頻的功能,這個(gè)功能于 2024 年 5 月推出,現(xiàn)已接入了混元、Runway、Kling、Hailuo 等市面上主流的視頻生成模型

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
文生圖(上)、改圖(中),圖像增強(qiáng)(下)|圖片來源:Krea
打開網(wǎng)易新聞 查看精彩圖片
文生圖(上)、改圖(中),圖像增強(qiáng)(下)|圖片來源:Krea

從生圖、改圖到圖像增強(qiáng),Krea 基本形成了一個(gè)較為完整的工作流整體體驗(yàn)下來,這幾項(xiàng)功能的效果是很在線的。而延續(xù)整體思路,基于優(yōu)秀交互的精準(zhǔn)控制,Krea 在交互也下了功夫,這些功能的操作都是比較簡便的。

打開網(wǎng)易新聞 查看精彩圖片

用戶可以直接在畫面中框選,并輸入 Prompt,就可以在局部添加物體或修改圖像

社媒上的用戶對(duì) Krea 優(yōu)化“精準(zhǔn)控制”的思路,絕大多數(shù)都是報(bào)以好評(píng)的,這與我們之前的認(rèn)知一致,作為 Krea 初期吸引到的專業(yè)用戶,“可控性”是剛需,而 Krea 也回應(yīng)了這個(gè)需求。從在 X 中與 Krea 官號(hào)和創(chuàng)始人 Victor 互動(dòng)的用戶來觀察,Krea 目前的用戶畫像大概是藝術(shù)家、設(shè)計(jì)師、需要經(jīng)常做圖的營銷人員等相對(duì)專業(yè)一些的人士。

但是對(duì)出于娛樂目的或低頻使用 AI 圖像產(chǎn)品的普通用戶來說,由于他們對(duì)最終的圖像并沒有具像化的認(rèn)知,所以實(shí)時(shí)生圖提供的“可控性”可能吸引力不大,這大概就是 Krea 近半年來很難“破圈”的原因。

但反觀 Krea Chat,不論是引入 DeepSeek-R1,以更好地理解用戶意圖,還是通過標(biāo)簽,讓用戶能夠一鍵下達(dá)準(zhǔn)確的“改圖”指令,其實(shí)都是在回應(yīng)普通用戶,對(duì)簡便操作、靈感指引和改圖智能程度的需求。而推出 Krea Chat 之后,這款產(chǎn)品能否破圈,找到新的用戶增長點(diǎn),還需要觀察他們后續(xù)的流量表現(xiàn)。