上個(gè)月,OpenAI 在 ChatGPT 中引入了圖像生成功能,廣受歡迎:僅在第一周,全球就有超過(guò) 1.3 億用戶(hù)創(chuàng)建了超過(guò) 7 億張圖片。
就在剛剛,OpenAI 又宣布了一個(gè)好消息:他們正式在 API 中推出驅(qū)動(dòng) ChatGPT 多模態(tài)體驗(yàn)的原生模型 ——gpt-image-1,讓開(kāi)發(fā)者和企業(yè)能夠輕松將高質(zhì)量、專(zhuān)業(yè)級(jí)的圖像生成功能直接集成到自己的工具和平臺(tái)中。
這也意味著,從今天開(kāi)始,全世界的開(kāi)發(fā)人員都可以使用 ChatGPT 強(qiáng)大的圖像生成功能了。

API 指南:https://platform.openai.com/docs/guides/image-generation?image-generation-model=gpt-image-1
gpt-image-1 具有以下特點(diǎn):
- 生成更準(zhǔn)確,更高保真圖像;
- 多樣的視覺(jué)風(fēng)格;
- 精確的圖像編輯;
- 豐富的世界知識(shí);
- 一致的文本呈現(xiàn)。
OpenAI CEO 奧特曼表示:API 版本與ChatGPT 版本有一些不同:主要表現(xiàn)在用戶(hù)可以使用 moderation 參數(shù)控制審核敏感度。還可以控制質(zhì)量與生成速度、背景、輸出格式等。

在價(jià)格方面,gpt-image-1 按 token 定價(jià),文本和圖像 token 的定價(jià)不同:
- 文本輸入 token(提示文本):每 100 萬(wàn) token 5 美元
- 圖像輸入 token(輸入圖像):每 100 萬(wàn) token 10 美元
- 圖像輸出 token(生成的圖像):每 100 萬(wàn) token 40 美元
在實(shí)際使用中,這意味著用戶(hù)生成低質(zhì)量、中質(zhì)量和高質(zhì)量的方形圖像,分別需要花費(fèi)約 0.02 美元、0.07 美元和 0.19 美元,再加上文本輸入價(jià)格,只能說(shuō)這很 OpenAI。
API 可以帶來(lái)一系列好處,比如用戶(hù)可以在單個(gè)請(qǐng)求中一次生成多張圖像,但需要先設(shè)置 n 參數(shù),默認(rèn)情況下,API 返回單張圖片。(感覺(jué) token 使用量在燃燒。)

用戶(hù)還可以將一張或多張圖像作為參考圖像來(lái)生成新圖。在本例中使用 4 張輸入圖片來(lái)生成一張新的圖片。


還可以使用蒙版進(jìn)行圖片編輯:

OpenAI 表示,現(xiàn)在已經(jīng)有多家企業(yè)和初創(chuàng)公司將該模型用于創(chuàng)意項(xiàng)目、產(chǎn)品和體驗(yàn)。例如,多媒體巨頭 Adobe 旗下的 Firefly 和 Express 應(yīng)用,將集成 OpenAI 的圖像生成功能。
AI 視頻生成平臺(tái) HeyGen 正在集成 gpt-image-1 來(lái)增強(qiáng)虛擬形象的創(chuàng)建,特別是改進(jìn)平臺(tái)內(nèi)的虛擬形象編輯功能。

大家可以參考官方 API 指南,了解更多內(nèi)容。
參考鏈接:https://openai.com/index/image-generation-api/
熱門(mén)跟貼