打開網易新聞 查看精彩圖片

近日,文生圖領域權威的第三方榜單Artificial Analysis競技場發(fā)布消息稱,字節(jié)跳動Seed團隊圖像生成模型Seedream 3.0綜合性能已追平文生圖SOTA模型GPT-4o,穩(wěn)定超越Recraft V3、Ideogram、Imagen 3、Midjourney V6.1等模型,進入全球第一梯隊。

Seedream 3.0是字節(jié)近日發(fā)布的新一代文生圖主力模型,目前已在即夢、豆包等平臺全量開放。據Seedream 3.0技術報告,Seedream3.0是一個原生高分辨率、支持中英雙語的圖像生成基礎模型,無需后處理即可實現(xiàn) 2K 分辨率圖像直出,適配多比例場景,同時針對小字體高保真生成、多行文本排版等業(yè)界難題,模型也取得了突破性的效果表現(xiàn)。

值得一提的是,Seedream 3.0在3秒左右即可快速生成1K分辨率的高品質內容,相比之下,業(yè)界同類模型生成該分辨率內容的耗時基本在10秒以上,而此前文生圖SOTA模型GPT-4o平均耗時為77秒。

Seedream3.0還大幅提升了小字體高保真生成、多行文本語義排版表現(xiàn),滿足設計師對海報設計的需求。團隊在預訓練階段,引入跨模態(tài)旋轉位置編碼,補足傳統(tǒng)方法模態(tài)特征對齊短板,進一步加強了文字渲染能力。

Seedream團隊表示,“新模型在海報創(chuàng)作、生成效率、結構與美感等方面取得了明顯進步,但在生成可用性、美感與結構、智能化方面仍有提升空間?!?/p>

文/北京青年報記者 溫婧