研究團(tuán)隊(duì)提出了?MIGE,一個(gè)統(tǒng)一了主體驅(qū)動(dòng)可控生成和基于指令編輯的圖像生成框架。MIGE?通過利用多模態(tài)指令和條件輸入,實(shí)現(xiàn)了兩種任務(wù)的聯(lián)合訓(xùn)練,從而增強(qiáng)任務(wù)協(xié)同效應(yīng)并緩解數(shù)據(jù)稀缺問題。聯(lián)合訓(xùn)練還解鎖了新的能力,例如基于指令的主體驅(qū)動(dòng)圖像編輯。這一新任務(wù)還構(gòu)建了數(shù)據(jù)生成流程,并提出了用于評(píng)估的?MIGEBench。實(shí)驗(yàn)結(jié)果表明,聯(lián)合訓(xùn)練顯著提升了主體保真度和指令遵循能力,證明了任務(wù)統(tǒng)一帶來的優(yōu)勢(shì)。這一整合方式增強(qiáng)了可控性,并為未來的多模態(tài)圖像生成與編輯提供了新的發(fā)展方向?,F(xiàn)已上線始智AI-wisemodel開源社區(qū),歡迎前去體驗(yàn)。 模型和數(shù)據(jù)集地址 https://wisemodel.cn/models/EurekaTian/MIGE https://wisemodel.cn/datasets/EurekaTian/MIGEBench
研究團(tuán)隊(duì)提出了?MIGE,一個(gè)統(tǒng)一了主體驅(qū)動(dòng)可控生成和基于指令編輯的圖像生成框架。MIGE?通過利用多模態(tài)指令和條件輸入,實(shí)現(xiàn)了兩種任務(wù)的聯(lián)合訓(xùn)練,從而增強(qiáng)任務(wù)協(xié)同效應(yīng)并緩解數(shù)據(jù)稀缺問題。聯(lián)合訓(xùn)練還解鎖了新的能力,例如基于指令的主體驅(qū)動(dòng)圖像編輯。這一新任務(wù)還構(gòu)建了數(shù)據(jù)生成流程,并提出了用于評(píng)估的?MIGEBench。實(shí)驗(yàn)結(jié)果表明,聯(lián)合訓(xùn)練顯著提升了主體保真度和指令遵循能力,證明了任務(wù)統(tǒng)一帶來的優(yōu)勢(shì)。這一整合方式增強(qiáng)了可控性,并為未來的多模態(tài)圖像生成與編輯提供了新的發(fā)展方向?,F(xiàn)已上線始智AI-wisemodel開源社區(qū),歡迎前去體驗(yàn)。 模型和數(shù)據(jù)集地址 https://wisemodel.cn/models/EurekaTian/MIGE https://wisemodel.cn/datasets/EurekaTian/MIGEBench