生成式人工智能幾乎可以創(chuàng)造出任何圖像,但它很少告訴你圖像來自哪里或誰做出了貢獻。最近圍繞吉卜力工作室和OpenAI的爭議讓我們看到了其中的利害關系,因為人工智能生成的模仿工作室獨特動畫風格的圖像在網(wǎng)上瘋傳,盡管并沒有與宮崎駿關聯(lián),也沒有獲得授權模仿他的作品。

打開網(wǎng)易新聞 查看精彩圖片

在一個充滿人工智能的世界里,人工智能模型經(jīng)常在抓取和未經(jīng)許可的內(nèi)容上進行訓練,Getty Images提供了一種不同的工具:一種完全基于許可的、人工創(chuàng)建的內(nèi)容定制的圖像生成模型,并有一個版稅制度,確保貢獻者的工作得到報酬。

Getty Images人工智能/機器學習負責人Andrea Gagliano接受了媒體采訪。她的團隊負責監(jiān)督該公司的搜索和生成式人工智能工作,這些工作植根于Getty Images的創(chuàng)意方面,包括廣告和營銷活動中使用的圖像、插圖和視頻。與該公司涵蓋名人、政治和時事的編輯內(nèi)容不同,創(chuàng)意庫提供了一個沒有版權問題的基礎,完全來自授權的貢獻者內(nèi)容。

Getty Images在其人工智能生成器中建立了嚴格的保護措施:它不會生成已知的肖像或可識別的商標,確保內(nèi)容可用于商業(yè)用途。Gagliano說,客戶需要可以自由使用的視覺效果,而不必擔心法律風險。我們的目標是支持兩端的創(chuàng)造力:讓用戶能夠突破界限,同時繼續(xù)投資于使這一切成為可能的藝術家。

打開網(wǎng)易新聞 查看精彩圖片

Gagliano說:“我們真的認為它可以提升創(chuàng)造力,讓我們的客戶、創(chuàng)意人員和藝術家更具概念性,或者在創(chuàng)造力方面突破界限,但我們希望利用這種力量,同時確保我們以保護創(chuàng)作者和商業(yè)安全的方式這樣做?!?。

Getty沒有使用從互聯(lián)網(wǎng)上抓取的公共數(shù)據(jù)來訓練他們的模型,而是完全依賴其約2億張圖片的授權創(chuàng)意庫,貢獻者通過收入分成模式獲得報酬,該模式在產(chǎn)品生命周期內(nèi)對他們進行獎勵。Gagliano說,這些內(nèi)容是“從攝影師和貢獻者那里獲得許可的,它會定期向這些貢獻者提供補償,所以不僅僅是一次性費用,而是根據(jù)生成工具的收入,作為收入的一部分,直到永遠?!?/p>

通過測試Getty Images的人工智能生成模型,以創(chuàng)建一位藝術家和他的人工智能助手的圖像。用戶界面非常直觀,內(nèi)置的提示生成器有效且易于使用。用戶還可以使用特殊工具對圖像進行微調(diào),通過額外的提示突出顯示我們想要改進的區(qū)域。

與許多生成工具不同,Getty Images的模型提供了一些具體的東西:法律保證和商業(yè)可用性。生成的視覺效果具有每幅圖像高達50000美元的自動法律保護,該公司提供無上限的賠償作為其企業(yè)解決方案的一部分,以及永久和全球使用權,對印刷量或數(shù)字展示沒有限制。此外,用戶輸出永遠不會添加到Getty的可搜索創(chuàng)意庫中,并且有及時的保護措施來防止產(chǎn)生已知的品牌、徽標或名人肖像?!翱砂踩糜谏虡I(yè)用途”不僅是一種說法,也是該工具的基礎。

承諾一個真正的無版權圖像并不是一件容易的事。為了確保這一標準,Getty Images的生成模型沒有改編自任何現(xiàn)有的基礎模型。相反,它是與Nvidia合作,使用Nvidia Edify從頭開始構建的,這是一種用于開發(fā)視覺生成AI的多模態(tài)架構。Getty Images使用Nvidia AI Foundry訓練和定制模型,這是構建自定義模型的端到端平臺。這種方法使公司不僅可以控制數(shù)據(jù)管道,還可以控制模型的演變方式,從而規(guī)避預先訓練的公開來源模型帶來的法律和創(chuàng)意風險。

打開網(wǎng)易新聞 查看精彩圖片

該公司還避免了常見的技術捷徑,這些捷徑可能會隨著時間的推移損害質量或原創(chuàng)性。Getty Images不使用強化學習或對模型自己的輸出進行訓練。做出這一決定是為了防止一種稱為模型崩潰的現(xiàn)象,當生成的圖像逐漸變窄為重復的、同質的風格時,就會發(fā)生這種現(xiàn)象。

Gagliano解釋說:“基本上,模型的輸出開始收斂到一種非常小的像素分布?!薄皩ξ覀儊碚f,我們的模型保持更廣泛的適用性非常重要,這樣它就可以產(chǎn)生很多不同的像素和很多不同的東西?!?/p>

為了應對模式崩潰,Getty Images每季度都會注入數(shù)百萬新的創(chuàng)意資產(chǎn),這些資產(chǎn)都是由其全球藝術家和攝影師網(wǎng)絡貢獻的。其結果是,該系統(tǒng)不僅反映了從時尚到文化美學的當前視覺趨勢,而且保留了通過圖像講故事所必需的多樣性和新穎性。

Gagliano說:“我們有一個龐大的團隊,他們與我們的攝影師和創(chuàng)作人合作,不斷進行定量和定性研究,以發(fā)現(xiàn)我們的空白。”內(nèi)容團隊與貢獻者合作解決差距,添加新的主題、風格和代表性不足的觀點,支持公司的核心許可業(yè)務和生成模型的健康發(fā)展。

對新鮮度和多樣性的強調(diào)有助于保持模型的相關性和擴展性,但它也指出了生成式人工智能領域的一個更深層次的挑戰(zhàn),Gagliano認為這個挑戰(zhàn)尚未得到充分解決:對不斷擴大的數(shù)據(jù)量的依賴?!斑@些模型餓了,”她說。“只需向他們提供越來越多的數(shù)據(jù)。這就是讓你獲得更好輸出的力量,這是真的。但我認為,還有一個研究領域還沒有真正得到利用,那就是,我們?nèi)绾巫屵@些模型在更少的數(shù)據(jù)下更高效地工作?”

這個問題是Getty方法的核心。因為該公司致力于授權內(nèi)容和補償創(chuàng)作者,所以它不能走依賴于大量、不加選擇的數(shù)據(jù)集的捷徑。Gagliano說,相反,重點是開發(fā)能夠利用高價值、精心策劃的內(nèi)容做更多事情的模型架構。

她說:“在一個我們想補償創(chuàng)作者的世界里,有時我們不得不用更少的數(shù)據(jù)來做到這一點?!?/p>

雖然合成數(shù)據(jù)通常被視為解決方案,但Gagliano警告說,這并不總是一個干凈的解決方案?!昂铣蓴?shù)據(jù)可能很棒,”她說,“但前提是合成數(shù)據(jù)本身是在經(jīng)過許可內(nèi)容訓練的模型上訓練的?!狈駝t,藝術家不會得到補償,模型只是從未經(jīng)許可的來源生成更多的數(shù)據(jù)。

打開網(wǎng)易新聞 查看精彩圖片

Gagliano從雙方都理解創(chuàng)新和藝術完整性之間的微妙平衡。在她領導Getty的人工智能工作之前,她自己是一名視覺藝術家,現(xiàn)在仍然是,這使她能夠應對這些挑戰(zhàn)。

她說:“我對雙方都產(chǎn)生了同情和理解:對創(chuàng)新的技術驅動,對保護藝術家和創(chuàng)作者。我真的在努力思考如何找到一個更微妙的解決方案,一個不是一刀切的要么全有要么全無的解決方案?!?/p>