打開網(wǎng)易新聞 查看精彩圖片

新智元報道

編輯:編輯部 ZNHY

【新智元導(dǎo)讀】谷歌重磅發(fā)布第七代TPU Ironwood,專為推理設(shè)計,性能較從初代飆升3600倍,可與英偉達B200一較高下。不僅如此,谷歌還帶來了Veo 2等多款模型全新升級,就連「谷歌版」MCP協(xié)議也公布了。

推理時代的首款TPU誕生了!

昨晚,一年一度的谷歌云大會上,首次亮相了谷歌第七代TPU——Ironwood,直接叫板英偉達Blackwell B200。

它是谷歌迄今為止性能最強、可擴展性最高的定制AI加速器,也是首款專為推理設(shè)計的加速器。

打開網(wǎng)易新聞 查看精彩圖片

相較于2018年的第一代TPU,Ironwood推理性能飆漲3600倍,效率提升了29倍。

甚至,第七代全新TPU的性能是世界第一大超算的24倍。谷歌將于今年晚些時候正式推出TPU v7。

打開網(wǎng)易新聞 查看精彩圖片

繼MPC之后,谷歌大會上首次亮相Agent2Agent(A2A)開放協(xié)議,為智能體提供一個通用語言,可以在不同生態(tài)系統(tǒng)溝通協(xié)作。

還有ADK、Agentspace,為開發(fā)者提供了全面構(gòu)建、操作、管理AI智能體的能力。

此外,谷歌云大會精彩紛呈,Veo 2、Imagen 3、Chirp 3紛紛迭代升級,文本轉(zhuǎn)音樂模型Lyria,Vertex AI成為唯一覆蓋視頻、圖像、語音和音樂的全新生成式AI平臺。

下一步,極具性價比Gemini 2.5 Flash也將登錄Vertex AI。

打開網(wǎng)易新聞 查看精彩圖片

推理時代首款TPU出世,媲美B200

Ironwood的誕生,不僅標(biāo)志著谷歌在AI硬件又一大突破,還代表著AI基礎(chǔ)設(shè)施的重大轉(zhuǎn)變。

在谷歌看來,當(dāng)下被動「響應(yīng)式」模型,正轉(zhuǎn)變?yōu)橹鲃印干墒健怪悄荏w。

打開網(wǎng)易新聞 查看精彩圖片

這種轉(zhuǎn)變的核心在于,AI不再僅僅停留在提供原始數(shù)據(jù)層面,而是能夠主動檢索信息、生成見解。

這正是在這個「推理時代」,谷歌對未來AI基礎(chǔ)設(shè)施的定義:更智能、更主動、更具協(xié)作性。

主要特性

· 性能顯著提升,同時注重功耗效率,使AI工作負(fù)載能夠更具成本效益地運行。

相比起第六代TPU Trillium,Ironwood在功耗效率(perf/watt)上實現(xiàn)了2倍的提升;比2018年推出的首款Cloud TPU,更是高出了近30倍。

同時,谷歌先進的液冷解決方案和優(yōu)化的芯片設(shè)計,即使在持續(xù)、繁重的AI工作負(fù)載下,也能可靠地維持高達標(biāo)準(zhǔn)風(fēng)冷兩倍的性能。

打開網(wǎng)易新聞 查看精彩圖片

圖 3. 功耗效率相較于TPU v2提升了29.3倍

· 高帶寬內(nèi)存(HBM)容量大幅增加

Ironwood芯片搭載了高達192GB的顯存,是Trillium的6倍。

如此一來,便可以處理更大的模型和數(shù)據(jù)集,同時還減少了頻繁數(shù)據(jù)傳輸?shù)男枨螅M而提高了性能。

· HBM帶寬顯著提高

Ironwood芯片在帶寬方面提升到了驚人的7.2 Tbps,是Trillium的4.5倍。

極高的帶寬確保了快速的數(shù)據(jù)訪問,這對于現(xiàn)代AI中常見的內(nèi)存密集型工作負(fù)載至關(guān)重要。

打開網(wǎng)易新聞 查看精彩圖片

· 芯片間互連(ICI)帶寬增強

Ironwood的雙向帶寬已增加到1.2 Tbps,是Trillium的1.5倍。這種芯片之間更快的通信,有助于大規(guī)模高效的分布式訓(xùn)練和推理。

用Ironwood驅(qū)動推理時代

Ironwood為要求最嚴(yán)苛的AI工作負(fù)載提供了所需的大規(guī)模并行處理能力,例如用于訓(xùn)練和推理的、具有思考能力的超大規(guī)模稠密LLM或MoE模型。

對于谷歌Cloud客戶,Ironwood可根據(jù)AI工作負(fù)載需求提供兩種規(guī)格——256芯片或9,216芯片。

打開網(wǎng)易新聞 查看精彩圖片

圖 1. FP8浮點運算峰值性能相較于TPU v2提升了3600倍

其中,每個單獨的芯片峰值算力達4,614 TFLOPs。

當(dāng)擴展到每個pod 9,216個芯片,總計達到42.5 Exaflop時,Ironwood的算力是世界上最大的超級計算機El Capitan的24倍以上——后者每個pod僅能提供1.7 Exaflops。

不僅如此,Ironwood還配備了增強版的專門用于處理高級排序和推薦任務(wù)的加速器——SparseCore。從而為更廣泛的工作負(fù)載提供加速,包括超越傳統(tǒng)AI領(lǐng)域,進入金融和科學(xué)領(lǐng)域。

Pathways是由谷歌DeepMind開發(fā)的ML運行時,可在多個TPU芯片上實現(xiàn)高效的分布式計算。

谷歌Cloud上的Pathways使得超越單個Ironwood Pod變得簡單直接,能夠?qū)?shù)十萬個Ironwood芯片組合在一起,從而快速推進生成式AI計算的前沿。

打開網(wǎng)易新聞 查看精彩圖片

圖 2. Ironwood原生支持FP8,而v4和v5p的峰值TFlops為模擬值

OpenAI研究員針對Ironwood與英偉達GB 200做了性能對比,并表示TPU v7與GB200性能相當(dāng),甚至略勝一籌。

打開網(wǎng)易新聞 查看精彩圖片

全模態(tài)AI平臺來了,Veo 2再升級

隨著音樂功能的加入,Vertex AI 現(xiàn)在是唯一一個擁有涵蓋所有模態(tài)——視頻、圖像、語音和音樂——的生成式媒體模型的平臺。

這次放出的重大更新共有四項:

· 文本轉(zhuǎn)音樂模型Lyria,讓客戶可以從文本提示詞開始,生成完整的、生產(chǎn)就緒的素材。

· Veo 2的新編輯和攝像機控制功能,可幫助企業(yè)客戶精確地優(yōu)化和再利用視頻內(nèi)容。

· Chirp 3現(xiàn)在包含了Instant Custom Voice,這是一種僅需10秒音頻輸入即可創(chuàng)建定制語音的新方法。

· Imagen 3改進了圖像生成和圖像修復(fù)能力,用于重建圖像中缺失或損壞的部分,并使物體移除編輯的質(zhì)量更高。

Lyria:文生音樂模型

Lyria能生成高保真音頻,細(xì)致捕捉精妙之處,并能在多種音樂流派中提供豐富、細(xì)節(jié)詳盡的樂曲。

· 企業(yè)可以提升品牌體驗

根據(jù)品牌獨特的調(diào)性,為營銷活動、產(chǎn)品發(fā)布或沉浸式店內(nèi)體驗快速定制配樂。

通過Lyria,企業(yè)可以創(chuàng)建與目標(biāo)受眾產(chǎn)生深度共鳴的聲音,培養(yǎng)情感聯(lián)系并增強品牌記憶度。

· 創(chuàng)作者可以簡化內(nèi)容創(chuàng)作流程

對于視頻制作、播客和數(shù)字內(nèi)容創(chuàng)作而言,尋找完美的免版稅音樂可能是一個耗時且昂貴的過程。

而Lyria可以在幾分鐘內(nèi)生成定制音樂曲目,直接契合您內(nèi)容的情緒、節(jié)奏和敘事,從而幫助加速制作工作流程并降低授權(quán)成本。例如:

創(chuàng)作一首高能的比波普 (Bebop) 曲調(diào)。優(yōu)先突出令人眩暈的薩克斯管和小號獨奏,以閃電般的速度交換復(fù)雜的樂句。鋼琴應(yīng)提供打擊樂式的和弦伴奏,行進貝斯 (walking bass) 和快節(jié)奏的鼓點驅(qū)動著狂熱的能量?;{(diào)應(yīng)是令人振奮且激烈的。捕捉深夜、煙霧繚繞的爵士俱樂部的感覺,展示精湛技藝和即興創(chuàng)作。要讓聽眾無法安坐。

 谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙
打開網(wǎng)易新聞 查看更多視頻
谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙

Veo 2:擴展編輯功能

Veo 2則為視頻的創(chuàng)建、編輯和視覺效果添加了一套強大的功能集,使其從一個生成工具轉(zhuǎn)變?yōu)橐粋€全面的視頻創(chuàng)作和編輯平臺:

· 視頻修復(fù) (Inpainting):無需手動修飾即可獲得干凈、專業(yè)的編輯效果。

你可以移除視頻中不需要的背景圖像、徽標(biāo)或干擾物,使它們在每一幀中都平滑完美地消失,看起來就像從未存在過一樣。

打開網(wǎng)易新聞 查看精彩圖片

· 畫面擴展 (Outpainting):擴展現(xiàn)有視頻素材的畫面,將傳統(tǒng)視頻轉(zhuǎn)換為針對網(wǎng)頁和移動平臺優(yōu)化的格式。

你可以輕松調(diào)整內(nèi)容來適應(yīng)不同的屏幕尺寸和寬高比——例如,將橫向視頻轉(zhuǎn)換為用于社交媒體短視頻的縱向視頻。

打開網(wǎng)易新聞 查看精彩圖片

· 應(yīng)用復(fù)雜的電影拍攝技術(shù):新功能包括指導(dǎo)鏡頭構(gòu)圖、攝像機角度和節(jié)奏等。

團隊可以輕松運用復(fù)雜的電影拍攝技術(shù),無需復(fù)雜的提示詞或?qū)I(yè)知識。

例如,使用攝像機預(yù)設(shè)向不同方向移動攝像機、創(chuàng)建延時攝影效果或生成無人機風(fēng)格鏡頭。

 谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙
打開網(wǎng)易新聞 查看更多視頻
谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙

· 通過連接兩個現(xiàn)有素材創(chuàng)建連貫的視頻。

借助插值(Interpolation)功能,你可以定義視頻序列的開始和結(jié)束,讓Veo無縫生成連接幀。

這確保了平滑過渡并保持視覺連續(xù)性,從而創(chuàng)造出精美且專業(yè)的最終成品。

Chirp 3:即時定制語音和轉(zhuǎn)錄功能更新

Chirp 3的高清語音(HD voices)功能提供了超過35種語言的自然逼真語音,并有8種說話人選項。

除此之外,谷歌還新增了兩個功能:

· 即時定制語音(Instant Custom Voice)

只需要10秒的音頻輸入,即可生成逼真的定制語音。這使得企業(yè)能夠個性化呼叫中心、開發(fā)無障礙內(nèi)容,并建立獨特的品牌聲音——同時保持一致的品牌形象。

· 帶說話人日志功能的轉(zhuǎn)錄(Transcription with Diarization)

這項強大的功能可以精確地分離和識別多人錄音中的單個說話人,顯著提高轉(zhuǎn)錄內(nèi)容的清晰度和可用性,適用于會議紀(jì)要、播客分析和多方通話錄音等應(yīng)用場景。

Imagen 3:改進質(zhì)量和編輯功能

作為谷歌最高質(zhì)量的文本轉(zhuǎn)圖像模型,Imagen 3能夠生成具有比之前更好細(xì)節(jié)、更豐富光照和更少干擾性偽影的圖像。

 谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙
打開網(wǎng)易新聞 查看更多視頻
谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙

這次,谷歌顯著改進了Imagen 3的圖像修復(fù)(inpainting)能力,用于重建圖像中缺失或損壞的部分。

尤其是在物體移除(object removal)方面,不僅質(zhì)量更高,而且效果也更加自然。

打開網(wǎng)易新聞 查看精彩圖片

MCP之后,谷歌再造A2A協(xié)議

智能體可以幫助人們做很多工作,從訂購新電腦,到協(xié)助客服人員,再到支持供應(yīng)鏈規(guī)劃。

智能體越來越實用的關(guān)鍵在于讓它們能夠在一個動態(tài)的多智能體生態(tài)系統(tǒng)中相互協(xié)作,跨越孤立的數(shù)據(jù)系統(tǒng)和應(yīng)用程序。

為此,谷歌推出了全新的開放協(xié)議——Agent2Agent(A2A),獲得了超過50家合作伙伴的支持和貢獻。

打開網(wǎng)易新聞 查看精彩圖片

A2A協(xié)議將使AI智能體能夠相互通信,安全地交換信息,并在各種企業(yè)平臺或應(yīng)用程序上協(xié)調(diào)行動。

它是一個開放協(xié)議,與Anthropic的模型上下文協(xié)議(MCP)相輔相成。

A2A設(shè)計原則

A2A遵循了五大核心原則:

·擁抱智能體的能力:A2A致力于讓智能體以它們自然、非結(jié)構(gòu)化的方式協(xié)作。

·基于現(xiàn)有標(biāo)準(zhǔn):A2A構(gòu)建在已有的、廣泛使用的標(biāo)準(zhǔn)之上,比如HTTP、SSE、JSON-RPC。

·默認(rèn)安全:A2A從設(shè)計之初就支持企業(yè)級別的認(rèn)證和授權(quán),與OpenAPI的認(rèn)證機制保持一致,確保安全性。

·支持長時間運行的任務(wù):設(shè)計A2A時考慮了靈活性,它能勝任從快速任務(wù)到需要數(shù)小時甚至數(shù)天的深入研究等多種場景,尤其是在有人的參與下。

·不限模態(tài):智能體的世界不只有文本,因此我們設(shè)計A2A時支持多種模態(tài),包括音頻和視頻流,讓它更加多樣化。

A2A如何工作

A2A讓「客戶端」智能體和「遠程」智能體之間的溝通變得更順暢。

打開網(wǎng)易新聞 查看精彩圖片

客戶端智能體負(fù)責(zé)制定和傳達任務(wù),而遠程智能體則負(fù)責(zé)執(zhí)行這些任務(wù),盡量提供正確的信息或采取正確的行動。這個互動涉及幾個關(guān)鍵功能:

·能力發(fā)現(xiàn):智能體可以通過JSON格式的「Agent Card」來展示自己的能力。客戶端智能體可以根據(jù)這個「名片」找到最適合執(zhí)行某項任務(wù)的智能體,并通過A2A與遠程智能體溝通。

·任務(wù)管理:客戶端智能體和遠程智能體之間的交流以完成任務(wù)為核心,目的是滿足用戶的需求。

·協(xié)作:智能體之間可以互相發(fā)送消息,分享上下文、回復(fù)、產(chǎn)物或用戶指令。

·用戶體驗協(xié)商:每條消息中包含「parts,」,這是一個完整的內(nèi)容單元,比如一張生成的圖片。

實例:尋找候選人

用戶(比如招聘經(jīng)理)可以讓自己的智能體去尋找符合職位描述的候選人。

這個智能體會與其他專業(yè)智能體互動,幫你挖掘潛在候選人。用戶收到推薦名單后,可以再指示智能體安排后續(xù)面試,讓找人的過程更順暢。面試結(jié)束后,還可以讓另一個智能體幫忙做背景調(diào)查。

打開網(wǎng)易新聞 查看精彩圖片

A2A有望開啟一個智能體相互操作的新時代,推動創(chuàng)新,打造更強大、更靈活的AI智能體系統(tǒng)。我們相信,這個協(xié)議將為未來鋪平道路,讓智能體能夠無縫協(xié)作,解決復(fù)雜問題,提升我們的生活。

我們致力于與合作伙伴和社區(qū)一起,公開構(gòu)建這個協(xié)議。我們會把協(xié)議開源,并為貢獻者設(shè)立清晰的參與路徑。

谷歌AI代碼助手,變身超強智能體

此次大會的另一個更新,就是谷歌的AI編碼助手——Gemini Code Assist,已經(jīng)在預(yù)覽中獲得了「智能體」能力!

在Cloud Next大會上,谷歌宣布:Code Assist現(xiàn)在可以部署新的AI智能體,這些智能體可以執(zhí)行多個步驟,來完成復(fù)雜的編程任務(wù)。

例如,這些智能體可以從Google Docs中的產(chǎn)品規(guī)格創(chuàng)建應(yīng)用程序,或者將代碼從一種語言轉(zhuǎn)換為另一種語言。

另外,Code Assist現(xiàn)在除了其他編碼環(huán)境外,還可在Android Studio中使用。

這次升級,也是谷歌被GitHub Copilot、Cursor和Devin這些競爭者給逼瘋了。

肉眼可見,現(xiàn)在AI編程隱含著巨大的掘金市場,各家的競爭也日趨白熱化。

不過,Code Assist能做到什么程度,目前還不清楚。研究表明,即使是今天最好的代碼生成AI,也往往會引入安全漏洞和錯誤,這是由于編程邏輯理解能力的弱點。

比如對Devin的一項評估就發(fā)現(xiàn),它只完成了20項任務(wù)中的3項。

接下來,就讓我們期待Gemini Code Assist在實際編程環(huán)境中的表現(xiàn)了。

參考資料:

https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/

https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai