打開網(wǎng)易新聞 查看精彩圖片

出品 | 網(wǎng)易科技《態(tài)度》欄目

作者 | 袁 寧

編輯 | 丁廣勝

一場關(guān)于Transformer專利的討論,正在兩個世界里以截然不同的方式展開。

在AI圈,它幾乎沒引起任何波瀾。

對他們而言,Transformer是一種常識級的存在,幾乎像空氣一樣不言自明。他們認(rèn)為:Transformer不僅是一項技術(shù),更是一個生態(tài)。大家都在用,也早已與最初的模樣不同,谷歌根本不可能動真格發(fā)動專利戰(zhàn)。

他們更關(guān)注OpenAI是否在換架構(gòu),關(guān)心KV緩存如何優(yōu)化、怎么壓縮信息,怎么快速收斂,或者下一個prompt tuning能不能提速5%。

當(dāng)前部分使用Transformer架構(gòu)的大模型,DeepSeek整理,網(wǎng)易科技制圖
打開網(wǎng)易新聞 查看精彩圖片
當(dāng)前部分使用Transformer架構(gòu)的大模型,DeepSeek整理,網(wǎng)易科技制圖

但在另一個空間——律師圈,氣氛卻截然不同。

知名律所的專利律師正在朋友圈和會議室中頻繁提及“注意力機(jī)制”“代理授權(quán)”“中國駁回”這些關(guān)鍵詞。

有人在推演一旦專利通過后,哪些大模型公司會被波及;有人開始查閱中、美、歐專利數(shù)據(jù)庫,一頁頁比對谷歌的申請文本;還有律師干脆直接到大模型公司登門拜訪,告訴他們是時候注意到這件事情了。

一位律師感慨:“你們搞AI的啊,真是太樂觀了。谷歌要是真開始收專利費,你們才知道什么叫全球化風(fēng)險?!?/p>

于是,一個“毫無反應(yīng)”的技術(shù)世界和一個“高度活躍”的法律世界,在谷歌Transformer專利復(fù)審這件事上,對著同一件事,雙方?jīng)]有對話,做出完全不同的判斷。

但也正是這種割裂,在提醒著我們:AI 的競爭絕不只是數(shù)據(jù)、算力與算法的競速,更是關(guān)于規(guī)則制定、權(quán)利邊界與商業(yè)博弈的復(fù)合戰(zhàn)爭。

谷歌的專利保護(hù)范圍,針對“注意力機(jī)制”

在 AI 圈,Transformer 是常識,是已經(jīng)嵌入無數(shù)大模型底層結(jié)構(gòu)的“地基”。它由谷歌研究團(tuán)隊于2017年,在論文《Attention Is All You Need》中提出,目前已成為大語言模型(如 GPT、BERT、Llama)的基石。

截至2025年3月,《Attention Is All You Need》論文已被引用超17萬次,是 AI 領(lǐng)域最具影響力的研究之一。

該論文引入了自注意力機(jī)制和多頭注意力機(jī)制,注意力機(jī)制讓模型能在處理語言序列時,自主判斷哪些詞更重要,從而顯著提高了效率與表達(dá)能力。谷歌圍繞這一機(jī)制,已在全球布局了數(shù)十項同族專利,并在美國、歐洲、日本等地陸續(xù)獲批。

谷歌Transformer發(fā)明專利全球布局概況
打開網(wǎng)易新聞 查看精彩圖片
谷歌Transformer發(fā)明專利全球布局概況

但在國內(nèi)律師圈,它卻仍是一個懸而未決的法律議題。

值得注意的是,谷歌Transformer發(fā)明專利并非針對整個Transformer架構(gòu),而是針對其核心底層機(jī)制,也就是我們通常所講的“注意力機(jī)制”。

2024年1月,中國國家知識產(chǎn)權(quán)局以“不屬于專利法規(guī)定的技術(shù)方案”為由,駁回了谷歌的專利申請。

駁回決定指出,該專利主要涉及對神經(jīng)網(wǎng)絡(luò)算法的改進(jìn),未能解決具體技術(shù)領(lǐng)域的具體技術(shù)問題,未能采用專利法意義上的技術(shù)手段,也未能實現(xiàn)專利法意義上的技術(shù)效果。

聽上去術(shù)語復(fù)雜,其實問題出在兩個核心點:一是這項發(fā)明只是對神經(jīng)網(wǎng)絡(luò)算法的改進(jìn),并未解決某個具體的工程或技術(shù)問題;二是注意力機(jī)制是算法內(nèi)部的計算邏輯,不屬于被中國專利法承認(rèn)的“技術(shù)手段”。

隨后,谷歌主動調(diào)整。2024年4月,谷歌將專利限縮到“摘要”和“問答”兩個應(yīng)用場景,并向中國國家知識產(chǎn)權(quán)局提交復(fù)審請求。同年11月14日,國家知識產(chǎn)權(quán)局撤銷此前駁回決定,專利進(jìn)入實質(zhì)性審查。

換句話說,谷歌不再主張整個注意力機(jī)制都屬于自己,而是希望先在部分高頻應(yīng)用上取得突破。

這也意味著,一旦大模型在“摘要”和“問答”兩個應(yīng)用場景中應(yīng)用“注意力機(jī)制”,就很難逃脫谷歌的專利保護(hù)范圍。

圖注:谷歌Transformer中國發(fā)明專利的最新修改文本
打開網(wǎng)易新聞 查看精彩圖片
圖注:谷歌Transformer中國發(fā)明專利的最新修改文本

但此后,新一輪的博弈又開始了。

2024年12月31日,中國國家知識產(chǎn)權(quán)局下發(fā)第四次審查意見通知書,指出說明書公開不充分。截至本文撰稿時,谷歌對此還沒有答復(fù)。

圖注:《國家知識產(chǎn)權(quán)局的第四次審查意見通知書》
打開網(wǎng)易新聞 查看精彩圖片
圖注:《國家知識產(chǎn)權(quán)局的第四次審查意見通知書》

但北京高文律所合伙人、專利律師王冬告訴網(wǎng)易科技,無論刪除權(quán)利要求還是據(jù)理力爭,說明書公開不充分的問題不難克服。也就是說,這件中國專利未來授權(quán)概率很高。

如果這些同族專利最終獲得授權(quán),將有助于谷歌在 AI 時代構(gòu)建全球技術(shù)壁壘,讓Transformer變成企業(yè)必須“付費通行”的高速公路。

一旦谷歌主張專利侵權(quán),企業(yè)或陷入“三選一”困局

一旦專利獲得授權(quán),問題就不再是“能不能用”,而可能是“怎么用”。

發(fā)明專利是專利體系中保護(hù)力度最強(qiáng)的,最長可達(dá)20年。此次我們所討論的谷歌 Transformer 架構(gòu)的專利,就屬于發(fā)明專利范疇。

獲得專利授權(quán)后,持有者可以通過許可、轉(zhuǎn)讓或訴訟實現(xiàn)商業(yè)收益,并對侵權(quán)者要求停止侵害,并賠償損失。

當(dāng)然,專利侵權(quán)的確認(rèn)和范疇還需要復(fù)雜的界定。但一旦確認(rèn)侵權(quán),依賴該架構(gòu)的企業(yè),則或?qū)⒚媾R三種選擇:

· 停止使用;

· 繼續(xù)使用但支付專利許可費;

· 另尋模型架構(gòu),規(guī)避技術(shù)壁壘。

對于巨頭公司來說,支付授權(quán)費或許只是成本問題。但對技術(shù)路徑已經(jīng)依賴Transformer架構(gòu)、資金資源有限的中小企業(yè)而言,這幾乎等于一紙封路令。

更隱秘的風(fēng)險在于:如果谷歌的專利保護(hù)范圍足夠?qū)挿?,即使后來者對架?gòu)進(jìn)行了優(yōu)化和改良,也依然可能落入其權(quán)利要求的“覆蓋區(qū)”仍然構(gòu)成侵權(quán)。這讓谷歌專利更像是一條收費高速路,所有人都得“買票通行”。

但擁有專利,不等于主動開戰(zhàn)。

行業(yè)人士向網(wǎng)易科技表示,專利更多時候是一個防守型武器。它真正的價值,在于確立優(yōu)先權(quán)——當(dāng)有人對你發(fā)起專利訴訟,你可以用自家的專利組合進(jìn)行反制。這也是為什么科技巨頭普遍選擇通過交叉授權(quán)來達(dá)成一種“核威懾”式的平衡。

谷歌過去在 AI 領(lǐng)域的專利布局,也更像是在修一座“技術(shù)護(hù)城河”。它要的是位置,是議價權(quán),而不是立即變現(xiàn)的通行費。

這背后還有現(xiàn)實考量:專利訴訟周期長、成本高、結(jié)果不確定。比如甲骨文訴谷歌的 Java 侵權(quán)案,整整打了十年,最后谷歌雖然贏了,但雙方都付出了巨額代價。

涉谷歌的部分專利糾紛案件及結(jié)果,DeepSeek整理,網(wǎng)易科技制圖
打開網(wǎng)易新聞 查看精彩圖片
涉谷歌的部分專利糾紛案件及結(jié)果,DeepSeek整理,網(wǎng)易科技制圖

更關(guān)鍵的是,如果谷歌今天揮舞專利大棒,明天就可能面對整個行業(yè)的聯(lián)合反彈。甚至可能遭遇反壟斷調(diào)查,或被貼上“扼殺創(chuàng)新”的標(biāo)簽,動搖它在開發(fā)者社區(qū)中的信譽。

綜上,谷歌主動對AI大模型公司發(fā)起專利訴訟的可能性極低。但這并不意味著它不會發(fā)生。

王冬律師指出,這就像達(dá)摩克里斯之劍——它或許不會立刻落下,但誰也無法忽視它的存在。例如,谷歌可以將Transformer專利許可或轉(zhuǎn)讓給第三方專利運營公司,從而發(fā)起對大模型公司的狙擊。這在通信行業(yè)早有前車之鑒。

Transformer并非唯一,大模型架構(gòu)探索仍在繼續(xù)

盡管谷歌專利引發(fā)了行業(yè)高度關(guān)注,但從技術(shù)演進(jìn)的角度看,Transformer 可能并非不可替代的唯一選項。

元始智能聯(lián)合創(chuàng)始人、COO羅璇向網(wǎng)易科技透露,雖然Transformer 仍是當(dāng)前主流架構(gòu),但行業(yè)內(nèi)已有跡象表明,頭部 AI 公司和研究機(jī)構(gòu)已經(jīng)正在探索“非 Transformer ”架構(gòu)的替代方案。

羅璇表示,這不僅僅是一個國產(chǎn)化替代的問題,更是企業(yè)在面對 Transformer 架構(gòu)能力瓶頸、算力資源緊張背景下,為追求更高效率和更強(qiáng)性能所做的主動技術(shù)突圍。

騰訊混元 T1就引入了 Hybrid-Mamba-Transformer 融合架構(gòu),通過結(jié)構(gòu)調(diào)整大幅降低計算復(fù)雜度,并優(yōu)化 KV-Cache 的內(nèi)存占用,提升推理和訓(xùn)練效率。

英偉達(dá)也在其開源大模型 Nemotron-H 中使用了類似的混合架構(gòu),推理速度達(dá)到同體量競品的三倍,顯著提高了在實際部署中的能效比。

而在部署層面,微軟則更進(jìn)一步:已在 Windows 系統(tǒng)中默認(rèn)內(nèi)置 RWKV 模型調(diào)用庫。羅璇告訴網(wǎng)易科技,RWKV 作為一種非 Transformer 架構(gòu),已經(jīng)成為當(dāng)前部署最廣泛的非transformer架構(gòu)。

部分非Transformer架構(gòu)的模型,DeepSeek整理,網(wǎng)易科技制圖
打開網(wǎng)易新聞 查看精彩圖片
部分非Transformer架構(gòu)的模型,DeepSeek整理,網(wǎng)易科技制圖

在這些架構(gòu)探索和專利博弈的背后,反映出的其實是一個更深層的行業(yè)邏輯:

AI 競爭的戰(zhàn)場,從來不僅是技術(shù)優(yōu)劣的單點比拼,更是圍繞技術(shù)生態(tài)和制度規(guī)則的全局較量。

誰擁有更高的效率、更強(qiáng)的通用性,當(dāng)然能在模型性能上占據(jù)先機(jī);但誰掌握標(biāo)準(zhǔn)、協(xié)議的制定權(quán),才能在全球范圍內(nèi)確立自己的主導(dǎo)地位。

對國內(nèi) AI 企業(yè)而言,大模型不僅僅是技術(shù)課題,更是建立商業(yè)護(hù)城河、構(gòu)建國際競爭力的核心資產(chǎn)。

開放與封閉、共享與壟斷、創(chuàng)新與合規(guī)——企業(yè)要想穿越下一階段的全球博弈,就必須不僅擅長寫代碼,也要擅長讀懂“游戲規(guī)則”。

谷歌的 Transformer 專利最終是否會成為 AI 產(chǎn)業(yè)的“緊箍咒”,尚未可知。但可以肯定的是:未來 AI 的競爭,早已不止是架構(gòu)之爭,也不止是參數(shù)規(guī)模的軍備競賽。

更激烈的較量,正在算法之外悄然展開。