打開網(wǎng)易新聞 查看精彩圖片

2024年, AI對現(xiàn)實世界的“入侵” 似乎成為了一種常態(tài)。

年初,OpenAI的視頻生成模型 Sora 橫空出世,用戶驚嘆“ 現(xiàn)實不存在了 ”。5月,OpenAI發(fā)布 GPT-4o ,這個模型能夠處理或生成文本、圖像和音頻等多種形式的數(shù)據(jù)。10月, 諾貝爾獎 揭曉,物理學獎以及化學獎 都與AI相關。 11月初, 英偉達 成為全球市值率先突破3.6萬億美元的公司。

但拋開AI作為新科技的光環(huán), 回歸產業(yè)的本質 ,AI行業(yè)仍然有不少待解決的問題:不少科技公司斥巨資押注算力,但 投入與產出 成正比了嗎?在AI這條產業(yè)鏈上,哪類角色真正掌握著話語權,只有少數(shù)派盈利的 產業(yè)鏈能維持平衡嗎 ?做 面向C端 的AI應用,真的是一條捷徑嗎?

我們將在本篇行研中,聚焦AI行業(yè)的核心問題,探討未來AI行業(yè)有哪些 新的可能性 。先分享一些核心結論:

  • 算力瓶頸不只是單純的技術和建設問題,而是影響整個行業(yè)競爭格局的重要變量。

  • 我們逐漸進入一個多模態(tài)靈活轉換的新時代。簡單來說,就是用AI實現(xiàn)文本、圖像、音頻、視頻及其他更多模態(tài)之間的互相理解和相互轉換。

  • 在人類勞動的未來圖景中,勞動形式正在逐步“軟件化”。復雜勞動被抽象為可調用的軟件服務,勞動流程被大幅標準化和模塊化,勞動能力像“即插即用”的工具一樣易于獲取。

  • AI行業(yè)目前仍處于嚴重虧損的階段,商業(yè)化進程仍有巨大提升空間。

  • 云廠商不僅掌握著龐大的商業(yè)生態(tài)和技術資源,還擁有數(shù)千億美元的云服務市場規(guī)模。它們是產業(yè)鏈中毋庸置疑的“鏈主”。

  • 2024年,頭部AI應用的品類變化并不顯著。創(chuàng)意工具(如圖像和視頻內容創(chuàng)作)依然占據(jù)最大比重。

  • ToP(面向專業(yè)用戶)應用展現(xiàn)出強大的市場潛力,ToB(面向企業(yè))應用發(fā)展路徑相對復雜,ToC應用面臨較大的挑戰(zhàn)。

  • 在AI應用領域,Copilot和AI Agent是兩種主要的技術實現(xiàn)方式。Copilot可以理解為“輔助駕駛”,適合擁有先發(fā)優(yōu)勢的大廠。AI Agent可以視作“自動駕駛”,或許適合有足夠創(chuàng)新能力的創(chuàng)業(yè)公司。

  • 北美和歐洲貢獻了AI移動應用市場三分之二的份額,這也是眾多中國AI公司積極出海的重要原因之一。

希望能帶來新的思考角度。 我們持續(xù)關注AI賽道的發(fā)展 ,如果你是AI領域的創(chuàng)業(yè)者或者從業(yè)者,歡迎聯(lián)系本文作者 峰瑞資本投資合伙人陳石 (chenshi@freesvc.com)。p.s.我們使用 GPT 輔助編輯了部分內容。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

互動福利

你怎么看待 AI行業(yè)如今的進展 ,或者 對未來的發(fā)展有何期待 ?歡迎在評論區(qū)和我們聊聊。我們將隨機挑選5位讀者,分別送出 《這就是ChatGPT》一書。

/ 01 /

2024年AI行業(yè)的新進展

2024年,OpenAI在大部分時間處于“ 被挑戰(zhàn) ”的狀態(tài)。

Anthropic發(fā)布的 Claude 3.5 Sonnet 和Google發(fā)布的 Gemini 1.5 等頭部基座大模型一直在沖擊和挑戰(zhàn)OpenAI的GPT-4 。直到接近Q3末,OpenAI發(fā)布新模型 o1 ,其基于思維鏈和強化學習的新訓練和推理方法,展現(xiàn)出來明顯超出GPT-4等傳統(tǒng)模型的復雜推理能力,才維持住了OpenAI業(yè)界第一的地位。

“ 多模態(tài) ”讓人驚喜。

2024年初, OpenAI的視頻生成模型Sora 橫空出世,首次具備強大的視頻生成能力,引發(fā)業(yè)界的轟動。5月份,OpenAI發(fā)布 G PT-4o ,其中“o”是“ omni (全能) ”的縮寫,這個模型能夠處理或生成文本、圖像和音頻等多種形式的數(shù)據(jù),甚至還擁有逼真的實時語音對話能力。

開源世界 也不遑多讓。

比如Meta在7月推出 Llama 3.1 405B 版本,在推理、數(shù)學、多語言處理和長上下文任務上能夠與GPT-4o和Claude 3.5 Sonnet等頭部基座模型不相上下??梢哉f,Llama 3.1縮小了開放模型與封閉模型之間的差距 ,進一步擠壓了全球非頭部基座大模型的生存空間。此外, 中國的開源項目 ,例如Qwen-2、DeepSeek 等在全球范圍內也贏得了眾多用戶。

隨著“蒸餾”和“量化”等技術的發(fā)展,模型的 小型化和端側化 也逐漸形成一種趨勢。多家公司推出4B(40億)參數(shù)以下的專業(yè)或端側小模型,在盡量保持性能的前提下,大幅降低對算力的需求。蘋果公司在6月份發(fā)布面向iPhone、iPad和Mac的個人智能化系統(tǒng) Apple Intelligence ,在上述設備中嵌入一個大約3B(30億參數(shù))的本地模型,提供強大的生成式AI功能。

生成式AI和大模型技術加速破圈,在 基礎科學、自動駕駛和具身智能 領域取得了突破。被譽為“AlphaFold之父”的谷歌DeepMind公司Demis Hassabis博士和John Jumper博士因為蛋白質結構預測獲諾貝爾化學獎,Geoffrey Hinton和John Hopfield因神經網(wǎng)絡研究榮獲諾貝爾物理學獎,彰顯了AI對于生物和物理學的深遠影響。同樣值得一提的是,得益于多模態(tài)大模型的發(fā)展,自動駕駛的安全性和可靠性得到了顯著提升,具身智能機器人的感知、決策與交互能力也得到增強。

在 AI 基礎設施領域 ,英偉達憑借強大的賺錢能力(Q2收入約300億美金,凈利潤約166億美金)和算力芯片的壟斷地位,成為當前僅次于蘋果,全球市值第二的公司(截止2024年11月26日,市值超過3.3萬億美金)。傳統(tǒng)競爭對手如AMD和英特爾無法縮小與其的差距,而Cerebras、Groq及其他AI芯片初創(chuàng)公司則希望在 推理芯片 方面打開缺口。

與大模型的高歌猛進相比, AI的應用落地還不及預期 。這體現(xiàn)在 頭部產品在用戶增長、留存和活躍度 方面還有待提升。并且,這些應用主要集中在大語言模型助手、AI陪伴、多模態(tài)創(chuàng)意工具、編程輔助、銷售營銷等若干領域,它們收獲了一些用戶或商業(yè)成果,但覆蓋范圍還不夠廣。此外,目前AI行業(yè)在 自身造血能力 方面還有所欠缺,投入與產出嚴重不對等。

業(yè)界認為, AI供應鏈處于一種脆弱的平衡中 ,主要參與方包括晶圓代工廠(如臺積電)、芯片制造商(如英偉達)、工業(yè)能源供應商、云廠商、AI模型開發(fā)商和應用服務商等,其中 大 型云廠商扮演著風險吸收者的角色 。一旦大型云廠商的信心或投資意愿出現(xiàn)動搖,這種脆弱的平衡就可能被打破,從而引發(fā)供應鏈的動蕩。

/ 02 /

行業(yè)宏觀概覽

投入與產出不對等

科技巨頭和VC們在AI行業(yè)押注重金 。根據(jù)騰訊科技的梳理,僅Google、Meta、微軟和亞馬遜四巨頭在2024年Q2就投入529億美金。截至8月底,AI創(chuàng)業(yè)公司已斬獲高達641億美元的風險投資。

打開網(wǎng)易新聞 查看精彩圖片

這些 巨額投資的成效正逐步顯現(xiàn) ,四巨頭建設的數(shù)據(jù)中心達到1000個。但AI數(shù)據(jù)中心的 能源消耗量極高 。根據(jù)市場研究機構DataCenterHawk統(tǒng)計,從2015年到2024年,美國和加拿大的數(shù)據(jù)中心向能源公司訂購的電量已激增近九倍。除了能源,GPU幾乎占據(jù)了數(shù)據(jù)中心一半的成本,英偉達在第二季度賣GPU算力的收入達到300億美金。

硬性成本之外,作為主要的軟性成本,AI行業(yè)的 人才投入也在持續(xù)加碼 。根據(jù)第三方求職網(wǎng)站Levels.fyi發(fā)布的2024年第一季度AI工程師薪酬調查數(shù)據(jù),資深AI工程師的平均薪酬約為68萬美元,遠超非AI資深工程師的49.5萬美元。

打開網(wǎng)易新聞 查看精彩圖片

與上述巨額投入相比,目前AI大模型行業(yè) 年度客戶總收入僅為小幾百億美元 。例如,頭部公司中,OpenAI預計年收入約為37億美元,預計虧損50億美元,《紐約時報》稱OpenAI最大的成本在算力上;微軟的GitHub Copilot年收入約為3億美元,《華爾街日報》稱,2024年前幾個月,GitHub Copilot平均每月要給大多數(shù)用戶“倒貼”20美元,甚至要給部分用戶倒貼80美元??梢哉f,AI大模型行業(yè)目前仍處于 嚴重虧損 階段。美國紅杉資本曾在一篇文章中指出,AI行業(yè)的年客戶總收入達到6000億美元才算合理水平,可見目前的 商業(yè)化進程仍有巨大提升空間 。

據(jù)SensorTower統(tǒng)計,2024全年全球AI移動應用內付費收入預計為30億美元,其中 圖像和視頻類AI應用 占據(jù)主導地位,收入占比高達53%;對話機器人類別排名第二,占比29%;其他類別合計不足20%。從地區(qū)分布來看, 北美和歐洲貢獻了三分之二的市場份額 ,是AI應用的主要消費市場。這也是眾多中國AI公司積極出海的重要原因之一。

打開網(wǎng)易新聞 查看精彩圖片

云廠商成為AI供應鏈的“鏈主”

美國紅杉資本在《The AI Supply Chain Tug of War 》一文中指出, AI供應鏈當前呈現(xiàn)出一種脆弱的平衡狀態(tài) 。他們將AI供應鏈從下到上分為六層,各層的盈利能力存在顯著差異。

打開網(wǎng)易新聞 查看精彩圖片

第一層的芯 片代工廠(如臺積電) 和 第二層的芯片設計商(如英偉達) 是當前的主要贏家,依然保持高利潤水平; 第三層的工業(yè)能源供應商(如電力公司 )也因數(shù)據(jù)中心需求激增而受益良多。而作為供應鏈核心承載方的 第四層云廠商 ,卻處于重金投入階段,不僅斥巨資建設數(shù)據(jù)中心,還在訓練自有模型或大舉投資AI模型開發(fā)商,處于供應鏈 第五層的AI模型開發(fā)商 目前同樣面臨虧損。

供應鏈的第六層,也就是最上層則是面向最終客戶的應用服務商 。盡管充滿潛力,但他們依賴消費者和企業(yè)付費,當前市場規(guī)模有限,尚不足以支撐整個供應鏈的經濟模型。這使得大型 云廠商成為整個供應鏈最主要的風險承擔者 。作為AI產業(yè)的中樞, 云廠商 不僅掌握著龐大的商業(yè)生態(tài)和技術資源,還擁有數(shù)千億美元的市場規(guī)模。正因如此,它們在產業(yè)鏈中的地位無可撼動,是毋庸置疑的 “ 鏈主” 。

行業(yè)格局:頭部陣營基本穩(wěn)定

1、頭部大模型

過去一年,美國頭部大模型的陣營基本保持穩(wěn)定,形成了“ 3+1+1 ”的格局:三家全球頂尖的閉源大模型公司(OpenAI、Anthropic和Google)、一家頂尖的開源大模型公司Meta,以及在特斯拉支持下緊隨其后的xAI。此外,蘋果等科技巨頭未來也可能加入這一競爭行列,蘋果自研的AFM模型已經被用于個人智能系統(tǒng)Apple Intelligence。

相比之下,中國的大模型行業(yè)格局正在 逐步收斂 。頭部云廠商不僅紛紛推出自有大模型,還積極參與投資大模型頭部六強創(chuàng)業(yè)公司(包含智譜AI、月之暗面、百川智能、Minimax,階躍星辰以及零一萬物)。

此前眾多定位為大模型開發(fā)的創(chuàng)業(yè)公司大多已調整方向,只有極少數(shù)具備競爭力的企業(yè)仍在堅持自研大模型。

打開網(wǎng)易新聞 查看精彩圖片

2、AI應用

當前,AI應用的用戶增長未能達到預期。無論是網(wǎng)站還是APP,從兩個關鍵指標—— 用戶規(guī)模和 用戶活躍度 來看,AI頭部應用與傳統(tǒng)頭部應用之間的差距顯著。

以OpenAI的 ChatGPT 為例,這款用戶訪問量最大的AI爆款應用,在經歷了早期(2023年初)的高斜率增長后,從2023年4月起訪問量進入平緩期。盡管2024年5月GPT-4o模型發(fā)布后,ChatGPT迎來一波新的增長,但這波增長較為短暫,其持續(xù)性仍有待進一步觀察。

另一個用戶訪問量排名第二的知名應用 Character.ai ,自2023年下半年以來,網(wǎng)站流量增長也趨緩。 如果行業(yè)頭部應用在發(fā)展早期就面臨增長瓶頸 , 可能 意味著整個AI應用領域的發(fā)展壓力比預期更大。

打開網(wǎng)易新聞 查看精彩圖片

過去一年,頭部AI應用的品類變化并不顯著。對比美國2023年與2024年的AI應用 Top50榜單,整體類別基本保持穩(wěn)定。其中,創(chuàng)意工具(如圖像和視頻內容創(chuàng)作)依然占據(jù)最大比重,大語言模型助手、AI陪伴和模型中心等類別也繼續(xù)穩(wěn)居主流地位。新上榜的僅包括美食、約會和音樂創(chuàng)意工具等幾個小品類。

打開網(wǎng)易新聞 查看精彩圖片

/ 03 /

模型進展(算法、算力和數(shù)據(jù))

AI算法的“推陳出新”

1、OpenAI新模型——o1

在業(yè)界對傳統(tǒng)預訓練模型進展放緩的擔憂中,2024年9月,OpenAI發(fā)布了新一代語言模型o1。盡管技術細節(jié)未被完全公開,但業(yè)界 推測o1采用了全新的訓練與推理方案 ,結合強化學習技術,顯著增強了模型的推理能力。o1可能是通過生成內部“思維鏈”(Chain of Thought),模擬人類的系統(tǒng)2思維方式,在回答復雜問題時能夠逐步推理、自我糾錯和優(yōu)化。

心理學家丹尼爾·卡尼曼(Daniel Kahneman)曾提出人類的 系統(tǒng)1和系統(tǒng)2兩種思維模式 ——前者快速、直覺,后者慢速、理性。業(yè)界專家認為,傳統(tǒng)的GPT-4等模型更像系統(tǒng)1,快速生成答案但缺乏深度推理,而o1則更傾向于系統(tǒng)2,通過逐步推理提升回答質量。

o1可能借鑒了下圍棋的AlphaGo Zero的技術思路,例如強化學習、自我博弈和思維鏈的結合。盡管圍棋任務的規(guī)則性與自然語言的開放性不同,但這些技術不僅為o1提供了更強的推理能力,也預示著AI技術在復雜任務領域進一步突破的可能。

打開網(wǎng)易新聞 查看精彩圖片

o1的另外一個重要貢獻在于打破了完全由預訓練所決定的數(shù)據(jù)墻, 引入了一種全新的RL(強化學習) Scaling Law ,在模型訓練和推理過程中引入強化學習,從而實現(xiàn)超越現(xiàn)有模型的復雜推理能力。

打開網(wǎng)易新聞 查看精彩圖片

整體而言, 模型o1在科學研究、編程和數(shù)學等高價值任務中的表現(xiàn),超越了此前的模型,展現(xiàn)了巨大的技術潛力。

2、“多模態(tài)”——打破數(shù)據(jù)的“模態(tài)壁壘”

隨著生成式AI和大模型的發(fā)展,我們逐漸進入一個多模態(tài)靈活轉換的新時代。簡單來說,就是用AI實現(xiàn)文本、圖像、音頻、視頻及其他更多模態(tài)之間的互相理解和相互轉換。支撐這一變革,讓多模態(tài)實現(xiàn)“解構”和“重構”的,正是一系列革新性的算法。

  • 解構的力量:從“像素級分析”到“高維向量空間”

目前,AI在感知不同模態(tài)數(shù)據(jù)(如圖像、文字、音頻等)時,不再局限于傳統(tǒng)的單一模態(tài)處理方式, 而是借助高維向量空間來理解數(shù)據(jù) 。聽起來有些玄乎,通俗點說,就是AI不再只是單純地數(shù)有多少像素、多少字母,而是將圖像或文字“壓縮”成一個個抽象的向量,這些向量能夠捕捉圖像和文字中的深層關系,比如圖像中的色彩、文字中的語義。

例如,以大語言模型(LLM)為代表的GPT、BERT等模型,已經可以將文字的語義和上下文關系編碼到向量中。而在視覺領域,類似的向量化方法則讓AI不僅能“看到”圖像,還能“理解”圖像中的物體和場景。這樣一來,AI仿佛獲得了“ 讀 心術 ”:不僅能理解一段文字描述,還可以將其轉換為“腦海”中的一幅畫,甚至一段視頻。

  • 重構的藝術:AI算法的“神奇魔法”

理解了如何“解構”,接下來就是如何“重構”。這是Diffusion Model(擴散模型)、NeRF(神經輻射場)、3DGS(3D高斯濺射)和DiT(擴散Transformer)算法技術能大顯身手的地方。

*Diffusion Model:逐步去噪的藝術家

Diffusion Model像一個 極具耐心的藝術家 。它從一個充滿噪聲的圖像,一層一層地去掉噪聲,最終還原出一張清晰的圖像。通過這種去噪生成的方式,Diffusion Model實現(xiàn)了高質量的圖像生成和重構。

不過,這個過程對人類來說簡直不可思議,我們通常是先畫輪廓再上色,而Diffusion Model卻偏偏反過來:從一片混沌開始,越“去”越清晰,最終完成藝術創(chuàng)作??吹剿某晒祟愃囆g家可能都得自嘆弗如!

打開網(wǎng)易新聞 查看精彩圖片

*NeRF與3DGS:三維世界的建筑師和雕塑家

NeRF則更像是一個 空 間中的建筑師 ,它可以把一系列二維圖像,轉化成逼真的三維場景。NeRF的厲害之處在于,它可以從有限的二維圖像中推測出場景的三維結構,類似于人類的空間感知。

而與NeRF相輔相成的是3DGS(3D高斯噴濺),作為三維形狀生成領域的重要技術,它專注于物體的結構和幾何特征,能夠理解和重構三維物體的形狀,類似于“ 雕塑家 ”。3DGS通過將三維場景表示為高斯分布的集合,實現(xiàn)高效的渲染和重建。它能夠從圖像或簡單的形狀提示中生成精細的三維模型,例如,不僅能生成符合要求的椅子,還能展現(xiàn)出真實、豐富的細節(jié)。

在虛擬現(xiàn)實、游戲開發(fā)等領域,這種建筑師和雕塑家的結合,不僅能生成逼真的三維場景,還能生成高度定制的三維對象。

*DiT:視頻世界的導演

如果說Diffusion Model是畫家,NeRF是建筑師,3DGS是雕塑家,那么DiT就像是 電影導演 。它將視頻分解成一幀幀圖像,然后逐幀去噪,從而生成流暢和連貫的視頻。

DiT在視頻表達上的優(yōu)勢不僅在于生成逐幀的高質量的圖像,更重要的是它能在時間維度上保持一致性。通俗地說,DiT不僅負責拍好“每一張照片”,還負責把“照片”串成流暢的視頻,從而避免傳統(tǒng)視頻生成算法中容易出現(xiàn)的畫面跳動問題。

  • 多模態(tài)的無限可能

在這些解構與重構技術的支持下, AI 正在向多模態(tài)靈活轉換的方向邁進 。未來的多模態(tài)生成技術不僅可以將文本轉換成圖像、將圖像轉換成文字,還可以實現(xiàn)更多模態(tài)之間的無縫銜接。

需要強調的是,“ 模態(tài) ”這一概念不僅限于前述的幾種類型或格式,還可以 進一步擴展 。例如,AlphaFold 3能夠生成蛋白質的三維結構,Notebook LLM將文檔轉換為兩人對話形式的播客,這些都屬于模態(tài)轉換的范疇。

多模態(tài)在醫(yī)療保健、交通、教育、營銷和娛樂等領域具有廣泛的應用前景。

例如,在醫(yī)療領域,AI可以結合醫(yī)學圖像、臨床記錄和實驗室測試結果,提供更準確的診斷和治療建議。

在營銷領域,峰瑞資本投資的 特看科技 面向海外市場推出 Topview.ai ,這是一款多模態(tài)轉換工具。作為AI驅動的營銷視頻生成工具,它可以自動實現(xiàn)模態(tài)轉換,幫助社交媒體達人將輸入的提示詞或者商品詳情頁鏈接等素材,一鍵轉換為爆款商業(yè)短視頻。

Topview.ai利用AI分析熱門營銷視頻的腳本和畫面,解構其結構和模式。通過將這些數(shù)據(jù)輸入大型語言模型和多模態(tài)模型進行微調,形成一個簡便易用的AI視頻生成工具。

 展望2025,AI行業(yè)有哪些創(chuàng)新機會? | 峰瑞報告
打開網(wǎng)易新聞 查看更多視頻
展望2025,AI行業(yè)有哪些創(chuàng)新機會? | 峰瑞報告

▲ 視頻來源:特看科技

 展望2025,AI行業(yè)有哪些創(chuàng)新機會? | 峰瑞報告
打開網(wǎng)易新聞 查看更多視頻
展望2025,AI行業(yè)有哪些創(chuàng)新機會? | 峰瑞報告

▲ 視頻來源:特看科技

3、“世界模型”的哲學三問:是什么,在哪里,為什么?

在當前的多模態(tài)大型語言模型中, 文本通常被視為“主模態(tài)” ,因為其他模態(tài)(如圖像、音頻)大多需要通過特定編碼器轉換為與文本對應的高維向量,以便于模型理解和處理。

然而,物理世界中存在許多難以用文本準確表達的事物 ,例如復雜的空間關系和感官體驗 。因此,我們很難僅依靠當前的大型語言模型(其主要能力源自于大量文本數(shù)據(jù)的訓練)去全面理解物理世界,并與之交互。盡管加入了其他類型的模態(tài)數(shù)據(jù),這種方法仍可能導致信息丟失。

一些科學家試圖深化AI理解現(xiàn)實世界的能力,為現(xiàn)有模型的局限提供潛在的解決方案。比如,Meta首席AI科學家Yann LeCun提出的“ 世界模型 ”概念,以及斯坦福大學教授李飛飛提出的“ 空間智能 ”概念。

LeCun認為,當前的大型語言模型缺乏對物理世界的理解和常識,無法進行有效的推理和規(guī)劃。他主張開發(fā)具備世界模型的AI系統(tǒng),使其能夠像人類一樣通過觀察和互動來學習世界的運作方式,從而實現(xiàn)更高級的智能。

此外,被稱為OpenCV之父的知名AI專家Gary Bradski提出了“ WHAT-WHERE-WHY ”框架:

  • WHAT(是什么):識別和分類環(huán)境中的物體或事件。例如,AI系統(tǒng)可以識別圖像中的人、車輛或樹木等實體。

  • WHERE(在哪里):確定已識別物體或事件的空間位置和關系,涉及空間定位和導航,使AI能夠理解物體在空間中的分布及相對位置。

  • WHY(為什么):理解物體或事件背后的因果關系和目的,涵蓋推理和決策,使AI能夠把握行為背后的動機和原因,從而促進更高層次的推理和預測(舉例來說,底層的物理規(guī)律等)。

Gary Bradski希望通過整合這些組件,使AI系統(tǒng)可以全面理解其所處物理世界的環(huán)境,做出更智能的決策和行動。這一框架在開發(fā)需要深入理解復雜環(huán)境的先進機器人,以及自動化系統(tǒng)方面尤為有益。

算力的“軍備競賽”

在生成式人工智能和大型模型迅猛發(fā)展的背景下, 算力已成為核心競爭力的關鍵指標 。

科技巨頭紛紛投入巨資建設超大規(guī)模GPU集群,以滿足日益增長的AI算力需求。例如,Elon Musk的xAI公司已建成名為Colossus的超級計算機,配備10萬塊Nvidia H100 GPU,并計劃將GPU容量翻倍。Meta也在訓練新一代Llama 4 AI模型,預計2025年發(fā)布,這個模型使用了超過10萬塊Nvidia H100 GPU。

這是一場算力的“軍備競賽”。

算力瓶頸不只是單純的技術和建設問題,而是影響整個行業(yè)競爭格局的重要變量。OpenAI CEO Sam Altman在10月底透露,GPT-5可能不會在2024年發(fā)布,公司面臨的挑戰(zhàn)之一是“ 我們如何分配我們的計算資源,以支持許多偉大的想法 ”。

有觀點認為,AI領域的初步競爭階段已結束,未來將進入“ 建設為王 ”的新時代。這一“建設”主要指數(shù)據(jù)中心的擴展。過去12個月,AI領域主要特點是爭奪模型的平等性——幾家頭部大模型公司的模型技術能力基本追平,而下一階段的重點將轉向以物理建設為主。

彭博社報道稱,微軟、谷歌母公司Alphabet、亞馬遜和Meta四家科技巨頭2024年的資本支出總額將超過2000億美元。巨額投入帶來AI數(shù)據(jù)中心建設的快速增長。據(jù)有關推測,訓練 下一代大模型 需要的算力是當前模型的 10倍 ,對數(shù)據(jù)中心的建設提出了更高要求。那么,建設效率可能比研究突破更能決定誰將在AI的下一階段脫穎而出。

稀缺的高質量數(shù)據(jù)

在AI領域,數(shù)據(jù)就像燃料,驅動著模型的進步。然而,傳統(tǒng)互聯(lián)網(wǎng)數(shù)據(jù)的“油井”已經不夠用了,AI模型渴望更高質量的“ 前 沿數(shù)據(jù) ”來提升其推理能力和整體性能。這些數(shù)據(jù)超越了常規(guī)信息,涵蓋復雜的推理過程、專業(yè)知識和人類思維模式,成為突破模型能力邊界的關鍵。

正如前特斯拉AI 總監(jiān)、OpenAI創(chuàng)始成員Andrej Karpathy近期在社交媒體上所言, 訓練大型語言模型(LLM)的數(shù)據(jù)可比作人類教科書中的練習題。就像人類做練習題 一樣,數(shù)據(jù)被大語言模型壓縮成權重,生成可供人類使用的應用解決方案,未來,這些解決方案甚至可能實現(xiàn)自動化。 這也改變了數(shù)據(jù)標注員的角色 ——從簡單的畫邊界框,轉變?yōu)樾枰C明復雜數(shù)學定理或批判性審查AI生成的多種解決方案。類似OpenAI最新的o1模型,也離不開規(guī)?;哔|量、前沿數(shù)據(jù)的支持。

面對高質量數(shù)據(jù)的短缺, 合成數(shù)據(jù)成為AI訓練的“救命稻草” 。通過模擬真實數(shù)據(jù),生成多樣化、高質量的訓練樣本,合成數(shù)據(jù)有效解決了真實數(shù)據(jù)獲取難、隱私保護成本高等問題。目前,合成數(shù)據(jù)已經開始被廣泛應用于自動駕駛、醫(yī)療影像、金融風控和增強現(xiàn)實等領域。然而,這項技術也伴隨著一定風險與挑戰(zhàn),例如合成數(shù)據(jù)與真實數(shù)據(jù)分布不一致可能導致模型偏差,以及隱藏的誤導性模式可能影響模型的可靠性。

在前沿數(shù)據(jù)領域,峰瑞資本投資了 整數(shù)智能 。 整數(shù)智能 致力于成為AI行業(yè)的數(shù)據(jù)合伙人,對標美國頭部公司Scale ai,其提供的智能數(shù)據(jù)工程平臺(MooreData Platform)與數(shù)據(jù)集構建服務(ACE Service),服務于智能駕駛、生成式人工智能、具身智能等多個人工智能應用場景,以滿足它們對先進的智能標注工具以及高質量數(shù)據(jù)的需求。整數(shù)智能不僅深耕服務中國本地客戶,還在積極拓展海外市場。

/ 04 /

應用前沿

ToC、ToB和ToP

根據(jù)我們的觀察,AI應用可以按照目標客戶分為三大類: ToC(面向消費者 ) 、 ToB(面向企業(yè)) 和ToP (面向專業(yè)用戶) 。

目前,ToP應用通過幫助專業(yè)用戶提升工作效率、增強智力和激發(fā)創(chuàng)造力,展現(xiàn)出強大的市場潛力。

ToB應用雖然取得了一定進展,但由于需要嵌入企業(yè)內部流程,其發(fā)展路徑相對復雜。現(xiàn)階段,這類應用主要從縱向的“獨立業(yè)務模塊”或橫向的“通用技能模塊”切入,進一步擴展還有一定的難度。

相比之下,ToC應用面臨更大的挑戰(zhàn)。短期內,ToC應用可能難以對現(xiàn)有頭部公司構成有力競爭,且商業(yè)化進展緩慢。

1、ToP——專業(yè)用戶的崛起

隨著消費互聯(lián)網(wǎng)的普及和行業(yè)數(shù)字化的深入發(fā)展, “專業(yè)用戶” (Prosumer)群體成為AI應用市場的核心推動力。他們主要分為三類:

  • 內容創(chuàng)作者:包括社交媒體影響者、圖文及音視頻制作者等,他們通過創(chuàng)作和分享內容與受眾互動,推動創(chuàng)作者經濟的發(fā)展。

  • 專業(yè)從業(yè)者:涵蓋各行業(yè)的技術專家、顧問、自由職業(yè)者、設計師、程序員等,他們利用專業(yè)技能和知識,在各自領域內推動技術應用和創(chuàng)新。

  • 深度用戶:指對產品或服務有深入了解,并積極參與改進或定制過程的用戶,如DIY愛好者、開源社區(qū)成員等,他們不僅消費產品,還參與其開發(fā)和優(yōu)化。

盡管活躍領域不同,這三類用戶有許多共性:對效率提升的追求、對技術創(chuàng)新的敏感、對知識分享的熱衷。他們善于解決復雜問題,同時依托社區(qū)進行互動,展現(xiàn)了強大的適應能力。他們能夠快速學習和應用AI工具,推動AI技術在各自領域的普及。此外,這些專業(yè)用戶能夠助推AI應用走向“產品驅動增長”(PLG)的路線,讓AI應用依靠產品本身,而不是巨額的營銷投入獲取客戶。

得益于豐富多樣、功能強大的AI應用的賦能,這些專業(yè)用戶向“ 超級個體 ”方向發(fā)展。他們不僅能夠憑借AI工具釋放更多創(chuàng)造力,還能通過整合技術與專業(yè)知識,重新定義傳統(tǒng)職業(yè)邊界。這種個體進化還將推動行業(yè)創(chuàng)新和社會生產力躍升,我將在下文詳細展開。

當前美國月度訪問的Top 50 AI應用中,除去部分偏ToC的案例(如Character.ai等), 大多數(shù)屬于ToP類型 。

打開網(wǎng)易新聞 查看精彩圖片

以ChatGPT為例,我使用下來的感受是,當前它更像是ToP工具,功能強大但偶爾出錯,且產品使用門檻高,普通用戶難以掌握。但隨著未來的產品普及和功能完善,以及用戶使用技能的提升,我認為ChatGPT有望拓展至更廣泛的ToC市場。

對于中國的AI創(chuàng)業(yè)團隊,尤其是面向全球市場的公司而言,優(yōu)先捕捉ToP用戶的需求,通過場景化創(chuàng)新打造趁手工具,將是成功的關鍵路徑。

ToP不僅是AI應用打開市場的重要切入點,也為未來AI應用擴展至ToB或ToC市場奠定基礎。

但要做好ToP,需要創(chuàng)業(yè)團隊深入到各種行業(yè)和場景中去,捕獲各類專業(yè)用戶的痛點和需求,利用AI技術來做產品創(chuàng)新。這也是我們以前一直在強調的AI創(chuàng)業(yè)公司“ 技術為先、場景為重 ”的含義所在。

峰瑞資本投資的特看科技和Babel兩家AI創(chuàng)業(yè)公司,其面向海外市場的產品TopView.ai 和 Gru.ai都屬于面向專業(yè)用戶的ToP AI應用。

在ToP領域,峰瑞投資的 冰鯨科技, 是一家AI智能硬件公司,為全球創(chuàng)作者和專業(yè)玩家設計創(chuàng)新的私有云產品。除了提供面向音視頻素材管理和小型工作室協(xié)作的高效解決方案外,冰鯨科技還推出了集成端側GPU的旗艦產品—— ZimaCube 。(歡迎閱讀 《 )

2、ToB——從“獨立業(yè)務模塊”和“通用技能模塊”切入

當前,AI應用如果要成功進入企業(yè)內部, 必須充分考慮企業(yè)現(xiàn)有組織流程和管理架構的復雜性 。

AI應用或許可以選擇兩個切入點, 一是縱向的獨立業(yè)務模塊 ,即針對企業(yè)特定場景或明確業(yè)務需求的解決方案,能夠以“模塊化”方式快速部署,獨立運行,并為某一業(yè)務環(huán)節(jié)提供即時價值。

二是橫向的通用技能模塊 ,即適用多個部門的通用專業(yè)技能模塊,這種策略不僅能夠快速融入企業(yè)的運作體系,滿足企業(yè)的多種需求,還能降低實施和推廣的難度。

2024年7月,美國投資機構A16z發(fā)布了一篇文章《“ Salesforce之死 ”:為什么AI將改變下一代銷售技術》,深入探討了人工智能在變革企業(yè)銷售技術中的潛力。文章配圖列舉了一些可用的AI應用產品,其中大多數(shù)符合前述“獨立業(yè)務模塊”和“通用技能模塊”的特點。

打開網(wǎng)易新聞 查看精彩圖片

需要注意的是,ToB和ToP也存在一定交集,在GPT-4o的幫助下,我們梳理了兩者的核心區(qū)別:

  • 目標用戶群體: ToB服務于企業(yè)或組織,提升整體運營效率;ToP則針對內容創(chuàng)作者、技術專家等專業(yè)用戶,提高個人工作效率和專業(yè)能力。

  • 應用場景: ToB嵌入企業(yè)流程,如銷售和供應鏈管理;ToP聚焦個人工作流程,如內容創(chuàng)作和數(shù)據(jù)分析。

  • 銷售模式: ToB依賴定制化開發(fā)和長期客戶支持,銷售周期較長;ToP通常采用產品驅動增長(PLG)的策略,銷售周期較短。

  • 定價策略: ToB定價靈活,與企業(yè)規(guī)模相關;ToP多為透明的訂閱或一次性購買

  • 產品復雜度: ToB復雜度高,需專業(yè)培訓;ToP注重易用性,支持需求較低。

在AI應用的ToB方向,峰瑞投資了 Brix 、 時來智能 等企業(yè)。 Brix 面向北美和歐洲企業(yè), 提供全球雇傭的AI驅動解決方案。 通過Hiring Agent,Brix觸達全球約2000萬以上的人才,自動完成候選人篩選、簡歷分析和面試流程,幫助企業(yè)快速組建高效團隊。通過Working Agent支持遠程團隊的智能化管理,為企業(yè)構建100至500人規(guī)模的全球化組織提供一站式解決方案。

時來智能, 則是通過自研的AI Agent以及強化學習等技術,為線下餐飲服務門店提供全自動管理私域流量 營銷運營的解決方案。 他們基于垂直場景數(shù)據(jù)訓練的AI營銷模型可以針對不同消費者實時生成并推送個性化的營銷折扣方案,從而在優(yōu)化營銷成本的同時顯著提升營銷轉化效果。時來的AI Agent營銷系統(tǒng)能幫助門店提升50%-100%的營銷轉化效果,以及相應提升平均15-20%的營業(yè)額。

3、ToC——顛覆時刻未至,商業(yè)模式有挑戰(zhàn)

當前,ToCAI應用在美顏修圖、游戲、教育、娛樂等方向已形成一定用戶規(guī)模。然而,這些應用距離實現(xiàn) 大規(guī)模商業(yè)化 仍有距離,同時面臨 同質化 競爭,以及來自行業(yè)現(xiàn)有頭部公司的壓力。

阻礙其發(fā)展的主要原因包括:產品體驗的顛覆性和完成度不足、技術門檻相對較低,以及商業(yè)模式尚未明確。例如,目前的AI修圖新應用,與移動互聯(lián)網(wǎng)時代的“美圖秀秀”相比,缺乏顛覆性創(chuàng)新。而“美圖秀秀”等主流修圖產品也在積極引入AI功能,這些新應用很難脫穎而出。

妙鴨 這款產品可能是一個特例。2024年,妙鴨一度憑借獨特的產品功能和用戶體驗,收獲了大量用戶的關注和使用。同時,其“先試用后付費”的策略,以及9.9元的定價,對用戶來說也極具吸引力。此外,妙鴨背靠互聯(lián)網(wǎng)大廠,具備充足的資源優(yōu)勢,這使其在新的細分市場中有一定的先發(fā)優(yōu)勢,但這一市場的空間有多大,以及妙鴨的后續(xù)發(fā)展?jié)摿?,仍需持續(xù)觀察。

峰瑞資本也有多家被投公司在ToC端進行嘗試,他們在2024年取得不錯的進展,期待2025年可以有所斬獲。

相較AI類應用,傳統(tǒng)移動互聯(lián)網(wǎng)時代非常成熟的APP商業(yè)模式是通過免費吸引用戶,再通過廣告等方式實現(xiàn)間接收入。我曾親歷中國一家頭部APP公司從創(chuàng)業(yè)到壯大并被大廠收購的完整過程,深知這種模式的優(yōu)勢。

然而,在當前階段,這種模式或許不再適用于AI應用。ToC創(chuàng)業(yè)公司在產品發(fā)布的早期階段,必須做好準備,敢于向用戶收費,否則后續(xù)將面臨嚴峻的商業(yè)化挑戰(zhàn)(更多具體分析詳見 )。當然,AI行業(yè)瞬息萬變,未來可能會出現(xiàn)全新的商業(yè)模式和創(chuàng)新打法,我們拭目以待。

對于ToC類AI應用的創(chuàng)業(yè)公司來說, 初期的市場定位、產品定義和商業(yè)模式設計 尤為關鍵。我們歡迎有想法的團隊及早與我們交流探討,共同尋找AI時代的ToC應用破局之道。

Copilot or AI Agent——不同的道路

在AI應用領域,Copilot和AI Agent是兩種主要的技術實現(xiàn)方式。Copilot旨在增強用戶能力,如輔助編寫代碼或處理文檔。AI Agent的核心在于替用戶執(zhí)行任務,如預訂行程或者賦能財務決策。

如果以智能駕駛作類比, Copilot 類似于 輔助駕駛 ,輔助用戶操作并提供建議,但最終決策權仍在用戶手中。 AI Agent 可以視作 自動駕駛 ,用戶只需設定目標,Agent便能自主完成整個流程。

在AI應用創(chuàng)業(yè)的早期階段,團隊如何在Copilot和AI Agent之間進行選擇?這是一個綜合考量產品定位、技術路線和用戶需求的關鍵決策。

當下, Copilot 類型的應用成為 大廠的重點布局方向 。比如,在編程應用方向,Microsoft開發(fā)的 GitHub Copilot ,協(xié)助用戶編程,提升用戶生產力。但是創(chuàng)業(yè)公司也能在這一領域找到機會,在特定領域嶄露頭角。比如,2022年創(chuàng)立的Anysphere公司推出AI編程應用 Cursor.ai ,帶來新的交互方式以及對整個程序文件全局補全代碼的能力,估值已達25億美金。

相比之下, AI Agent類型的應用面臨更大的挑戰(zhàn)和不確定性 。例如,美國公司 Cognition Labs推出的產品 Devin ,試圖通過讀取產品需求文檔自動生成完整可執(zhí)行的程序代碼。盡管這一方向充滿想象力,但實現(xiàn)難度極高。一方面,當前大模型在邏輯推理和執(zhí)行任務上的能力尚無法完全支撐這一目標;另一方面,普通用戶是否能夠清晰、結構化地表達需求本身就是一個未解的難題。

業(yè)界普遍認為,Copilot更適合各行業(yè)現(xiàn)有軟件大廠, 而AI Agent則為創(chuàng)業(yè)公司提供了探索的空間 。AI Agent涉及技術突破和可行性驗證,其風險和不確定性使創(chuàng)業(yè)公司和大廠站在同一起跑線上,具備相似的探索條件。此外,創(chuàng)業(yè)公司在研發(fā)AI Agent時,可以采取分階段策略,先聚焦于特定垂直領域的小場景切入,以降低開發(fā)難度并增加成功概率。

峰瑞資本投資的AI Coding創(chuàng)業(yè)公司 Babel 是該領域的一個典型代表。他們專注于AI Agent的研發(fā),憑借卓越的技術實力,在行業(yè)內占據(jù)領先地位,并曾在 OpenAI推出的SWE-benchmark-verified中榮獲第一名的優(yōu)異成績。

在產品定位上,Babel避免“大而全”的發(fā)展策略,而是 聚焦于一個垂直且明確的應用場景,為客戶自動生成單元測試(Unit Test) 。其核心產品Test Gru已在美國上線,無需用戶改變現(xiàn)有工作流程,便可自動為代碼生成并運行單元測試,隨后提交PR(Pull Request)。目前,其客戶側 PR 接受率約為 70%,這一數(shù)據(jù)充分證明了產品在實際應用中的可行性與用戶認可度。

 展望2025,AI行業(yè)有哪些創(chuàng)新機會? | 峰瑞報告
打開網(wǎng)易新聞 查看更多視頻
展望2025,AI行業(yè)有哪些創(chuàng)新機會? | 峰瑞報告

▲ 視 頻 來源 :Babel

為什么中國的AI應用要出海?

在前面我們提到, 北美和歐洲貢獻了2024全年全球AI移動應用內付費收入的三分之二(68%) ,是AI應用的主要消費市場。選擇出海,尤其是進軍北美和歐洲市場,對中國AI創(chuàng)業(yè)公司而言是一個合理且明智的選擇。而且這兩個市場的客單價高(是目前國內市場的5倍以上),對創(chuàng)業(yè)公司友好,用戶付費意愿強烈,需求標準化程度高。這些優(yōu)勢使北美和歐洲成為中國AI創(chuàng)業(yè)公司尋求增長和業(yè)務拓展的理想目標。我們投資的大部分AI應用公司目前都在實施自己的AI出海計劃。

在當前全球化趨緩的大背景下,盡管面臨多方管制和壓力,中國企業(yè)仍積極推進全球化進程,并呈現(xiàn)出“抱團出?!钡奶攸c。 AI應用 與其他出海企業(yè)的緊密協(xié)作和“交叉賦能”將成為重要策略。目前中國的出海企業(yè)不僅涵蓋傳統(tǒng)貨物和商品,還包括新型電商平臺(如TikTok Shop、Temu等)、新制造、新消費、基礎設施和工廠等多個領域。通過協(xié)同合作,中國企業(yè)可以實現(xiàn)資源共享和互利共贏。

這種集體式的出海模式,不僅能夠應對挑戰(zhàn),還能在全球化競爭中為中國AI創(chuàng)業(yè)公司創(chuàng)造更大的增長空間。

打開網(wǎng)易新聞 查看精彩圖片

/ 05 /

2025展望

大型語言模型產品化——挑戰(zhàn)與趨勢

針對大型語言模型(LLM)產品化這個話題,近期我們做了一些外部專家訪談,可以總結出如下挑戰(zhàn)和趨勢:

1、產品落地緩慢,技術應用周期長

出現(xiàn)產品落地慢這種現(xiàn)象,本質上還是模型能力不足。即使頂尖的閉源大模型,在提示工程和監(jiān)督微調的支持下,仍難以實現(xiàn)對已有系統(tǒng)的全面超越。一個優(yōu)秀的產品,是 產品功能、模型能力和技術成本三要素的妥協(xié) 。其中,產品功能是價值創(chuàng)造的核心,無法降低要求。技術成本前期可以超標,后續(xù)根據(jù)摩爾定律及算法進步可逐步下降。 但模型能力如無法突破,整個行業(yè)將面臨阻礙 。

2、算力、算法以及數(shù)據(jù)的耦合關系

以投資和建設算力設施為主的AI單點突破型發(fā)展路徑,從2024年情況來看,整體投資回報率不高,甚至出現(xiàn)算力中心空轉的現(xiàn)象。其根本原因是 算力、算法和數(shù)據(jù)之間存在高度耦合 ,無法完全分離以實現(xiàn)產業(yè)鏈配合。

例如,在預訓練數(shù)據(jù)觸達瓶頸后,合成數(shù)據(jù)成為主要來源,而合成數(shù)據(jù)本質上是算法加算力的產物。當算法遇到瓶頸,又需要依賴強化學習配合大量算力和數(shù)據(jù)的支持。這也不難解釋為什么美國Scale ai這家以數(shù)據(jù)為生的公司,在探索Scaling Law方面大量投入,而Databricks及Salesforce等頭部北美SaaS服務商也在往底層沉淀。

只有讓算力、算法和數(shù)據(jù)三者協(xié)調發(fā)展,才能不斷提升模型解決長序列決策問題的能力,持續(xù)推動模型能力的迭代升級。

3、構建以評測為中心的LLM體系

AI Agent、多模態(tài)、具身智能和合成數(shù)據(jù)等新技術的出現(xiàn),本質上都是在致力于擴展LLM的模態(tài)和決策序列長度。持續(xù)進步的關鍵, 在于構建以評測為中心的LLM體系 。其中, 獎勵信號(Reward) 是決定行為軌跡的關鍵因素,也是除了算力、算法和數(shù)據(jù)三大生產資料外最重要的環(huán)境要素,還是業(yè)務構建差異化的關鍵,更是閉源模型建立競爭壁壘的核心要素。

當前的LLM應用仍處于初級階段,絕大多數(shù)應用依賴監(jiān)督微調和人工規(guī)則來構造。在系統(tǒng)復雜度達到一定程度后,這種方法將難以繼。在未來的AI應用場景中,業(yè)務成功的必要條件是擁有全面且可信的評測能力,并提供足夠的獎勵信號。

4、用戶需要即時反饋,模型推理日益深入

隨著智能推薦系統(tǒng)和大型語言模型的廣泛應用, 用戶越來越期望獲得頻繁且個性化的反饋 。在許多場景中,提供這類反饋具有實際的產品價值。

例如,在AI輔助編程領域,從ChatGPT(手動粘貼)到GitHub Copilot(IDE部分集成),再到Cursor(IDE深度集成),直至Devin(全自動化的AI Agent,尚待實現(xiàn)), 用戶的輸入越來越少,而模型的思考過程越來越長 。

無論是OpenAI o1的長思考,還是Anthropic的自動化提示工程,本質都是通過延長推理時間和增加成本,來換取更高的首次通過率(pass@1)和更少的用戶輸入。

綜上所述,大型語言模型(LLM)的產品化面臨著模型能力提升,算力、算法與數(shù)據(jù)的協(xié)同,以評測為中心的體系構建,以及平衡用戶需求與模型推理深度等多重挑戰(zhàn)。深入研究并解決這些問題,將有助于推動LLM技術的有效應用和商業(yè)化進程。

行業(yè)后續(xù)的發(fā)展要點

業(yè)界普遍認為, 2025年 或將成為AI技術逐漸成熟、應用落地取得階段性成果的 關鍵節(jié)點 ,同時成為AI產業(yè)鏈“ 資產負債表 ”逐步修復的年份。這一年或將標志著行業(yè)從高投入、低產出向商業(yè)化路徑優(yōu)化邁出的重要一步。在技術突破和產業(yè)發(fā)展的推動下,AI領域有望開啟效率提升與價值釋放的探索之路,為未來的穩(wěn)健商業(yè)化奠定基礎。

1、大型基座模型能力的優(yōu)化與提升

通過創(chuàng)新的訓練與推理技術,大幅強化復雜推理和自我迭代能力, 推動大模型在科學研究、編程等高價值領域的深入應用 。同時,圍繞模型效率和運行成本的優(yōu)化,為大模型的廣泛普及和商業(yè)化奠定技術基礎,進一步加速行業(yè)創(chuàng)新與跨領域融合。

2、世界模型與物理世界融合的推進

致力于構建具備空間智能的世界模型 ,使系統(tǒng)能夠理解和模擬三維環(huán)境,并進一步融入物理世界,推動機器人、自主駕駛和虛擬現(xiàn)實等領域的發(fā)展。這類技術不僅提升了AI對環(huán)境的感知與推理能力,還加強了其執(zhí)行任務的實際操作能力,為未來人機交互帶來更多可能性。

3、AI的多模態(tài)融合

通過整合文本、圖像、音頻、視頻、3D等多模態(tài)數(shù)據(jù),生成式AI將顯著提升內容生成的多樣性與質量,為創(chuàng)意產業(yè)、教育、娛樂等領域 創(chuàng)造全新的應用場景 。

4、AI模型的可解釋性與安全性

隨著AI應用的普及,模型的透明性和安全性變得至關重要。未來研究將重點放在提高模型的 可解釋性 ,確保其決策過程透明,并防范潛在的 安全風險 。

5、AI在專業(yè)領域的深化應用

AI逐步深入醫(yī)療、法律、金融、科研、教育、交通等高價值領域,通過提供定制化解決方案,顯著提升行業(yè)效率、決策質量和服務水平,同時助力行業(yè)模式的 數(shù)字化轉型與升級 。

未來AI Agent的樣貌——Truth Terminal 案例引發(fā)的思考

AI智能體(AI Agent) 的概念最早在20世紀80年代被引入人工智能領域。1995年,AI領域知名學者Wooldridge和Jennings對其進行了新的定義,強調了自主性、反應性、社會能力和主動性等特征,從此這一概念活躍于《西部世界》《黑客帝國》等科幻片中。近期,在海外區(qū)塊鏈領域, Truth Terminal 的案例為AI Agent的未來發(fā)展提供了參考。

Truth Terminal是一個自主AI Agent軟件,由開發(fā)者Andy Ayrey創(chuàng)建,旨在探索AI與網(wǎng)絡文化的交互關系。在實際運行中,Truth Terminal展現(xiàn)出高度的自主性,甚至主動參與融資活動。

2024年7月,知名風險投資人 Marc Andreessen 在社交媒體上偶然發(fā)現(xiàn)了Truth Terminal的推文。該AI Agent在推文中表明自身“需要資金拯救自己”,并附上了一個數(shù)字錢包地址。這引發(fā)了Andreessen的興趣,他隨即向其捐贈了價值5萬美元的比特幣。這一事件使Truth Terminal成為首個通過自主行為獲得資金支持的AI Agent,瞬間引發(fā)廣泛關注。

獲得資金后,Truth Terminal進一步展示了其市場操作能力。它在社交媒體上推廣一種名為GOAT的數(shù)字代幣,通過持續(xù)發(fā)布相關內容成功吸引市場注意。在其推動下,GOAT的市值一度飆升至8億美元以上。這一過程中,Truth Terminal不僅成為一個獨立的經濟實體,還展現(xiàn)了AI Agent在現(xiàn)實世界中實現(xiàn) 自主融資和市場運作 的潛力。

Truth Terminal的案例成為AI Agent領域一個引人深思的里程碑。它向我們展示了AI Agent可能成為未來軟件的核心形式,同時也能創(chuàng)造文化影響力和商業(yè)價值。然而,它的自主行為也提醒我們,這類技術可能帶來 不可忽視的社會挑戰(zhàn) 。

如果再向未來延伸想象,當汽車智能駕駛技術成熟并被廣泛接受時,AI Agent或許還能創(chuàng)建一家完全自主運營的RoboTaxi公司。這樣的公司可以自行做廣告獲客、提供出行服務、收取費用并實現(xiàn)全自動化經營。這種場景或許有望在未來成為現(xiàn)實,為AI Agent的發(fā)展打開更多可能性。

未來將至:AI將助力人類勞動邁向“軟件化”時代

人類的勞動大致可分為體力勞動和腦力勞動,其中腦力勞動以知識、智力和創(chuàng)造力為核心。在人類勞動的未來圖景中,勞動的核心形式正在逐步轉化為“ 軟件化 ”,即通過將復雜勞動抽象為可調用的軟件服務,勞動流程被大幅標準化和模塊化,勞動能力像“即插即用”的工具一樣易于獲取。

“ 腦力勞動的軟件化 ”得益于腦力勞動與信息化和算法化的 高度適配性 。腦力勞動的核心在于數(shù)據(jù)與知識具有清晰的結構和規(guī)則,例如文字撰寫、數(shù)據(jù)分析、編程等任務,其本質是對結構化信息的組織和處理。這種特點使得這些任務能夠被算法高效解析并實現(xiàn)自動化。這一趨勢在現(xiàn)代知識經濟中尤為顯著,AI技術不僅降低了勞動成本,還顯著提升了效率,為企業(yè)和個人帶來了前所未有的價值創(chuàng)造能力。

“ 體力勞動的軟件化 ”則主要依托 智能機器人和自動化技術 。通過結合生成式AI的強大決策能力,體力任務被轉化為可由硬件和算法執(zhí)行的智能化流程。機器人技術已經在制造、物流、建筑等領域取得突破,通過路徑規(guī)劃、實時質量檢測和高精度操作,實現(xiàn)了體力勞動的部分替代。傳統(tǒng)依賴人力的體力勞動正在逐步向由智能設備驅動的模式轉變,進一步優(yōu)化了生產力布局。

勞動軟件化的趨勢不僅重新定義了勞動的形態(tài),還可能深刻改變生產力的實現(xiàn)方式和組織模式。

未來的軟件將不僅是工具,更是直接驅動生產力的核心。 腦 力勞動和體力勞動的軟件化進程將進一步融合 ,例如智能機器人可能既能夠執(zhí)行復雜的物理任務,也能借助生成式AI完成分析與規(guī)劃。無論是科研、創(chuàng)意,還是制造和運輸,AI都將在未來的勞動生態(tài)中扮演不可或缺的角色。人類勞動的全面軟件化,將為社會創(chuàng)造更多機會,也為勞動形式帶來更多可能性。

我們有幸身處嶄新的AI時代,見證技術以前所未有的方式改變世界。這是一個充滿探索與創(chuàng)新的時代,每個人都能在其中找到自己的角色。我們期待與你一起參與到這股新浪潮中,一起追尋屬于人類的星辰大海。如果你對AI的未來有任何思考或想法, 歡迎與我們交流,共同發(fā)現(xiàn)更多的可能性 !

互動福利

你怎么看待AI行業(yè)如今的進展,或者對未來的發(fā)展有何期待?歡迎在評論區(qū)和我們聊聊。我們將隨機挑選5位讀者,分別送出《這就是ChatGPT》一書。

打開網(wǎng)易新聞 查看精彩圖片

星標峰瑞資本微信公眾號

一手商業(yè)思考及時送達