陳慶春/文

在Scaling Law(規(guī)模與性能的冪律增長規(guī)律)若隱若現(xiàn)、似要消失,大模型越來越難找到代際感的今天,中國獨有的規(guī)模優(yōu)勢或許將在人工智能領(lǐng)域“涌現(xiàn)”。

有人正努力讓人工智能更像人:2024年世界人工智能大會(WAIC),爆發(fā)式展示了25款人形機(jī)器人,且都被冠以“具身智能”的身份,也就是機(jī)器人的身子被AGI(通用人工智能)技術(shù)賦予了智慧的大腦。

有人努力讓AI落入現(xiàn)實: 支付寶推出智能助理,問一問就能獲得訂票、問診、查旅行攻略等超8000項數(shù)字生活服務(wù); 擁有7億用戶、1100萬應(yīng)用的釘釘也已經(jīng)跑出來了50萬個AI助理; 聯(lián)想則推出了內(nèi)嵌智能體、能與用戶自然交互的AI PC。

百度CEO李彥宏所言“不要卷大模型,要卷應(yīng)用”在網(wǎng)上被熱傳,螞蟻集團(tuán)董事長兼CEO井賢棟則說:“在人工智能時代,我們在探索,讓AI像掃碼支付一樣便利每個人的生活?!?/p>

在AIGC(生成式人工智能)大模型技術(shù)苦苦尋找應(yīng)用場景時,中國擁有超大規(guī)模用戶的平臺紛紛下場了?;蛟S還稍顯緩慢,但平臺的集體出手與探索,讓我們有理由期待中國人工智能被動跟隨的局面能被改寫,特別是在連接個體生活應(yīng)用的端側(cè),或?qū)⑾破鹑斯ぶ悄馨l(fā)展的第三波浪潮。

第三波浪潮

大模型即將接管生活

Scaling Law是被人工智能領(lǐng)域普遍接受的冪律增長,即:語言模型的性能隨著模型大小、數(shù)據(jù)集規(guī)模和訓(xùn)練計算量呈現(xiàn)冪律關(guān)系。這意味著在一定范圍內(nèi),增大模型規(guī)模和數(shù)據(jù)集規(guī)模,能夠顯著提升模型性能。也就是業(yè)內(nèi)常說的:模型越大,性能越好。

但最近半年來,Scaling Law明顯放緩,OpenAI也不得不承認(rèn),GPT5.0版本要等到明年才能推出。而造成這一現(xiàn)象的根本原因在于,全球普遍出現(xiàn)了算力和數(shù)據(jù)的供給短缺,特別是數(shù)據(jù)規(guī)模量陷入了極大的瓶頸。機(jī)器吃不飽,就導(dǎo)致了大模型的性能輸出側(cè)無法完成高質(zhì)量輸出。

在這種情況下,大模型就一直無法解決機(jī)器幻覺、高錯誤率的問題。MiniMax創(chuàng)始人、首席執(zhí)行官閆俊杰認(rèn)為,GPT 4存在30%~40%的錯誤率,國內(nèi)大模型整體上也存在60%~70%的錯誤率,要想讓AI從一個輔助人類的工具到能獨立完成工作,為社會創(chuàng)造更大的價值,最核心的一點是整體降低大模型的錯誤率。

大模型技術(shù)的發(fā)展似乎陷入了一個惡性循環(huán)的怪圈,大模型的性能提升需要大量使用后的數(shù)據(jù)投喂,但大模型的錯誤率又讓人們不敢大規(guī)模使用。如何破局?

業(yè)內(nèi)還發(fā)現(xiàn)一個現(xiàn)象,將大模型縮小規(guī)模至特定的專業(yè)領(lǐng)域,Scaling Law依然在發(fā)揮價值,向?qū)I(yè)大模型投喂專業(yè)知識庫,模型依舊呈現(xiàn)能力的巨大提升。比如多模態(tài)領(lǐng)域近一年來進(jìn)展便神速,在今年WAIC現(xiàn)場,商湯展示了可控人物視頻生成大模型Vimi,可將靜態(tài)圖片生成1分鐘唯美視頻;支付寶也發(fā)布了多模態(tài)醫(yī)療大模型,并將與20家機(jī)構(gòu)聯(lián)合發(fā)起AI醫(yī)療共建計劃。

Vimi 使用情深深雨濛濛視頻片段作為控制生成的長視頻

到今天為止,大模型并不是越大越好,也不是只有將性能力發(fā)展到驚艷才能使用。如果縮小規(guī)模,放至特定的場景使用,也可以實現(xiàn)數(shù)據(jù)規(guī)模與性能提升的良性循環(huán)。

回顧大模型的發(fā)展不過兩年時間,已掀起了三次浪潮,且越來越鎖定特定場景。

第一波浪潮,是OpenAI訓(xùn)練的大語言模型的橫空出世,帶給人類的震撼是,機(jī)器可以跟人用自然語言對話,擁有人的邏輯思考、推理、總結(jié)、規(guī)劃以及多模態(tài)生成能力,中國廠商隨后全面跟進(jìn),也生長出多個大語言模型創(chuàng)業(yè)公司。這一波的應(yīng)用以聊天對話框的方式出現(xiàn),如國外的ChatGPT,國內(nèi)的文心一言、騰訊元寶、通義、豆包、Kimi等。

第二波浪潮,微軟、谷歌基于大語言模型做系統(tǒng)重構(gòu),發(fā)起生產(chǎn)力工具端的變革,如微軟在Windows、Azure系統(tǒng)中全面應(yīng)用Copilot智能體調(diào)用大模型能力,以及對PC這一生產(chǎn)力工具的系統(tǒng)級改造。谷歌則用來全面改造搜索工具。中國企業(yè)百度也在第一時間用自研大模型重構(gòu)了所有業(yè)務(wù),之后釘釘用AI助理連接了B端企業(yè)場景應(yīng)用,發(fā)起了更廣泛的智能化場景改造。這波浪潮最大的特點是聚焦工作場景的智能提效。

第三波浪潮,開始觸及普通人的生活,最先讓人感到變化的是蘋果。蘋果發(fā)布的蘋果智能(Apple Intelligence),從技術(shù)上看并無驚艷之處,但它帶來的沖擊在于連接了個體生活。比如你可以讓Siri給你出個菜單,制定機(jī)場接人的最佳路線和時間,找到上周與朋友一起烤肉的照片,設(shè)計一下自己的花園,等等。

緊隨其后,華為發(fā)布了“鴻蒙原生智能”( Harmony Intelligence ),應(yīng)用路徑與蘋果異曲同工。小藝智能體就類似Siri,成為個體生活中的助理,比如小藝把攝像頭看到的世界讀出來,幫助視障用戶,“看清”身邊的世界。

蘋果與華為,在與人生活最緊密的端側(cè),打開了大模型在生活應(yīng)用中的巨大想象力。但遺憾的是,這些設(shè)計想要真正落地還得等到明年了。

在生活應(yīng)用端,還有一個超級App正悄悄發(fā)力。支付寶今年4月在首頁設(shè)置了下拉入口,只要向下一拉,“智能助理”就能被喚出。這個“智能助理”類似于Siri,在融入支付寶平臺生態(tài)后,就可以通過說話,連接出行、健康、便民服務(wù)、吃喝玩樂、消費管理等支付寶已有的生活服務(wù)。

比如“點單”這個功能,只要對智能助理說一聲“我想點一杯瑞幸的大杯冰拿鐵”,AI便會進(jìn)入小程序自動下單,用戶確認(rèn)并付款后,就能到附近的線下門店取到咖啡。

在特定場景內(nèi)、使用特定的專有知識庫、實現(xiàn)特定的功能,Scaling Law也會繼續(xù)發(fā)揮價值,讓特定場景的智能助理通過數(shù)據(jù)投喂變得越來越聰明。

大模型融入人類生活的想象空間,已然打開,并有理由期待其獲得快速發(fā)展。

人類開啟了AGI大模型技術(shù)的第三波浪潮,但并不意味著第一波浪潮和第二波浪潮的終結(jié),三者并駕齊驅(qū),在未來的發(fā)展過程中,有可能一浪更比一浪高,我們逐浪前行。正如AI與量子計算的相輔相成,互相促進(jìn)。

這意味著,在第一波浪潮中落后的企業(yè),有可能通過逐浪第二波和第三波浪潮,變成領(lǐng)先者。過去我們曾糾結(jié)于中國人工智能落后美國1-2年,現(xiàn)在重新打開了視野。

平臺企業(yè)的機(jī)遇:

重構(gòu)與創(chuàng)新

第一次浪潮掀起的第一波應(yīng)用,許多已走向消亡。

一家名為“DANG!”的網(wǎng)站,收集了大量已經(jīng)死亡的基于大模型開發(fā)的應(yīng)用,大約已有700多家。這張網(wǎng)頁被稱之為“AI Graveyard(AI墓地)”,名單上幾乎全部是創(chuàng)業(yè)公司套殼大模型的應(yīng)用產(chǎn)品,文生圖、文生視頻、代碼優(yōu)化等。

AI墓地的出現(xiàn),說明了兩個問題:

第一,基于大模型自身的性能,單獨做出一個應(yīng)用,還支撐不住,next big thing仍未出現(xiàn);超級App擁有廣泛的典型剛需場景,與大模型結(jié)合或可產(chǎn)生質(zhì)變,而大模型原生應(yīng)用的爆發(fā)點,也許來源于舊技術(shù)未滿足的需求。

第二,大模型因涉及數(shù)據(jù)、算力的規(guī)模性需求,草根創(chuàng)業(yè)難占優(yōu)勢,大模型天生對平臺企業(yè)友好。

平臺企業(yè)擁有規(guī)模用戶和應(yīng)用場景,每天產(chǎn)生大量數(shù)據(jù),也更能支撐大量算力的成本。目前,平臺企業(yè)投資大模型創(chuàng)業(yè)公司時,大多都采用了算力投資的方式,容許創(chuàng)業(yè)公司使用算力資源,從而獲得相應(yīng)的股份。

所以,在第二波和第三波浪潮中,那些錯過第一波浪潮的大企業(yè)更容易贏得反轉(zhuǎn)。微軟并不自建大模型,谷歌的Gemini大模型也落后于ChatGPT,但兩者均已受益于大模型。微軟自不必說,納德拉自稱“一直都與技術(shù)范式的發(fā)展共進(jìn)步”,宣布推出AI PC后其市值創(chuàng)歷史新高。谷歌在大模型的加持下,搜索、云等業(yè)務(wù)均實現(xiàn)了雙位數(shù)增長。

大模型對于大企業(yè)來說,正是一次難得的業(yè)務(wù)重構(gòu)的機(jī)會。釘釘對于AI助理的使用,吸引了大模型創(chuàng)業(yè)公司和機(jī)器人創(chuàng)業(yè)公司等前沿技術(shù)創(chuàng)業(yè)公司的加入,也給傳統(tǒng)企業(yè)的智能化帶來了新的想象力; 浙江衛(wèi)健委利用支付寶“AI就醫(yī)助理”解決方案,推出全國首個數(shù)字健康人“安診兒”,服務(wù)覆蓋掛號、咨詢、用藥、健康科普等26個環(huán)節(jié),也已應(yīng)用在浙江省內(nèi)上千家醫(yī)療機(jī)構(gòu)。

第二波浪 潮中的大企業(yè),已經(jīng)獲益匪淺,相對于仍在焦慮地尋找應(yīng)用、以求增長的大模型企業(yè)(包括OpenAI在內(nèi))來說,他們的路徑卻相對扎實。 即便是身處第三波浪潮、還未落地的蘋果公司,也因大模型加持下的路徑規(guī)劃而獲得了新的增長。

蘋果在演示被AI升級的Siri時,所舉的例子是“如果郵件通知了一個臨時會議,那么我還能趕上接下來女兒的演出嗎?”看上去并不性感,但其市值的高漲卻說明了外界的期待與看好——人人期待AI能從“通用”走向 “有用”,服務(wù)更多普通人的生活。

最近一些國內(nèi)國民級產(chǎn)品的AI布局,也有相似的趨勢。在支付寶智能助理已實現(xiàn)的功能中,就包括“查查上個月我花了多少錢”、“附近三公里最便宜的充電樁”、“幫我點一杯霸王茶姬的奶茶”、“幫我查明晚七點后從上海飛北京的航班”等服務(wù)。

從便捷到智能,從通用到有用的產(chǎn)品轉(zhuǎn)型,這條戰(zhàn)略訴求,說起來容易,做起來卻很難。

生活的場景遠(yuǎn)比企業(yè)辦公場景復(fù)雜。拿支付寶來說,每天有超5億用戶用它日常出行,每3人中就有1人通過支付寶看病就醫(yī),每天還有近7億人次使用非金融的生活類服務(wù)。所以,AI對支付寶的煥新,并不是簡單加入一個自然語言聊天對話框那么簡單,它需要的是科技對整個服務(wù)系統(tǒng)的重構(gòu)。

幾億用戶來了,支付寶該為每個不同的個體提供什么樣的個性服務(wù)?首頁下拉就能打開的智能助理,僅僅是個入口,也只是個開始。

一個生活服務(wù)平臺,接入智能助理時,需要具備三個條件:第一足夠了解個體用戶;第二擁有大模型世界知識與現(xiàn)實生活知識;第三具備服務(wù)能力、規(guī)劃能力、鏈接能力,能幫個體真正解決實際問題。

此外,在整個重構(gòu)過程中,還需要平臺不斷創(chuàng)新。比如特別是對于平臺企業(yè)來說,無法調(diào)用商用生活類小程序數(shù)據(jù)接口時,那它怎么做到精準(zhǔn)下單呢?支付寶的解決方案是,創(chuàng)新研發(fā)了ACT(Transformer for Actions)智能服務(wù)技術(shù),讓智能助理具備屏幕感知與仿真執(zhí)行能力,就像讓AI有了“眼睛”和“手腳”,模仿人去小程序下單付款。未來我們有理由期待,AI能夠連接支付寶的400萬小程序,讓我們能實現(xiàn)一句話點餐、掛號、訂票。

與生活相關(guān),便與瑣碎相關(guān),每一個細(xì)節(jié)都必須精耕細(xì)作,對于平臺企業(yè)來說,難度可想而知。不過,一旦業(yè)務(wù)重構(gòu)完成,AI的智能助理會更具想象力,它能讓每個人都用到大模型能力,從精英到普通人,從年輕人到老年人,實現(xiàn)AI的人人可享——這才是AI改變世界的樣子。

移動互聯(lián)網(wǎng)誕生10年后,才迎來智能手機(jī)的爆發(fā)式增長。AGI時代才剛剛開始,我們應(yīng)該給技術(shù)一段時間來孕育更大的改變。

中國人工智能開啟突圍模式

移動互聯(lián)網(wǎng)時代,中國誕生了微信、支付寶、抖音、美團(tuán)、小紅書等超級應(yīng)用,并擁有全球產(chǎn)銷量規(guī)模最大的手機(jī)、PC等智能終端產(chǎn)品。在B端,中國制造業(yè)規(guī)模已連續(xù)11年位居全球第一,擁有最完整、最豐富的產(chǎn)業(yè)鏈應(yīng)用場景。

中國還在不斷開拓新的AI應(yīng)用場景, 中國新能源汽車 產(chǎn)銷量已連續(xù)9年全球第一。據(jù)香港“對比法”技術(shù)市場研究公司最新的預(yù)測,2024年中國的純電動汽車銷量將是北美的4倍。AI加持的智能駕駛,無疑也值得期待。

在機(jī)器人領(lǐng)域,中國的進(jìn)階拓展也一直處于領(lǐng)先位置。2023年,中國工業(yè)機(jī)器人銷量已占全球一半以上,連續(xù)10年居世界首位。生活服務(wù)型機(jī)器人的產(chǎn)銷量亦在穩(wěn)步上漲。

如同移動互聯(lián)網(wǎng)時代,在人工智能時代一旦進(jìn)入應(yīng)用階段,中國依然擁有無可比擬的規(guī)模優(yōu)勢。百度、釘釘、支付寶、華為等平臺企業(yè)的責(zé)任,就在于調(diào)動中國的這種優(yōu)勢,在B端和C端掀起的兩次浪潮,連接千行百業(yè)、千家萬戶。

百度李彥宏說,超級能干的應(yīng)用比只看下載量的超級應(yīng)用可能要更重要,只要對產(chǎn)業(yè)、對應(yīng)用場景能產(chǎn)生大的增益,整體的價值就比移動互聯(lián)網(wǎng)要大得多。李彥宏希望,用大模型提效每一個行業(yè)、每一個場景。

釘釘集團(tuán)總裁葉軍稱,釘釘堅持開放底模型,希望釘釘站在巨人的肩膀上,為每一個企業(yè)探索大模型的應(yīng)用場景,從客戶場景出發(fā),探索大模型最務(wù)實的落地方式。

螞蟻集團(tuán)井賢棟稱,希望AI像掃碼支付一樣便利每個人的生活,讓AI走進(jìn)尋常百姓家。除了支付寶智能助理,螞蟻集團(tuán)也將推動大模型落地重點聚焦在醫(yī)療、金融兩大垂直行業(yè)。越復(fù)雜的領(lǐng)域,越需要生產(chǎn)力工具變得簡單。

無論是行業(yè)、企業(yè)還是個體生活,大平臺對大模型技術(shù)的應(yīng)用場景開發(fā),獲得的海量數(shù)據(jù),又會反哺大模型技術(shù)的提升。OpenAI奧爾特曼曾感慨,目前中國正有大量模型在被訓(xùn)練,這種趨勢會持續(xù)下去。他預(yù)計中國會有自己不同于世界其他地方的大模型。

未來,一切反轉(zhuǎn)皆有可能。憑借豐富的大模型場景應(yīng)用,馬斯克的大模型能力有可能超過OpenAI,而拉長時間周期,像移動互聯(lián)網(wǎng)那般,中國人工智能應(yīng)用也有望實現(xiàn)突圍?;蛟S說,我們都期待這樣的突圍。