人工智能時代的超級應(yīng)用一定會出現(xiàn),只是時機(jī)還未到。
超級應(yīng)用什么時候才能出現(xiàn)?這或許是過去一年AI行業(yè)最普遍的焦慮。
人們很容易把人工智能和PC互聯(lián)網(wǎng)或移動互聯(lián)網(wǎng)相比,兩者出現(xiàn)幾年后便有了廣受歡迎的超級應(yīng)用。但人工智能是工業(yè)革命級的技術(shù)浪潮,人工智能超級應(yīng)用的出現(xiàn)時間,與蒸汽機(jī)和電力出現(xiàn)后超級應(yīng)用的出現(xiàn)時間更具可比性。
1776年,第一臺有實用價值的蒸汽機(jī)被制造出來,成為萬能的原動機(jī),引領(lǐng)著人類社會邁入“蒸汽時代”,直到1800年代后,蒸汽機(jī)才大規(guī)模地應(yīng)用于鐵路和航運(yùn),并廣泛應(yīng)用于各種工業(yè)部門。熱力學(xué)第二定律出現(xiàn),更是接近100年后的事;電力革命同樣是這樣一個演進(jìn)過程,電力發(fā)明掀起了第二次工業(yè)革命的高潮,電廠、電燈、流水線等出現(xiàn),都是在電之后,經(jīng)歷數(shù)十年時光逐步演變出來的新的業(yè)態(tài)。
所以,人工智能時代的超級應(yīng)用一定會出現(xiàn),只是時機(jī)還未到。過去一年,AI行業(yè)都在追求所謂的“超級應(yīng)用”,似乎有點急功近利。
大模型作為一項基礎(chǔ)技術(shù),本身并不直接產(chǎn)生實用價值。基于基礎(chǔ)大模型,構(gòu)建出來的各類應(yīng)用,才是模型存在的意義。對于AI應(yīng)用開發(fā)者和創(chuàng)業(yè)者來說,最好的策略顯然不是死磕AGI或“超級應(yīng)用”,而是小步快跑、持續(xù)迭代,做出超級有用的應(yīng)用。
近期,在2024百度世界大會上,百度公布了旗下文心大模型的最新數(shù)據(jù):半年前,文心大模型API日調(diào)用量是2億,現(xiàn)在則超過了15億,短短半年增長7.5倍。這既是中國AI應(yīng)用爆發(fā)的一個縮影,也說明大模型對應(yīng)用真正產(chǎn)生了實際價值。
01
大模型基本消除幻覺
很長一段時間內(nèi),國內(nèi)大模型很難賣到其他行業(yè),一位業(yè)內(nèi)人士曾向36氪表示,“無論是智能硬件,還是AI智能體,業(yè)內(nèi)的需求非常強(qiáng)烈,但很少有人真的愿意買單,因為大模型生成效果太差,到處都是幻覺”。受限于多模態(tài)能力的發(fā)展,生成式人工智能在最初的使用體驗上更接近于簡單的對話bot,一開始用戶有嘗鮮需求,但由于體驗一般,留存很差。
而過去一年,大模型最大的變化就是基本消除了“幻覺”,讓模型變得可用。大模型本質(zhì)上是一個概率模型,在文本生成中,自動生成下一個最可能的文本,這導(dǎo)致了AI常常出現(xiàn)“幻覺”,也就是所謂的“一本正經(jīng)的胡說八道”。
要想基于大模型開發(fā)應(yīng)用,就必須消除“幻覺”。AI行業(yè)普遍通過檢索增強(qiáng)技術(shù)(RAG,Retrieval-augmented Generation),基本消除了大模型生成文字的幻覺,使大模型具備了實用價值。而多模態(tài)技術(shù)要實用,也需要準(zhǔn)確性和可控性,來拓展AI應(yīng)用空間。
百度在這次世界大會上發(fā)布了全新的iRAG(image based RAG)——檢索增強(qiáng)的文生圖技術(shù)。百度在今年年初決定解決多模態(tài)生成“幻覺”問題,讓文生圖也能消除幻覺,從而在影視作品、漫畫作品、連續(xù)畫本、海報制作等領(lǐng)域落地。
比如,汽車行業(yè)非常依賴市場推廣,常常需要大量高質(zhì)量的攝影作品,為了一張完美的圖片作品,所要耗費(fèi)的人力財力物力都不菲。利用iRAG技術(shù),車企可以用極低成本、更快的時間拿到一張在視覺表現(xiàn)上可圈可點的攝影作品。甚至有可能在視覺表現(xiàn)上更加驚艷。
目前,生成式人工智能的技術(shù)路線基本分為兩派,一類是AGI派,夢想一步到位,通過基礎(chǔ)大模型,若干年內(nèi)實現(xiàn)通用人工智能;另一派是應(yīng)用驅(qū)動派,從應(yīng)用需求出發(fā),通過應(yīng)用反饋模型創(chuàng)新。
百度在持續(xù)研發(fā)底層大模型的基礎(chǔ)上,更強(qiáng)調(diào)應(yīng)用驅(qū)動。據(jù)了解,iRAG就是因為應(yīng)用需要生成準(zhǔn)確的圖像,比如公司的logo不能變形或顏色失真,這就需要精確的多模態(tài)能力。經(jīng)過近一年努力,這項技術(shù)已經(jīng)實用。而應(yīng)用的進(jìn)展,也能反哺模型本身的研發(fā)。
02
智能體,AI應(yīng)用最大的趨勢
經(jīng)過兩年時間,生成式AI正處在一個換擋的關(guān)鍵時期。此前36氪曾披露,國內(nèi)有兩家AI創(chuàng)業(yè)公司暫停了大模型的預(yù)訓(xùn)練,近兩日,業(yè)界對Scaling Law(擴(kuò)展定律)是否已到達(dá)“投資收益遞減”的爭論更是愈演愈烈。
實際上,在全球范圍內(nèi),變化也已開始了。OpenAI、微軟、谷歌等全球科技巨頭先后下場,布局智能體。9月中,OpenAI的研究員Noam Brown在社交媒體上宣布,正為新的多智能體研究團(tuán)隊招聘機(jī)器學(xué)習(xí)工程師。微軟CEO、董事長納德拉則親自宣布自家AI新進(jìn)展,一口氣發(fā)了10個新商業(yè)智能體,組團(tuán)出道。幾乎同一時間,有消息稱谷歌也要發(fā)智能體,很快谷歌“意外”泄露了最新 AI 發(fā)展成果 Jarvis 的“內(nèi)部預(yù)覽版”,正是一個代理型人工智能,一款能夠瀏覽互聯(lián)網(wǎng)并自主檢索信息的智能體。
國內(nèi)引領(lǐng)智能體趨勢的是百度。在這次百度世界大會活動上,智能體成為主角。百度重點介紹了四類智能體:公司類、角色類、工具類、行業(yè)類。
比如,其中工具類智能體“自由畫布”:基于百度早年間文庫業(yè)務(wù)的長時間積累,再疊加生成式人工智能技術(shù),實現(xiàn)了創(chuàng)作上的極大飛躍。
早年間人們使用文庫的需求是找現(xiàn)成的文檔。然而,當(dāng)生成式人工智能技術(shù)出現(xiàn),百度發(fā)現(xiàn)人們最根本的需求,不是找一個現(xiàn)成的文檔,而是要創(chuàng)作更加適合自己的內(nèi)容。
為了滿足這樣的需求,百度開始思考基于現(xiàn)成的文檔,或者在沒有素材基礎(chǔ)的前提下,如何能夠讓人們更好地創(chuàng)作,沿著這條路走下去最早百度文庫被重構(gòu)。后來百度又發(fā)布了獨(dú)立產(chǎn)品橙篇,可以一鍵生成長文,自由畫布的誕生同樣基于這一邏輯,讓人們能夠更加方便地“communicate your ideas(傳遞創(chuàng)意)”通俗地來說,就是如何把心里的想法更方便、準(zhǔn)確地表達(dá)出來。
百度創(chuàng)始人李彥宏認(rèn)為,“智能體是AI應(yīng)用的最主流形態(tài),即將迎來它的爆發(fā)點?!弊鲋悄荏w類比為PC時代做網(wǎng)站,或是移動時代做自媒體賬號。不同之處是智能體更像人、更智能,更像你的銷售、客服和助理。智能體可能會變成AI原生時代,內(nèi)容、信息和服務(wù)的新載體。
OpenAI CEO Sam Altman上個月在Reddit回答問題時,也在表達(dá)轉(zhuǎn)向AI代理開發(fā)商的可能性?!拔覀儗碛性絹碓胶玫哪P?,但我認(rèn)為下一個重大突破將是AI代理”。英偉達(dá)黃仁勛同樣表示,未來英偉達(dá)將有1億個智能體。
智能體的特點是,門檻足夠低,天花板足夠高,可以成長為非常強(qiáng)大的公司,就像谷歌、Meta都是許多年前由大學(xué)生創(chuàng)業(yè)做出的網(wǎng)站,并成長為全球最強(qiáng)大的科技巨頭。某種程度上看,現(xiàn)在不做智能體,就像二十年前沒做網(wǎng)站,十年前沒做APP。
03
中國AI扛旗者的技術(shù)信仰
很少有一家中國公司像百度這樣,在全球人工智能發(fā)展的人才節(jié)點、資源節(jié)點和技術(shù)節(jié)點,扮演過這么多重要的角色。這背后,離不開創(chuàng)始人對AI的信仰和執(zhí)著。在行業(yè)內(nèi),李彥宏有一句經(jīng)典名言,“有1塊錢的時候,我會投進(jìn)技術(shù)里;有1個億,我會投進(jìn)技術(shù)里;有100個億,我還是會投進(jìn)技術(shù)里”。

百度做AI最早可以追溯到十多年前,那場著名的拍賣會。2012年12月的一天,一場秘密拍賣會在美國內(nèi)華達(dá)州太浩湖南邊的滑雪山腳下進(jìn)行。被競拍的資產(chǎn)實際上是“三個人”—— “AI教父”杰弗里·辛頓(Geoffrey E. Hinton)教授和他的兩名學(xué)生。
來自百度、谷歌、微軟、DeepMind的代表們頻頻舉牌,報價飆升至4400萬美元,到這里參與者只剩下了百度和谷歌。盡管百度不設(shè)上限參與競拍,但最終仍沒有成功。
這也讓李彥宏意識到,一定要自己做深度學(xué)習(xí)、自動駕駛等技術(shù),在那之后,他便建立了百度美國研究所,同時開始大力招徠全球人才,此后成功吸納了包括吳恩達(dá)、Dario Amodei等在內(nèi)的全球頂級人才加入。
此后十年,百度開啟了其在人工智能技術(shù)上的全棧自研時期,從芯片、框架、模型再到應(yīng)用層,逐一擊破。百度先后發(fā)布了自動駕駛開放平臺 Apollo、開源了深度學(xué)習(xí)框架飛槳(PaddlePaddle),甚至在2019年就早早發(fā)布了文心大模型1.0版本。
但直到ChatGPT誕生前,AI技術(shù)應(yīng)用都沒有找到引爆點,一直被業(yè)內(nèi)看作是燒錢無底洞,落地應(yīng)用也遙遙無期。
堅持總能得到回報。逆轉(zhuǎn)發(fā)生在2023年3月,基于文心大模型3.0版本,百度在全球第一個發(fā)布了對標(biāo)ChatGPT的產(chǎn)品文心一言。至此,十年默默投入終于有了回報。
2023年下半年開始,在保證基礎(chǔ)模型持續(xù)領(lǐng)先的情況下,百度突然意識到,大模型的同質(zhì)化競爭已經(jīng)出現(xiàn)了巨大的資源浪費(fèi),李彥宏多次公開呼吁“要卷應(yīng)用,不要卷模型”,并在公司內(nèi)部要求要做第一個用大模型把全部產(chǎn)品重構(gòu)一遍的公司。2023年世界大會,百度向外界展示了搜索、地圖、網(wǎng)盤等重要應(yīng)用的重構(gòu)成果,而今年世界大會,百度的主題更是直接定為《應(yīng)用來了》,讓外界看到了大模型在智能體、產(chǎn)業(yè)應(yīng)用等領(lǐng)域創(chuàng)造的巨大價值。
回顧過去不難看出,百度在過去十幾年全球人工智能發(fā)展的歷次重要節(jié)點,都作出了正確選擇。在更長遠(yuǎn)的未來,李彥宏希望AI能真正被每一位普通人所使用,讓每個人都具備程序員的能力。
04
人人都具備程序員的能力
李彥宏在這次百度世界大會上,還發(fā)布了One More Thing——秒噠,一個無代碼編程、多智能體協(xié)作、多工具調(diào)用的軟件。
秒噠和此前任何輔助代碼生成工具都很不一樣,它不需要使用者能看懂代碼。相比之下,以往的AI工具,作為生產(chǎn)力工具更多是加強(qiáng)金字塔頂端的精英能力,比如在硅谷,輔助代碼生成很受重視,因為美國很缺工程師,工程師的時薪也很貴,輔助工具可以提效,讓金字塔塔尖的人更加powerful。
但是AI本應(yīng)該讓每個人都能從中受益,而不應(yīng)該是少數(shù)人使用的專利。
隨著基礎(chǔ)模型和智能體能力逐步提升,百度把這些技術(shù)能力綜合在一起,讓真正的普通人,一行代碼都看不懂的人,具備程序員的能力。
試想一下,當(dāng)幾億、十幾億人都具備這種能力的時候,對應(yīng)的是巨大的市場空間,尤其是創(chuàng)造力的爆發(fā),是輔助代碼生成工具等技術(shù)無法比擬的。百度希望的是每一個普通人,都可以擁有金字塔塔尖這些人的能力,其意義自然更加深遠(yuǎn)。
李彥宏在大會期間說:“百度不是要推出一個‘超級應(yīng)用’,而是要不斷地幫助更多人、更多企業(yè)打造出數(shù)百萬‘超級有用’的應(yīng)用?!?/p>
試想在AI時代,越來越多人可以通過學(xué)習(xí)創(chuàng)造新的產(chǎn)品和服務(wù),用自然語言編程這樣一個富有創(chuàng)造力的低門檻行動,將一些天馬行空的想法付諸實現(xiàn),做出無數(shù)個有價值的應(yīng)用,這才是真正的技術(shù)普惠。
熱門跟貼