正月十五剛過,AI圈就有大事發(fā)生:2月12日,CNBC引述知情人士爆料稱,百度計劃在今年下半年發(fā)布下一代人工智能模型Ernie 5.0,將在模型多模態(tài)能力方面有重大增強(qiáng)。次日凌晨3點(diǎn),OpenAI首席執(zhí)行官Sam Altman就表示即將發(fā)布GPT-4.5和GPT- 5,重點(diǎn)是GPT- 5將免費(fèi)開放。與此同時,文心一言宣布:將于4月1日0時起全面免費(fèi),PC端和App端都可使用文心系列最新模型。

中美AI行業(yè)兩大領(lǐng)軍企業(yè)為何同時宣布免費(fèi)?全面開放大模型有什么樣的深層次原因?全球兩大頭部AI產(chǎn)品免費(fèi)開放,對AI產(chǎn)業(yè)有哪些影響?下面K哥談?wù)勛约旱挠^察與思考。

01

OpenAI與百度隔空對飆

OpenAI首席執(zhí)行官Sam Altman,于2月13日凌晨公布了GPT-4.5和GPT-5的最新消息。免費(fèi)版ChatGPT能在標(biāo)準(zhǔn)智能設(shè)置下無限制地使用GPT - 5進(jìn)行對話。在更早之前的2月6日,OpenAI宣布ChatGPT Search向所有人開放,打開OpenAI官網(wǎng)即可直接使用,甚至不需要注冊。

另據(jù)CNBC報道,百度計劃在今年下半年發(fā)布下一代人工智能模型Ernie 5.0,將在模型多模態(tài)能力方面有重大增強(qiáng)。次日13日Open ai火速跟進(jìn),宣布即將發(fā)布GPT-5。

有意思的是,就在OpenAI公布ChatGPT Search全面開放的前幾個小時,谷歌宣布向所有人開放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三個版本。

2月13日,文心一言在官網(wǎng)宣布將于4月1日0時起全面免費(fèi),所有PC端和App 端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業(yè)檢索增強(qiáng)、高級AI繪畫、多語種對話等功能。

打開網(wǎng)易新聞 查看精彩圖片

從以上幾家AI領(lǐng)軍企業(yè)的最新動向不難發(fā)現(xiàn),大模型開放是大勢所趨,科技巨頭們都在主動開放各自的大模型產(chǎn)品,讓更多用戶體驗和使用。

02

更強(qiáng)大模型改寫AI競爭版圖

此次開放的大模型,綜合能力非常強(qiáng)悍。以文心一言為例,K哥作為文心一言的深度用戶,對于此前開放的文心大模型3.5版和這次全面開放的4.0版,還是比較熟悉的。文心大模型4.0較之前的版本,綜合能力更強(qiáng)大,K哥做了個測評。

先讓文心大模型預(yù)測下《哪吒2》最終全球票房,以下是3.5版的預(yù)測結(jié)果。

對比一下4.0的效果,不但給出了更具可能性的結(jié)果,整個思考鏈路非常清晰。

再來看看文生圖表現(xiàn)如何,我輸入提示詞:幫我畫一個奧黛麗赫本吃湯圓。以下是3.5版本出的圖,還是不錯的。

4.0版本基于iRAG技術(shù),生成了更準(zhǔn)確的人物臉部,而且一次可以生成多張供你選擇。

2月13日,文心一言還新上線了深度搜索功能,能針對專業(yè)咨詢類問題的解決能力進(jìn)行全面加強(qiáng),以解決專業(yè)問題查詢門檻高、查詢渠道專精、查詢結(jié)果分析難度大等使用挑戰(zhàn)。

在民生、創(chuàng)業(yè)、經(jīng)濟(jì)分析等方面問題,能夠提供專家級的內(nèi)容回復(fù);除了搜索能力以外,具備更全面的思考、規(guī)劃、反思能力,針對工具規(guī)劃及調(diào)用能力上進(jìn)行全面加強(qiáng),能夠更加“聰明”的使用多個工具解決各類復(fù)雜任務(wù)問題。

接著說說大家關(guān)心的幻覺問題,RAG是主要的解決方案,百度在RAG技術(shù)上具備中文深度理解、多模態(tài)檢索、垂直領(lǐng)域定制化以及實(shí)時數(shù)據(jù)整合能力等優(yōu)勢,在中文互聯(lián)網(wǎng)、企業(yè)服務(wù)、政務(wù)等場景中更具實(shí)用性和競爭力。從RAG能力實(shí)測來看,國內(nèi)外主流大模型中,百度文心一言綜合表現(xiàn)最佳。

在解決圖片生成的幻覺問題上,百度提出了iRAG(image based RAG)技術(shù)解決方案,將百度搜索的億級圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,就可以生成各種超真實(shí)的圖片,去掉了AI味兒,而且成本很低。前文測評的案例中,大家已經(jīng)感受到iRAG的強(qiáng)大了,iRAG具備無幻覺、超真實(shí)、沒成本、立等可取等特點(diǎn),在影視作品、漫畫作品、連續(xù)畫本、海報制作等很多領(lǐng)域都有廣泛的應(yīng)用空間。

在K哥看來,文心一言的全面開放,保證了用戶享有最佳體驗,進(jìn)一步降低AI的使用門檻。在百度的頭部效應(yīng)之下,會有越來越多AI公司加入開放的隊伍,這將有利于推動中國AI行業(yè)的發(fā)展,促進(jìn)AI普惠。

03

大模型成本“三級跳”

杰弗里·摩爾在《跨越鴻溝》中指出,高科技產(chǎn)品在市場化過程中,會面臨一個難以逾越的“死亡之谷”,這是早期使用者到大眾用戶的過渡階段,能否“跨越裂谷”,是高科技產(chǎn)品發(fā)展的關(guān)鍵。2024年AI產(chǎn)品的用戶破圈增長,標(biāo)志著AI已經(jīng)“跨越裂谷”。

AI技術(shù)突破背后的成本降低,是這次大模型全面開放的核心原因。

一方面,大模型訓(xùn)練成本大幅降低。以百度為例,文心大模型的訓(xùn)練成本不斷降低,工程技術(shù)上的突破創(chuàng)新主要有3點(diǎn):

1,昆侖芯性價比高,可降低單位算力成本。昆侖芯在性能上表現(xiàn)卓越,能夠在更少的計算資源下運(yùn)行大規(guī)模模型(如DeepSeek-V3/R1),這使得大模型的推理和訓(xùn)練所需的計算量減少,從而直接降低算力成本。

2,萬卡集群規(guī)模效應(yīng),提高資源利用率。百度智能云已點(diǎn)亮萬卡集群,并計劃擴(kuò)展至 3萬卡。大規(guī)模集群可以通過任務(wù)并行調(diào)度、彈性算力管理等方式,提高計算資源利用率,避免算力閑置,提高單任務(wù)的計算效率,降低整體算力成本。

3,百舸平臺助力大規(guī)模集群實(shí)現(xiàn)高效的部署管理。如:超大規(guī)模HPN高性能網(wǎng)絡(luò),將帶寬有效性提升到90%以上;創(chuàng)新性散熱方案,有效降低能耗,進(jìn)一步優(yōu)化成本;高效并行化任務(wù)切分策略,將MFU(GPU有效利用率指標(biāo))提升至58%;故障恢復(fù)時間為分鐘級,集群有效訓(xùn)練率達(dá)到98%。

另一方面,推理成本的顯著下降。在飛槳深度學(xué)習(xí)框架的支持下,文心大模型通過優(yōu)化實(shí)現(xiàn)推理性能提升,推理成本顯著降低。正如百度創(chuàng)始人李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會”上所說的:“在過去,當(dāng)我們談?wù)撃柖蓵r,每18個月,性能水平或價格都會減半。但是今天,當(dāng)我們談?wù)摯笮驼Z言模型時,增加的成本基本上降低了,可以在12個月內(nèi)降低90%以上?!?/p>

04

先進(jìn)生產(chǎn)力人人可用

這場AI開放浪潮,預(yù)示著AI產(chǎn)業(yè)的全新范式:與其構(gòu)建封閉的技術(shù)護(hù)城河,不如孕育創(chuàng)新的生態(tài)雨林。當(dāng)大模型成為"水電煤"一樣的基礎(chǔ)設(shè)施,人類將會創(chuàng)造出遠(yuǎn)超我們想象的數(shù)字文明。

一場屬于普通人的生產(chǎn)力革命正在悄悄降臨,正如馬文·明斯基所說的:"真正重要的不是機(jī)器能否思考,而是人類能否因之更好地思考。"此刻,屬于每個人的AI時代,才剛剛拉開帷幕。