
無論DeepSeek,還是文心大模型4.5,都已率先進入第二戰(zhàn)場,掀起一場將大模型門檻拉低到極致,推動產(chǎn)業(yè)落地、應(yīng)用爆發(fā)的革命性探索。
作者|劉珊珊
編輯|Cindy
分隔在大洋彼岸的中美兩大AI企業(yè),同一天宣布了重磅消息。
2月28日,百度宣布,文心大模型4.5將于3月16日正式上線。根據(jù)百度方面介紹,最新版不僅在基礎(chǔ)模型能力上有大幅提升,且具備原生多模態(tài)、深度思考等能力。
“文心大模型4.5,將是百度有史以來最強大的大模型。”此前百度2024年Q4及全年財報電話會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏如此透露。
受來自DeepSeek、百度、阿里等中國大模型的挑戰(zhàn),OpenAI在北京時間周五凌晨發(fā)布博文,宣布GPT-4.5大模型正式登場。這款被OpenAI內(nèi)部代號為“Orion”的模型,被聲稱是其最大、最佳的聊天模型。

眾所周知,過去幾周全球AI產(chǎn)業(yè)界都正因DeepSeek而巨變。在全球AI競賽加劇之際,作為中美兩大領(lǐng)先AI企業(yè),百度和OpenAI的新動作,自然更受外界關(guān)注。
目前來看,百度將通過文心大模型4.5,打出“開源、免費”組合拳,走向更加開放的策略。
相比之下,GPT-4.5的高情商和人性化表現(xiàn)也帶來了驚喜,但整體差強人意,因為并不是推理型模型,在性能上也與OpenAI前幾代模型有差距——更強大基礎(chǔ)大模型仍然是護城河邏輯不變下,中國大模型正加速占據(jù)以應(yīng)用落地為主題的大模型第二場主動權(quán)。
01
開源+免費”,百度更為開放
進入2月以來,百度已密集放出了多個重磅“AI炸彈”。
2月12日,CNBC一則關(guān)于百度文心大模型5.0版本將于下半年發(fā)布的消息,在AI行業(yè)引發(fā)震動。2月13日,OpenAI首席執(zhí)行官Sam Altman(山姆·奧特曼)宣布將在未來幾個月推出名為GPT-5,中美大模型競賽氛圍越來越濃。
最重磅消息來自百度。同一天,百度宣布文心一言將于4月1日0時起,全面免費,所有PC端和APP端用戶均可體驗文心系列最新模型。同時,上線深度搜索功能。

1天后(2月14日),百度宣布將在未來幾個月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開源。
這意味著,文心大模型就此打出“免費+開源”組合拳,百度AI策略更為開放。
百度轉(zhuǎn)變和DeepSeek橫空出世帶來的震動,有一定關(guān)系——但不止百度,OpenAI、騰訊、阿里等國內(nèi)外AI巨頭,無一不受影響。比如OpenAI,就在中國大模型壓力下,被迫加速模型發(fā)布和開源的腳步。
更客觀現(xiàn)實是,開源和閉源,其實并沒有絕對的優(yōu)劣之分。
作為中國大模型最早入局者,百度文心大模型是全球最早對標(biāo)GPT的LLM大模型,幾年時間里,文心大模型經(jīng)過了持續(xù)的迭代和進化。比如,文心一言版本已經(jīng)迭代到了4.0,無論是日均超15億次的調(diào)用量,還是在各行業(yè)的賦能落地,都是推動中國大模型發(fā)展的重要組成部分。
同時,在百度強大生態(tài)支撐下,百度搜索、百度地圖、百度文庫、百度智能云等,都早已在給普通用戶提供最完整的AI服務(wù)。

多位業(yè)內(nèi)人士就此認(rèn)為,百度走向“開源+免費”,是大模型發(fā)展的“順勢而為”,其意義重大,可以更好地推動技術(shù)平權(quán)。它讓全球用戶能夠毫無門檻地運用中國頂尖的大模型技術(shù),更是大模型從專業(yè)范疇,邁向大眾市場的關(guān)鍵轉(zhuǎn)折點。
李彥宏在多個場合的表態(tài),也表明了,百度如今對開源與閉源模型價值的思考邏輯。“我在過去幾個月中學(xué)到的是,開源可以幫助你獲得更多關(guān)注。我們正處于AI、生成AI創(chuàng)新的早期階段,更快的傳播將有助于提高采用率,但也有助于更多的人嘗試這項技術(shù)?!?/p>
這背后,體現(xiàn)的是百度組合拳,推動技術(shù)平權(quán)時的底氣和開放心態(tài)。
比如,百度系多款產(chǎn)品,百度搜索、百度文庫、百度網(wǎng)盤都全量接入了DeepSeek- R1滿血版。相比其他產(chǎn)品入口較深,任何普通網(wǎng)友,都可以在百度首頁搜索框下方,點擊“AI搜索DeepSeek滿血版”直接體驗。

無論如何,自研大模型才是百度最強競爭力所在。如同李彥宏指出,基礎(chǔ)模型真正的價值,只有在能夠有效解決現(xiàn)實問題并廣泛應(yīng)用時才能得到體現(xiàn)。“即使是開源,如何確保其在實際應(yīng)用中展現(xiàn)出色的表現(xiàn),才是企業(yè)必須面對的挑戰(zhàn)。”
至此,留給外界的疑問,無外這場普惠大眾的AI 變革浪潮,何時正式開啟。
2月27日,路透社爆料稱,百度將在3月中下旬發(fā)布文心大模型4.5 。或許是明顯感受到了來自中國AI的競爭壓力,OpenAI略顯倉促的在2月28日推出GPT-4.5——發(fā)布會僅持續(xù)不到14分鐘,OpenAI的CEO山姆·奧特曼正在醫(yī)院陪剛出生的孩子,并未現(xiàn)身。
02
史上最強文心大模型,有多強?
隨著文心大模型4.5正式登場日的官宣,接下來半個月中,業(yè)界都會有一個共同猜測:史上最強文心大模型,到底有多強?又有哪些能力值得期待?
可以肯定,和GPT-4.5不同,文心大模型4.5,將在基礎(chǔ)模型能力上有大幅提升,帶給用戶最明顯的感受,可能是RAG能力進一步增強,將在幻覺方面降低到新水平。
“幻覺”,是懸在AI發(fā)展之路上的達摩克利斯之劍。指的是大模型在試圖生成內(nèi)容或回答問題時,輸出的結(jié)果不完全正確甚至錯誤,即通常所說的“一本正經(jīng)地胡說八道”。
在大模型領(lǐng)域,由于訓(xùn)練知識存在偏差、過度泛化地推理、理解存在局限性等,幻覺是每個模型與生俱來的缺陷。

大模型或多或少都有幻覺問題
例如OpenAI,多份研究此前指出,o3-mini大約只有10個簡單問題中答對1個,兩年來幻覺問題都沒有得到改善。異軍突起的DeepSeek,也因在解答西安安定門繞行問題時 “翻車” 而備受關(guān)注。
RAG(檢索增強型生成),在解決幻覺問題上扮演著至關(guān)重要的角色——在推理過程中,RAG 使用檢索到的數(shù)據(jù)作為參考來組織答案,從外部知識源中動態(tài)檢索信息,以此幫助大模型生成更豐富、更準(zhǔn)確、更可靠的內(nèi)容??梢哉f,RAG給大模型增加了一個可以快速查找的“知識外掛”。
毋庸置疑,在國內(nèi),百度擁有最豐富的實時與個性化的數(shù)據(jù)和知識,研發(fā)了“理解-檢索-生成”RAG能力。從各種RAG能力實測來看,國內(nèi)外主流大模型中,百度文心一言綜合表現(xiàn)最佳。
比如,在和OpenAI的直接PK中,即使是春節(jié)檔電影細節(jié)、春晚節(jié)目等內(nèi)容,文心都能準(zhǔn)確回答;相比之下,OpenAI雖能檢索到信源,卻無法生成準(zhǔn)確回答。

基于此,去年11月的百度世界2024大會上,百度發(fā)布了自研的檢索增強的文生圖技術(shù)(iRAG),將百度搜索的億級圖片資源跟強大的基礎(chǔ)模型能力相結(jié)合,大幅降低圖片生成領(lǐng)域的幻覺,大幅提高了文心的模型可用性。
可以預(yù)計,在文心大模型4.5中,隨著大模型的訓(xùn)練數(shù)據(jù)得到進一步擴充,AI幻覺也會大幅降低,不僅讓百度自身AI應(yīng)用快速進化,也能夠讓更多行業(yè)放心用上大模型。
近期,文心一言就上線了“深度搜索”功能,具備專家級問答能力,RAG能力突出,尤其是專業(yè)領(lǐng)域問答幻覺率低。
在OpenAI的GPT-4.5不具備推理能力,還是主打?qū)懽鞯任谋旧哨厔菹拢男拇竽P?.5究竟能呈現(xiàn)怎樣的原生多模態(tài)、深度思考能力?以及可以在哪些場景下落地應(yīng)用?顯然更值得期待。
可以推測,在DeepSeek掀起大模型降價浪潮后,文心大模型4.5也會加速推動性能升級與成本降低,有望催生新的商業(yè)模式和產(chǎn)業(yè)生態(tài)。

值得一提的是,得益于飛槳和文心的聯(lián)合優(yōu)化,文心大模型在推理性能提升同時,推理成本也得到了有效降低——根據(jù)去年世界大會上的說法,其推理成本一年降低99%。
從李彥宏演示的個例來看,以前拍一組汽車在某場景的大片宣傳海報動輒需要一二十萬,甚至大幾十萬,使用iRAG后,創(chuàng)作成本接近于0。
推理成本降低速度還在加快。李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會”上表示,“在過去,當(dāng)我們談?wù)撃柖蓵r,每18個月,性能水平或價格都會減半。但是今天,當(dāng)我們談?wù)摯笮驼Z言模型時,增加的成本基本上降低了,可以在12個月內(nèi)降低90%以上?!?/p>
所以,這也是眾多企業(yè)和開發(fā)者,對于文心大模型4.5的共同期待。一位開發(fā)者就說,基于文心大模型4.5,希望無論是開發(fā)原生應(yīng)用,還是做二次開發(fā),都能夠方便地體驗,擁有更低的推理成本和更高的訓(xùn)練效率。
03
第二場競速,
中國大模型趕超美國提速
上述開發(fā)者的期待,其實正是在百度接連打出“開源+免費”組合拳后,李彥宏的表態(tài):“希望客戶和用戶能比之前更方便地體驗這款模型?!?/p>
某種程度看,無論DeepSeek,還是文心大模型4.5,都已率先進入第二戰(zhàn)場,掀起一場將大模型門檻拉低到極致,推動產(chǎn)業(yè)落地、應(yīng)用爆發(fā)的革命性探索。
中國是全球唯一擁有聯(lián)合國產(chǎn)業(yè)分類中所列全部工業(yè)門類的國家,不僅擁有全球最多的C端用戶,還有最廣闊的B端市場,對AI應(yīng)用落地來說,這是獨特的巨大優(yōu)勢。

如何讓大模型更好應(yīng)用于千行百業(yè),全面升級產(chǎn)業(yè)同時,創(chuàng)造一個巨大商業(yè)市場,是自上而下的共識。權(quán)威媒體就在評論中認(rèn)為,大模型落地應(yīng)用,是中國AI當(dāng)下最重要的命題。
“作為生產(chǎn)力工具,以大模型為代表的AI技術(shù),不僅將與營銷、文娛、社交、電商等AI原生應(yīng)用深度融合,還會重構(gòu)、改造傳統(tǒng)制造、醫(yī)療、HR、教育、金融、法律等垂類應(yīng)用,推動千行百業(yè)向高質(zhì)量方向發(fā)展?!币晃挥^察人士說。
過去十余年來,美國或許一直在AI競賽中領(lǐng)先中國。但從DeepSeek到文心大模型4.5,這一切正在迅速改變:
盡管OpenAI等明顯感受到了來自中國的競爭壓力,也在想方設(shè)法提速,但GPT-4.5“最佳聊天的小家子氣”——GPT 4.5(研究預(yù)覽版)甚至輸出價格是每百萬token 150美金相比,依然讓更多美國AI人士相信,這標(biāo)志著在大模型第二場競速,也就是應(yīng)用落地比拼中,中國大模型正不斷趕超美國。
出品人:黃槍槍|直達熱線 13452396140
(請標(biāo)注公司、職位)
獨到觀點、獨立態(tài)度
見證中國商業(yè)生態(tài)進化、重塑與未來
往期精品

熱門跟貼