
DeepSeek 推崇的開(kāi)源策略,不僅對(duì)「AI 六小龍」造成了不小沖擊,也讓百度等老牌巨頭感受到了實(shí)實(shí)在在的壓力。
但轉(zhuǎn)身的百度,正逐漸展現(xiàn)出強(qiáng)勁的反擊姿態(tài)。
繼宣布「文心大模型 4.5 系列」將于 6 月 30 日正式開(kāi)源后,已經(jīng)發(fā)布多款新品的百度,今天在面向開(kāi)發(fā)者的 Create 大會(huì)重磅推出兩款全新模型:文心 4.5 Turbo 和深度思考模型 X1 Turbo。

既然冠以 Turbo 之名,那這兩款模型能力自然在性能上全面進(jìn)階,主打多模態(tài)、強(qiáng)推理和低成本。百度旗下新搜索智能助手文小言也宣布全面接入,免費(fèi)向用戶(hù)開(kāi)放,即日起用戶(hù)打開(kāi)文小言 APP 即可使用。
會(huì)上,百度創(chuàng)始人李彥宏明確指出:「多模態(tài)將成為未來(lái)基礎(chǔ)模型的標(biāo)配,純文本模型的市場(chǎng)會(huì)越變?cè)叫?,多模態(tài)模型的市場(chǎng)會(huì)越來(lái)越大」。
「當(dāng)然 DeepSeek 也不是萬(wàn)能的。比如它只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體內(nèi)容,」李彥宏認(rèn)為「它更大的問(wèn)題是慢和貴,中國(guó)市場(chǎng)上絕大多數(shù)的大模型 API調(diào)用價(jià)格都比 DeepSeek 滿血版要低,速度要更快?!?/p>
在他看來(lái),今天隆重發(fā)布的文心大模型的 4.5 Turbo 和 X1 Turbo 正是要解決這些問(wèn)題。
基于這一判斷,文心大模型 4.5 Turbo 進(jìn)一步強(qiáng)化了多模態(tài)能力。在多個(gè)基準(zhǔn)測(cè)試集中,文心 4.5 Turbo 多模態(tài)能力已與 GPT-4.1 持平,甚至在部分維度優(yōu)于 GPT-4o。

▲文心4.5 Turbo-多模態(tài)

▲文心4.5 Turbo-文本
我們不妨測(cè)試一下文心 4.5 Turbo 的邏輯推理能力,看看它如何解答這樣一個(gè)經(jīng)典問(wèn)題:
「燒一根不均勻的繩要用一個(gè)小時(shí),如何用它來(lái)判斷半個(gè)小時(shí)?燒一根不均勻的繩,從頭燒到尾總共需要1個(gè)小時(shí)?,F(xiàn)在有若干條材質(zhì)相同的繩子,問(wèn)如何用燒繩的方法來(lái)計(jì)時(shí)一個(gè)小時(shí)十五分鐘呢?」
創(chuàng)作方面,文心 4.5 Turbo 靠譜嗎?我們也讓其創(chuàng)作一份孫悟空和東海龍王結(jié)拜的短劇劇本。
結(jié)果,交出的劇本不僅尊重原著核心,也注入了新的解讀。其中定海神針的擬人化是亮點(diǎn),血盟儀式的設(shè)計(jì)也添加了新的維度。
而文心大模型 X1 Turbo 則在 4.5 Turbo 的基礎(chǔ)上進(jìn)行了「深度思考」升級(jí),性能顯著提升,內(nèi)置更完整的思維鏈系統(tǒng)。
無(wú)論是問(wèn)答能力、內(nèi)容創(chuàng)作、邏輯推理,還是工具調(diào)用、多模態(tài)處理,X1 Turbo 均實(shí)現(xiàn)全方位增強(qiáng),整體表現(xiàn)領(lǐng)先于 DeepSeek R1 和最新版本 V3。
上個(gè)月,我們實(shí)測(cè)了文心大模型 4.5 以及深度思考模型 X1 理解梗圖的能力,那新模型的表現(xiàn)如何?答案是,多模態(tài)理解能力確實(shí)更強(qiáng)了。
拿這張梗圖為例,相較于上一次,X1 Turbo 的理解更到位,回答也更具條理性,充分認(rèn)識(shí)到這張萬(wàn)能表情包背后的「友好善意」。
比如,上傳一張文物照片,讓 X1 Turbo 進(jìn)行講解分析。它不僅能準(zhǔn)確識(shí)別文物身份,還能詳細(xì)剖析其工藝特點(diǎn),講解內(nèi)容之細(xì)致,堪比專(zhuān)業(yè)博物館講解員。
亦或者,嘗試讓其生成一張空中飛機(jī)視角的圖像,畫(huà)面隨即生成,幾近真實(shí)。

▲Prompt:一個(gè)人的手指向飛機(jī)窗外,窗外的飛機(jī)機(jī)翼從側(cè)面可見(jiàn)。外面的天空清晰,天際線顯示出黎明或黃昏的景象。眼前是廣闊的海洋
而在大家最關(guān)心的成本方面,而百度此次也打出價(jià)格組合拳。
文心大模型 4.5 Turbo 每百萬(wàn) token 的輸入價(jià)格僅為 0.8元,輸出價(jià)格 3.2元,相比前代 4.5 降幅達(dá) 80%,只相當(dāng)于 DeepSeek V3 的 40%。
而文心大模型 X1 Turbo 每百萬(wàn) token 輸入價(jià)格為 1 元,輸出為 4 元,同樣在性能提升的同時(shí)價(jià)格腰斬,僅為 DeepSeek R1 的 25%。

當(dāng)天的 One More Thing 環(huán)節(jié),百度正式點(diǎn)亮了國(guó)內(nèi)首個(gè)全自研的三萬(wàn)卡集群,可同時(shí)承載多個(gè)千億參數(shù)大模型的全量訓(xùn)練,支持 1000 個(gè)客戶(hù)同時(shí)做百億參數(shù)的大模型精調(diào),強(qiáng)大技術(shù)底座硬實(shí)力的背后,也意味著百度再次向行業(yè)釋放出最鮮明的信號(hào)。
此外,李彥宏在會(huì)上表示,當(dāng)前開(kāi)發(fā)者做 AI 應(yīng)用的一大阻礙,就是大模型成本高、用不起。成本降低后,開(kāi)發(fā)者和創(chuàng)業(yè)者們才可以放心大膽地做開(kāi)發(fā),企業(yè)才能夠低成本地部署大模型,最終推動(dòng)各行各業(yè)應(yīng)用的爆發(fā)。
不再將模型能力視作壁壘,而是回歸到一個(gè)產(chǎn)品、一個(gè)平臺(tái)應(yīng)有的「性?xún)r(jià)比」邏輯上來(lái)。與其說(shuō)是在卷價(jià)格,不如說(shuō)是用效率降低門(mén)檻、通過(guò)開(kāi)放構(gòu)建生態(tài)。
熱門(mén)跟貼