
作者|冰拿鐵
編輯|星奈
媒體|AI大模型工場
模圈代有才人出,各領(lǐng)風(fēng)騷幾十天。還沒從DeepSeek的“技術(shù)眩暈”中緩過來,百度又給我?guī)砹藘|點(diǎn)小沖擊——3月16日,百度正式發(fā)布文心大模型4.5及文心大模型X1,性能遠(yuǎn)超預(yù)期,并宣布提前免費(fèi):
目前,兩款模型已在文心一言官網(wǎng)上線,免費(fèi)向用戶開放。據(jù)介紹,文心大模型4.5是百度首個(gè)原生多模態(tài)大模型,其多模態(tài)理解、文本和邏輯推理能力顯著提升,在多項(xiàng)測試中表現(xiàn)優(yōu)于GPT4.5,API調(diào)用價(jià)格僅為GPT4.5的1%;文心大模型X1為深度思考模型,性能對標(biāo)DeepSeek-R1,調(diào)用價(jià)格約為R1的一半。
其中,作為百度新一代基座大模型,文心大模型4.5的多項(xiàng)基準(zhǔn)測試成績優(yōu)于GPT4.5、DeepSeek-V3等,并在平均分上以79.6分高于GPT4.5的79.14分。


剛一發(fā)布,海外博主瞬間不淡定了,紛紛點(diǎn)贊稱炸裂。沒有對比就沒有傷害,甚至有博主轉(zhuǎn)發(fā)了百度的官推并直言:“美國AI公司(就該像這樣)把全部時(shí)間花在開發(fā)和創(chuàng)新上,而不是無所事事地閑逛,一邊祈禱自己受到保護(hù)、不必競爭。這是缺乏自信的糟糕表現(xiàn)!”

那么,此次的“文心雙雄”都帶來了哪些維度的性能提升?據(jù)悉,文心大模型4.5通過多個(gè)模態(tài)聯(lián)合建模實(shí)現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進(jìn)的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。而文心大模型X1具備“長思維鏈”,擅長中文知識問答、文學(xué)創(chuàng)作、邏輯推理等,而且增加了多模態(tài)能力和多工具調(diào)用,能理解和生成圖片,還能調(diào)用工具生成代碼、圖表等豐富內(nèi)容。
技術(shù)vs成本雙殺背后,文心4.5和X1表現(xiàn)究竟如何?背后又有哪些“技術(shù)秘籍”?
一、實(shí)測文心4.5千般武藝:多模態(tài)能力最驚艷!
在DeepSeek毒打后,我對文心4.5的多模態(tài)能力十分期待:此前,DeepSeek哪里都好,但遺憾的是多模態(tài)能力實(shí)在太弱,深度理解圖片都費(fèi)勁,更別提看音視頻了,導(dǎo)致和DeepSeek溝通時(shí)只能采取最“原始”的文字交流方式,常常給我一種“5G內(nèi)容,2G形式”既視感,每次使用都意猶未盡。
因此,此次我們在圖片理解、視頻分析等場景對文心4.5重點(diǎn)展開測評:
首先,再牛的AI也得經(jīng)得住抽象網(wǎng)友的毒打,幾個(gè)梗圖下來,文心4.5分分鐘秒懂化身開了八倍鏡的鑒梗大師,細(xì)節(jié)捕捉與推理深度在線,點(diǎn)出梗圖的巧妙和幽默。


外行看熱鬧,內(nèi)行看門道,能讀懂梗圖背后,要求大模型有很強(qiáng)的綜合能力:要精準(zhǔn)識別流行文化符號,構(gòu)建文化共識庫;要具備跨次元關(guān)聯(lián)力,才能看懂跨時(shí)空混搭梗,這要求模型構(gòu)建起“古典-現(xiàn)代”知識圖譜,實(shí)現(xiàn)符號的時(shí)空穿越式理解;同時(shí),也要構(gòu)建起反諷與雙關(guān)語“解碼器”,將黑話轉(zhuǎn)化為直白邏輯,建立情緒強(qiáng)度坐標(biāo)系……
然后,上幾道圖片內(nèi)容判斷題:上傳景點(diǎn)實(shí)拍、電影截圖喂給文心4.5,其分分鐘指出意義、?途是什么、位置在哪里等關(guān)鍵因素,福爾摩斯·文心4.5上線!


在接下來音視頻判斷題環(huán)節(jié),文心4.5也毫不遜色:上傳音頻,文心4.5分分鐘聽歌識曲,網(wǎng)易云哭暈在廁所。


上傳視頻,文心4.5化身語文課代表總結(jié)視頻主旨,是我的吃瓜搭子實(shí)錘了!
輸入甄嬛傳視頻,其也能準(zhǔn)確識別出為哪一集,鑒定為甄學(xué)家十級!
上傳財(cái)報(bào)圖表,其也能準(zhǔn)確算出毛利率和凈利率
接下來,在AI圖片生成維度,讓文心4.5替我打工,畫點(diǎn)圖看看!“如果??下?輛車要造?卡?,可能造成什么樣?”“畫個(gè)甄嬛騎摩托?”,結(jié)果可見,文心4.5 iRAG圖??成能?在線,可準(zhǔn)確?成主流?物和物品,?幻覺。


——綜上,文心4.5多模態(tài)能力確實(shí)在線,能對文字、圖片、音頻、視頻等內(nèi)容進(jìn)行綜合理解,相當(dāng)于給AI裝上了超級感官中樞+語言大師芯片+文化記憶詞典,不僅多模態(tài)理解能力優(yōu)秀,且具備了更精進(jìn)的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。
那么,文心4.5背后究竟有怎樣的技術(shù)路徑?
文心4.5采用多模態(tài)異構(gòu)專家擴(kuò)展技術(shù),根據(jù)模態(tài)特點(diǎn)構(gòu)建模態(tài)異構(gòu)專家,結(jié)合自適應(yīng)模態(tài)感知損失函數(shù),解決不同模態(tài)梯度不均衡問題,提升多模態(tài)融合能力。
接下來,測評文心X1看看!
二、多工具調(diào)用王文心X1:DeepSeek深度思考力半價(jià)購,打通格式“任意流”?
一番測評下來,我們發(fā)現(xiàn),文心大模型X1具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),是首個(gè)自主運(yùn)用工具的深度思考模型。作為能力更全面的深度思考模型,兼?zhèn)錅?zhǔn)確、創(chuàng)意和文采,在邏輯推理、復(fù)雜計(jì)算及?具調(diào)?等??表現(xiàn)尤為出?。
能夠潤色小說:
也能?成高情商回答,成打工人嘴替
還能做“證明‘對于任意正整數(shù)n,n 5?n能被30整除’”這種步驟很多、難度系數(shù)高的證明題。


值得一提的是,文心X1還有一個(gè)很驚艷的特色——多工具調(diào)用,可顯著擴(kuò)展模型自身邊界,高效、精準(zhǔn)、有效解決現(xiàn)實(shí)中復(fù)雜任務(wù)。
問“已知我?節(jié)課都沒上,如何在3天之內(nèi)通過高數(shù)考試”,文心X1調(diào)??級聯(lián)??具,按?時(shí)做出了學(xué)習(xí)計(jì)劃,給出?數(shù)考試重點(diǎn)和推薦教材,有效性很強(qiáng)。

為大學(xué)生操碎了心的X1,密密麻麻列了三頁
目前,文心X1已?持?級搜索、?檔問答、圖?理解、AI繪圖、代碼解釋器、??鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢、詞云?成等多款?具。
多工具調(diào)用下,文心X1開啟“任意流”模式,打破格式次元壁:可以喂給其根據(jù)word內(nèi)容,讓其從低到?排列員?的?資,整理成Excel?檔給我,可見其調(diào)??檔問答、代碼解釋器,分分鐘吐出一個(gè)excel!

而上傳圖片,問文心X1想要做這道菜需要哪些?序,它也可以?成pdf?件發(fā)給我。

——這讓我想起了之前百度文庫上炒雞好用、讓格式任意流轉(zhuǎn)的自由畫布。布,是你嗎?文心X1一口氣吃了幾個(gè)自由畫布?
透視文心X1背后的技術(shù)支撐可見,其運(yùn)用了遞進(jìn)式強(qiáng)化學(xué)習(xí)、基于思維鏈和行動鏈的端到端訓(xùn)練、多元統(tǒng)一的獎(jiǎng)勵(lì)系統(tǒng)等關(guān)鍵技術(shù),并通過飛槳與文心的聯(lián)合優(yōu)化,實(shí)現(xiàn)從壓縮、推理、服務(wù)部署的全鏈路極致調(diào)優(yōu),大幅降低推理成本。
通俗來說,遞進(jìn)式強(qiáng)化學(xué)習(xí)就像是模圈的游戲闖關(guān)制特訓(xùn)營,以“打怪升級”模式,讓AI從青銅菜鳥逐步進(jìn)化成“全服第一”,在創(chuàng)作、搜索、工具調(diào)用、推理等場景全面提升模型的綜合應(yīng)用能力;同時(shí),針對深度搜索、工具調(diào)用等場景,根據(jù)結(jié)果反饋進(jìn)行端到端的模型訓(xùn)練,顯著提升訓(xùn)練效果。
前有DeepSeek的史詩性更新,后有百度加速技術(shù)突破,并把成本一再擊穿地心:當(dāng)下,眾廠商共努力下,AI正加速進(jìn)入“水電煤時(shí)代”。
三、百度此輪更新:主權(quán)個(gè)體加速誕生,AI進(jìn)入水電煤時(shí)代
目前,兩款模型均已在文心一言官網(wǎng)上線,用戶登錄即可免費(fèi)體驗(yàn)。同時(shí),企業(yè)及開發(fā)者可在百度智能云千帆大模型平臺調(diào)用新模型,文心大模型4.5已同步上線,輸入價(jià)格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價(jià)格的1%;文心大模型X1定價(jià)為輸入0.002元/千tokens,輸出0.008元/千tokens,即將在千帆平臺上線。

這價(jià)格讓我感慨,百度越來越實(shí)在了,不搞虛頭巴腦的概念,直接甩出免費(fèi)體驗(yàn)入口和白菜價(jià)API,明擺著是要把AI變成新時(shí)代的水電煤,讓開發(fā)者、企業(yè)都能像接自來水一樣調(diào)用智能。
于個(gè)人維度,“主權(quán)個(gè)體”將加速誕生?!吨鳈?quán)個(gè)體》(The Sovereign Individual)一書中,詹姆斯·戴爾·戴維森預(yù)言,在未來的世界里,能夠自力更生、精通技術(shù)的個(gè)體將掌控自己的未來,成為最強(qiáng)大的“主權(quán)個(gè)體”。如今,手握能思考也能干活、無比全面的文心系列大模型,打工人再次進(jìn)化,“一個(gè)人統(tǒng)領(lǐng)一支AI團(tuán)隊(duì)”照進(jìn)現(xiàn)實(shí)。
而從行業(yè)角度,文心4.5及X1的技術(shù)突破將推動AI在更多實(shí)際應(yīng)用場景中發(fā)揮價(jià)值,從智能搜索、企業(yè)辦公、科研輔助到代碼生成等領(lǐng)域,進(jìn)一步賦能各行業(yè)的數(shù)字化升級,助力AI技術(shù)真正走向生產(chǎn)力變革的新階段,讓AI水電煤時(shí)代加速到來,也推動AI新世界向著普惠、高效的星辰大海,揚(yáng)帆起航。
熱門跟貼