3月31日,在新一期百度AIDAY上,百度旗下的文小言正式宣布完成品牌煥新與功能升級,以嶄新的姿態(tài)進(jìn)軍AI應(yīng)用市場,為用戶帶來更為智能、高效的使用感受。此次升級不僅體現(xiàn)在品牌視覺形象的煥然一新,更聚焦于模型開放與功能創(chuàng)新,通過支持多模型融合調(diào)度,升級全新語音大模型、圖片問答、AI生圖生視頻等多項(xiàng)核心能力,為用戶構(gòu)建了一個全方位、多層次的AI交互體系。

圖片來源:未來圖靈拍攝
打開網(wǎng)易新聞 查看精彩圖片
圖片來源:未來圖靈拍攝

百度AI產(chǎn)品創(chuàng)新業(yè)務(wù)負(fù)責(zé)人薛蘇強(qiáng)調(diào):“AI的未來不再是單純的技術(shù)參數(shù)比拼,而是如何通過多模型協(xié)同,真正為用戶創(chuàng)造價(jià)值。文小言希望通過開放生態(tài),整合頂尖模型能力,打造出更強(qiáng)大、更易用的AI產(chǎn)品?!?/p>

多模型融合,鑄就AI“超級大腦”

據(jù)介紹,文小言此次升級的核心亮點(diǎn)在于“多模型融合調(diào)度”。它整合了百度自研的文心X1、文心4.5等頂尖模型,并接入DeepSeek-R1、可靈等第三方優(yōu)質(zhì)模型,實(shí)現(xiàn)了多模型間的智能協(xié)同。用戶只需選擇“自動模式”,文小言就能依據(jù)用戶的需求和問題特性,智能匹配并一鍵調(diào)用最優(yōu)模型組合;用戶也可根據(jù)自身對模型的了解及特定任務(wù)需求,靈活選擇單一模型執(zhí)行任務(wù),大幅提升響應(yīng)速度與任務(wù)處理能力。

打開網(wǎng)易新聞 查看精彩圖片

在實(shí)際應(yīng)用中,文小言的多模型融合調(diào)度展現(xiàn)出強(qiáng)大的優(yōu)勢。當(dāng)用戶提出“設(shè)計(jì)三種風(fēng)格的南偏東客廳效果圖”的需求時(shí),文小言能夠迅速精準(zhǔn)解析裝修風(fēng)格差異,調(diào)用文心X1完成深度推理,從空間布局、色彩搭配到家具選擇等多個維度進(jìn)行構(gòu)思,最終生成三幅風(fēng)格迥異但視角一致的裝修效果圖,滿足用戶對多樣化設(shè)計(jì)的需求。而當(dāng)用戶隨手拍攝一張茅臺鎮(zhèn)的照片并詢問相關(guān)信息時(shí),文小言可調(diào)用文心4.5的多模態(tài)分析能力,精準(zhǔn)識別出照片中的地理位置、當(dāng)?shù)禺a(chǎn)業(yè)、建筑風(fēng)格等詳細(xì)信息,為用戶提供全面且深入的解讀。

功能升級,解鎖AI應(yīng)用新場景

除了多模型融合調(diào)度這一核心升級外,文小言在功能層面也實(shí)現(xiàn)了全面突破,進(jìn)一步提升了全新語音大模型、圖片問答、AI生圖生視頻等能力,全方位優(yōu)化用戶體驗(yàn)。

全新語音大模型為用戶帶來了前所未有的交互體驗(yàn)。該模型支持方言對話,無論是重慶話的火辣熱情、廣西話的獨(dú)特韻味,還是河南話、廣東話、山東話等各具特色的方言,文小言都能流暢識別并進(jìn)行回應(yīng),讓用戶在與AI交流時(shí)感受到濃厚的地域親切感。

同時(shí),它還能應(yīng)對復(fù)雜知識問答,無論是科學(xué)難題、歷史典故還是文化藝術(shù)等方面的問題,文小言都能憑借強(qiáng)大的知識儲備和智能分析能力給出準(zhǔn)確解答。此外,用戶在交流過程中可以隨時(shí)打斷,進(jìn)行趣味角色扮演,如模擬與名人對話、進(jìn)行故事接龍等。

打開網(wǎng)易新聞 查看精彩圖片

百度語音首席架構(gòu)師賈磊透露,該模型是百度在業(yè)界首個推出、基于全新互相關(guān)注意力(Cross-Attention)的端到端語音語言大模型。

在語音場景滿足一定交互指標(biāo)下,大模型調(diào)用成本比行業(yè)平均降低50%-90%,推理響應(yīng)速度極快,將語音交互等待時(shí)間壓縮至1秒左右,極大提升了交互流暢性。同時(shí),在大模型加持下,實(shí)現(xiàn)了流式逐字的LLM驅(qū)動的多情感語音合成,情感飽滿、逼真、擬人,交互聽感也得到極大提升。

圖片問答功能同樣是此次升級的一大亮點(diǎn)。用戶可以通過拍攝或上傳圖片,以文字或語音提問的方式直接獲取深度解析。

打開網(wǎng)易新聞 查看精彩圖片

在教育領(lǐng)域,學(xué)生拍攝一道數(shù)學(xué)題,文小言可實(shí)時(shí)生成解題思路與視頻解析,幫助學(xué)生理解題目背后的知識點(diǎn)和解題方法,就像擁有一位隨時(shí)在線的專屬輔導(dǎo)老師。在購物場景中,用戶上傳多款商品圖,文小言能快速對比參數(shù)、價(jià)格,輔助購物決策,幫助用戶挑選到性價(jià)比最高的商品。對于設(shè)計(jì)師而言,拍攝杯子設(shè)計(jì)圖后,AI可自動解析風(fēng)格并生成同款手機(jī)殼、支架等周邊產(chǎn)品,為設(shè)計(jì)靈感的拓展和產(chǎn)品衍生提供了便捷途徑。

值得一提的是,新增的“圖個冷知識”功能更富趣味性。用戶可預(yù)設(shè)“歷史學(xué)者”“科技達(dá)人”等人設(shè)視角,為同一圖片賦予多維解讀。當(dāng)用戶詢問“貓窗探秘,為何貓愛窗邊的科學(xué)真相?”時(shí),文小言能從狩獵本能、能量獲取、領(lǐng)地意識等多個角度給出獨(dú)特解讀。

打開網(wǎng)易新聞 查看精彩圖片

薛蘇在現(xiàn)場表示,模型競爭之上是產(chǎn)品競爭,再之上是營銷競爭。就當(dāng)前大模型領(lǐng)域來看,模型競爭最為激烈,其次是產(chǎn)品競爭,最上層是營銷競爭。由于模型和產(chǎn)品發(fā)展迅猛,其實(shí)最好的營銷就是模型本身的技術(shù)實(shí)力,傳統(tǒng)營銷手段雖有作用,但會被模型與技術(shù)發(fā)展弱化。所以,文小言格外關(guān)注模型側(cè)和產(chǎn)品側(cè)進(jìn)展。

他認(rèn)為,模型側(cè)呈現(xiàn)幾個趨勢,一是模型愈發(fā)強(qiáng)大,像傳統(tǒng)推理模型、知覺模型的通用大模型都在變強(qiáng),多模態(tài)模型也越來越多且性能提升。而在應(yīng)用層、產(chǎn)品層,還有很多可做的事。如何利用好新模型,真正解決用戶實(shí)際問題,是產(chǎn)品層當(dāng)下重要之事。

“百度在模型層和產(chǎn)品層都在發(fā)力。一方面,我們有更好的自研模型,也在合理調(diào)度外部模型。作為AI創(chuàng)新產(chǎn)品負(fù)責(zé)人,我們團(tuán)隊(duì)核心精力聚焦于產(chǎn)品創(chuàng)新,要把綜合模型更好地應(yīng)用起來,在模型基礎(chǔ)上構(gòu)建最好的應(yīng)用是我們接下來的重點(diǎn)。今天談到的應(yīng)用只是開端,未來我們會致力于做好應(yīng)用,為大家提供真正好用的產(chǎn)品,也請大家期待我們未來更多更好的產(chǎn)品。”薛蘇說道。