青春草视频在线看,欧美一区成人网,亚洲精品视频日本,好男人高清在线视频,男男黄色免费网站

百度升級文小言：多模型調(diào)度、語音大模型與圖片問答

20社

2025-04-01 15:16 ·北京 ·優(yōu)質(zhì)娛樂領(lǐng)域創(chuàng)作者

3月31日，新一期百度AI DAY上，文小言宣布完成品牌煥新與功能升級。除品牌視覺形象煥新外，文小言聚焦模型開放與功能創(chuàng)新，支持多模型融合調(diào)度，升級全新語音大模型、圖片問答、AI生圖生視頻等多項(xiàng)能力，為用戶帶來更智能、更高效的AI體驗(yàn)。

百度AI產(chǎn)品創(chuàng)新業(yè)務(wù)負(fù)責(zé)人薛蘇強(qiáng)調(diào)：“AI的未來不再是單純的技術(shù)參數(shù)比拼，而是如何通過多模型協(xié)同，真正為用戶創(chuàng)造價(jià)值。文小言希望通過開放生態(tài)，整合頂尖模型能力，做出更強(qiáng)大、更簡單的AI產(chǎn)品?！?/p>

01、多模型融合：打造AI“超級大腦”，重新定義用戶體驗(yàn)

文小言此次升級的核心亮點(diǎn)在于“多模型融合調(diào)度”。通過整合百度自研的文心X1、文心4.5等頂尖模型，并接入DeepSeek-R1、可靈等第三方優(yōu)質(zhì)模型，文小言實(shí)現(xiàn)了多模型間的智能協(xié)同。用戶只需選擇“自動(dòng)模式”，即可一鍵調(diào)用最優(yōu)模型組合，或根據(jù)需求靈活選擇單一模型完成特定任務(wù)，大幅提升響應(yīng)速度與任務(wù)處理能力。

以“設(shè)計(jì)三種風(fēng)格的南偏東客廳效果圖”為例，文小言能夠精準(zhǔn)解析裝修風(fēng)格差異，調(diào)用文心X1完成深度推理，生成三幅風(fēng)格迥異但視角一致的裝修效果圖；隨手拍攝一張茅臺鎮(zhèn)的照片，文小言就可以調(diào)用文心4.5的多模態(tài)分析能力，精準(zhǔn)識別出地理位置、當(dāng)?shù)禺a(chǎn)業(yè)、建筑風(fēng)格等詳細(xì)信息。

02、?功能升級：全新語音大模型、圖片問答，解鎖AI應(yīng)用新場景

此次功能升級，文小言進(jìn)一步提升了全新語音大模型、圖片問答、AI生圖生視頻等能力，全面優(yōu)化用戶體驗(yàn)。

全新語音大模型支持方言對話、復(fù)雜知識問答及隨時(shí)打斷等場景，用戶可進(jìn)行語音知識問答或趣味角色扮演。

百度語音首席架構(gòu)師賈磊透露，該模型是百度在業(yè)界首個(gè)推出、基于全新互相關(guān)注意力(Cross-Attention)的端到端語音語言大模型。在語音場景滿足一定交互指標(biāo)下，大模型調(diào)用成本比行業(yè)平均降低50%-90%，推理響應(yīng)速度極快，將語音交互等待時(shí)間壓縮至1秒左右，極大提升了交互流暢性。同時(shí)，在大模型加持下，實(shí)現(xiàn)了流式逐字的LLM驅(qū)動(dòng)的多情感語音合成，情感飽滿、逼真、擬人，交互聽感也得到極大提升。

圖片問答功能讓用戶可以通過拍攝或上傳圖片，以文字或語音提問直接獲取深度解析。例如，拍攝一道數(shù)學(xué)題可實(shí)時(shí)生成解題思路與視頻解析；上傳多款商品圖可對比參數(shù)、價(jià)格，輔助購物決策；拍攝杯子設(shè)計(jì)圖后，AI可自動(dòng)解析風(fēng)格并生成同款手機(jī)殼、支架等周邊產(chǎn)品。

值得一提的是，新增的“圖個(gè)冷知識”功能更富趣味性，用戶可預(yù)設(shè)“歷史學(xué)者”“科技達(dá)人”等人設(shè)視角，為同一圖片賦予多維解讀。例如，當(dāng)用戶詢問“貓窗探秘，為何貓愛窗邊的科學(xué)真相？"，文小言能從狩獵本能、能量獲取、領(lǐng)地意識等角度給出獨(dú)特解讀。