日韩午夜国产,一区二区三区免费影院,93国产精品久久久久久,黄色网线在线看,亚洲狠狠婷婷综合久久久

作者丨青風(fēng)

編輯丨六子

DeepSeek爆火之后如何與之相處？這是擺在每個(gè)大模型廠商面前無(wú)法回避的問(wèn)題。

騰訊、百度等選擇了快速擁抱，在其旗艦AI產(chǎn)品中相繼接入滿血版DeepSeek-R1，借勢(shì)收獲了不少新用戶；字節(jié)豆包、阿里通義、月之暗面Kimi、智譜清言等選擇正面對(duì)抗，在自研大模型中增加“深度思考”模式；零一萬(wàn)物更為果斷，在大模型“六小龍”中首家宣布放棄超大參數(shù)預(yù)訓(xùn)練，未來(lái)全面轉(zhuǎn)向ToB業(yè)務(wù)。

3月31日，百度給出了一個(gè)新的答案。在昨日舉行的新一期百度AI DAY上，文小言宣布完成品牌煥新與功能升級(jí)。升級(jí)的核心點(diǎn)是，在此前接入DeepSeek-R1的基礎(chǔ)上，新版文小言進(jìn)一步開放，將百度自研的文心X1、文心4.5等最新模型與DeepSeek-R1、可靈等第三方模型進(jìn)行深度融合，并支持自動(dòng)識(shí)別用戶需求、自動(dòng)選擇最適合的模型完成任務(wù)，還升級(jí)了語(yǔ)音大模型、圖片問(wèn)答、AI生圖生視頻等多模態(tài)能力。

這意味著什么呢？之前，為了寫一段小紅書的種草文案，新媒體運(yùn)營(yíng)人員要用DeepSeek-R1；創(chuàng)作一張海報(bào)，要用國(guó)外的Midjourney或者國(guó)內(nèi)的百度文心；制作一段宮崎駿風(fēng)格的動(dòng)畫，要用快手旗下的可靈AI或者OpenAI旗下的Sora；聲音克隆可能要用海螺AI；求解一道高等數(shù)學(xué)題，幼兒園小朋友十萬(wàn)個(gè)為什么的語(yǔ)音聊天，可能還是“鴿了好久”的GPT-4o更可用……

大模型技術(shù)越來(lái)越先進(jìn)，但也越來(lái)越細(xì)分。人們處理日常問(wèn)題，可能就需要下載和使用不同的大模型產(chǎn)品及眾多的細(xì)分版本，需要分別花錢充值，更麻煩的是國(guó)外產(chǎn)品使用起來(lái)極其不便，中文適配也差。

新版文小言的策略是，一個(gè)應(yīng)用就可以完成眾多不同類型的任務(wù)。它既可以做深度思考，完整展示思維鏈，也可以進(jìn)行連續(xù)任務(wù)執(zhí)行，還因?yàn)樯?jí)了多模態(tài)能力，能與用戶進(jìn)行更自然、更高效的交互。而且，它還從“手動(dòng)檔”升級(jí)為“自動(dòng)檔”，將任務(wù)扔進(jìn)來(lái)即可，不需要用戶操心具體該使用哪個(gè)專精模型。

使用簡(jiǎn)單，交互方式自然，性能強(qiáng)大，功能豐富，這不就是人們所期待的AI助手的發(fā)展方向嗎？對(duì)百度這個(gè)AI老兵來(lái)說(shuō)，至少意味著找到了一條與新生力量的開放相處之道：優(yōu)勢(shì)互補(bǔ)，相互協(xié)作。

01
「補(bǔ)齊DeepSeek的多模態(tài)短板」

人們到底需要什么樣的AI大模型？還是史蒂夫·喬布斯的話最有道理，“用戶根本不知道想要什么，直到你展示給他看?！?/p>

在2023年大模型出現(xiàn)的早期階段，眾廠商比拼的是長(zhǎng)文本處理能力，月之暗面、百川智能、零一萬(wàn)物等廠商輪番競(jìng)技，最長(zhǎng)上下文輸入長(zhǎng)度從20萬(wàn)攀升至30萬(wàn)、40萬(wàn)字；2024年初，Sora橫空出世，5月份GPT-4o正式發(fā)布，讓人們驚呼科幻走進(jìn)現(xiàn)實(shí)，AI生圖、AI視頻等多模態(tài)能力的發(fā)展貫穿全年始終；2025年初，DeepSeek-R1憑借強(qiáng)大的推理能力和極致性價(jià)比，攪動(dòng)整個(gè)科技行業(yè)，將人們的關(guān)注重新拉回文字形態(tài)的通用大模型。

但在DeepSeek全面普及之后，人們發(fā)現(xiàn)，在圖片與拍照、視頻與攝像、語(yǔ)音輸入與輸出等與AI更自然的交互方面，仍然沒(méi)有得到很好地滿足。最近，GPT-4o升級(jí)，上線了“用嘴P圖”功能，“吉卜力風(fēng)”圖片刷爆AI圈，讓千千萬(wàn)萬(wàn)設(shè)計(jì)師們?nèi)巳俗晕?。再次證明，多模態(tài)能力一直留存在人們潛意識(shí)的需求菜單里，且需求巨大。

DeepSeek固然強(qiáng)大，但在多模態(tài)方面存在明顯的短板，僅限于在圖片和拍照中識(shí)別里面的文字?？梢哉f(shuō)，DeepSeek的輸入輸出全部都是文字的。騰訊元寶接入了DeepSeek-R1，但只是解決了DeepSeek官方應(yīng)用“服務(wù)器繁忙”的問(wèn)題，也沒(méi)有帶來(lái)多模態(tài)的增益價(jià)值。

而新版文小言將百度兩大新模型文心大模型X1和4.5與DeepSeek-R1滿血版，進(jìn)行了多模型融合調(diào)度。用戶可以隨意切換使用，或者更省事地選擇“自動(dòng)模式”。百度這兩個(gè)新模型在推理和多模態(tài)方面各有側(cè)重。

文心X1與DeepSeek-R1類似，都是深度思考模型，但文心X1是宣稱“首個(gè)”能自主調(diào)用比如繪圖等各種工具的，可以完成?些連續(xù)任務(wù)。它利用遞進(jìn)式強(qiáng)化學(xué)習(xí)訓(xùn)練方法、基于思維鏈和行動(dòng)鏈的端到端訓(xùn)練、多元統(tǒng)一的獎(jiǎng)勵(lì)系統(tǒng)等技術(shù)，推理輸出直接可以圖文混合呈現(xiàn)。

文心大模型4.5是百度自主研發(fā)的新一代原生多模態(tài)基礎(chǔ)大模型，在多模態(tài)交互、理解方面更強(qiáng)，原生模型聯(lián)合預(yù)訓(xùn)練能實(shí)現(xiàn)更深層次的模態(tài)融合。拍圖解題，文生圖，讓圖片動(dòng)起來(lái)，AI語(yǔ)音聊天，都可以很好地實(shí)現(xiàn)。

其語(yǔ)音大模型此次也進(jìn)行了全新升級(jí)，使用起來(lái)頗有亮點(diǎn)，比如它支持方言對(duì)話、復(fù)雜知識(shí)問(wèn)答及隨時(shí)打斷等場(chǎng)景，用戶可進(jìn)行語(yǔ)音知識(shí)問(wèn)答或趣味角色扮演。

百度語(yǔ)音首席架構(gòu)師賈磊透露，該模型是百度在業(yè)界首個(gè)推出、基于全新互相關(guān)注意力(Cross-Attention)的端到端語(yǔ)音語(yǔ)言大模型。在語(yǔ)音場(chǎng)景滿足一定交互指標(biāo)下，大模型調(diào)用成本比行業(yè)平均降低50%-90%，推理響應(yīng)速度極快，將語(yǔ)音交互等待時(shí)間壓縮至1秒左右，極大提升了交互流暢性。

02
「更多場(chǎng)景更多玩法」

借助多模型融合和多模態(tài)理解，新版文小言帶來(lái)更多的用戶真實(shí)存在的AI使用場(chǎng)景和更大的想象空間。

像上面提到的，動(dòng)畫愛好者如果想制作一段視頻，往往要先用DeepSeek生成提示詞，再用Midjourney文生圖，再拿到可靈AI中做圖生視頻?，F(xiàn)在文小言可以一條龍解決了。比如讓愛因斯坦彈吉他，邊彈邊跳。

*圖源文小言，愛因斯坦彈吉他AI視頻（GIF）

還有個(gè)非常常見的場(chǎng)景，家里客廳裝修，有一整扇落地窗，想?yún)⒖紟讉€(gè)不同的風(fēng)格設(shè)計(jì)。用白話給文小言輸入提示詞后，文心X1會(huì)進(jìn)行深度思考，然后調(diào)用搜索、畫圖等多種工具，最后生成多張效果圖，每張都附有該風(fēng)格的設(shè)計(jì)說(shuō)明，圖文混排輸出，清晰明了。

*圖源文小言，裝修設(shè)計(jì)示例（GIF）

再比如輔導(dǎo)孩子功課，讓很多家長(zhǎng)頭疼，因?yàn)楹芏囝}目可能自己也不會(huì)做。新版文小言中新增了一個(gè)“解題老師”，直接對(duì)題目拍照，它就可以生成解答。神奇的是，它還有老師講解的視頻，不只給出答案，還給出詳細(xì)的做題思路和步驟，用語(yǔ)音和視頻展示娓娓道來(lái)。就像個(gè)一對(duì)一的家教，而且是免費(fèi)的。這種多模態(tài)解題功能的難得之處在于，它不是簡(jiǎn)單地給孩子提供答案，而是指導(dǎo)了做題方法，傳統(tǒng)大模型僅通過(guò)文字很難達(dá)到這種效果。

文小言新的端到端語(yǔ)音模型能夠識(shí)別兒童的含糊發(fā)音，理解能力更符合兒童的習(xí)慣包括快速打斷與響應(yīng)。比如要求它給孩子講個(gè)故事，如果不愛聽，孩子直接打斷要求換一個(gè)，文小言能絲滑銜接，不會(huì)再出現(xiàn)之前智能語(yǔ)音那種“你說(shuō)你的，我講我的”的尷尬局面。它還能切換蠟筆小新、孫悟空、熊大熊二等百變音色，更學(xué)會(huì)了重慶話、河南話、廣西話等多種方言。

03
「寫在最后」

?模型馬拉松競(jìng)賽進(jìn)?“深?區(qū)”，因?yàn)橛脩粽鎸?shí)需求的多樣性，導(dǎo)致未來(lái)的競(jìng)爭(zhēng)不可能再是單?模型的能?，?是如何讓AI能?更?效、更便捷地觸達(dá)?戶。

百度在AI大模型領(lǐng)域深耕多年，在AI搜索、檢索增強(qiáng)的文生圖技術(shù)（iRAG）、無(wú)代碼工具、智能體生態(tài)構(gòu)建等方面積累了很多經(jīng)驗(yàn)，尤其是擁有海量的中文語(yǔ)料庫(kù)，這比一眾國(guó)外產(chǎn)品具備明顯的本地化優(yōu)勢(shì)。

在增強(qiáng)自身能力之外，百度近期也愈發(fā)體現(xiàn)出開放升級(jí)的姿態(tài)。將DeepSeek兩款大模型上架至千帆ModelBuilder平臺(tái)；宣布搜索引擎和智能體平臺(tái)接入DeepSeek；文心一言全面免費(fèi)；宣布文心大模型系列開源；如今，文小言新版App又將最新模型與DeepSeek深度融合，多模態(tài)能力大幅提高。

文小言采用“模型矩陣+自動(dòng)調(diào)度+生態(tài)開放”的策略，試圖構(gòu)建一條具有持續(xù)競(jìng)爭(zhēng)力的產(chǎn)品護(hù)城河。這一趨勢(shì)或許將成為未來(lái)AI演進(jìn)的主線。而在這個(gè)過(guò)程中，用戶體驗(yàn)得以不斷提升，將是最大的受益者。