
百度創(chuàng)始人、CEO李彥宏
4月25日消息,鈦媒體AGI獲悉,今天上午武漢舉行的百度Create開(kāi)發(fā)者大會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏正式發(fā)布文心大模型4.5 Turbo和文心大模型X1 Turbo。
李彥宏認(rèn)為,當(dāng)下以DeepSeek為代表的部分模型仍然存在模態(tài)單一、幻覺(jué)高、速度慢和價(jià)格貴等問(wèn)題,而百度發(fā)布這兩款新模型,正是為了解決這些問(wèn)題。
李彥宏在演講中表示,DeepSeek橫空出世,MCP(模型上下文協(xié)議)逐漸被接受為行業(yè)標(biāo)準(zhǔn),代碼智能體和通用智能體等多智能體協(xié)作產(chǎn)品被廣泛關(guān)注,越來(lái)越多的人加入到開(kāi)發(fā)者的隊(duì)伍。過(guò)去一年,開(kāi)源中國(guó)社區(qū)增加了150萬(wàn)個(gè)開(kāi)發(fā)者,但同時(shí),不少開(kāi)發(fā)者充滿(mǎn)了焦慮,模型迭代這么快,模型能力也越來(lái)越強(qiáng),那么開(kāi)發(fā)者基于大模型開(kāi)發(fā)出來(lái)的應(yīng)用,會(huì)不會(huì)很快就過(guò)時(shí),就沒(méi)有價(jià)值了——這種擔(dān)心不無(wú)道理。
“大模型的世界風(fēng)云變幻,幾乎每周都有發(fā)布,天天有更新。去年第四季度有49個(gè)大模型更新發(fā)布,今年一季度就有55個(gè),最多的時(shí)候一周發(fā)8個(gè)模型。一邊,大模型的廠(chǎng)商卷生卷死,另外一邊對(duì)于開(kāi)發(fā)者來(lái)說(shuō)又無(wú)所適從,不敢放心大膽的做應(yīng)用,為什么?因?yàn)閾?dān)心自己做的應(yīng)用被模型迭代給快速覆蓋掉,這樣就相當(dāng)于是白費(fèi)了功夫?!崩顝┖攴Q(chēng)。
李彥宏認(rèn)為,當(dāng)前對(duì)于開(kāi)發(fā)者來(lái)說(shuō)是一把雙刃劍。一方面,開(kāi)發(fā)者確實(shí)需要理解技術(shù)發(fā)展的趨勢(shì),避開(kāi)大模型自身發(fā)展的延長(zhǎng)線(xiàn);另一方面,日益強(qiáng)大的模型能力其實(shí)給開(kāi)發(fā)者帶來(lái)了更多選擇,需要找對(duì)場(chǎng)景、選對(duì)基礎(chǔ)模型。
李彥宏強(qiáng)調(diào),AI應(yīng)用才是真正創(chuàng)造價(jià)值的。沒(méi)有AI應(yīng)用,什么模型、什么芯片其實(shí)都沒(méi)有價(jià)值。
這是李彥宏對(duì)于 AI 技術(shù)行業(yè)的最新言論。
早前,李彥宏曾表示,中國(guó)的大模型太多。國(guó)內(nèi)有200多個(gè)大模型其實(shí)都沒(méi)有什么使用量。他還曾指出,百模大戰(zhàn)是對(duì)社會(huì)資源的極大浪費(fèi),更多資源應(yīng)該放在超級(jí)應(yīng)用。同時(shí),包括百度在內(nèi)的大公司內(nèi)部反應(yīng)太慢、生產(chǎn)力落后。
2024年7月,李彥宏直言開(kāi)源模型就是“智商稅”。“當(dāng)你理性地去想,大模型能夠帶來(lái)什么價(jià)值,以什么樣的成本帶來(lái)價(jià)值的時(shí)候,就會(huì)發(fā)現(xiàn),你永遠(yuǎn)應(yīng)該選擇閉源模型。今天無(wú)論是ChatGPT、還是文心一言等閉源模型,一定比開(kāi)源模型更強(qiáng)大,推理成本更低?!?/p>
2024年4月百度Create大會(huì)上,李彥宏再度表示,同等效果下,成本明顯更低,所以開(kāi)源 AI 模型會(huì)越來(lái)越落后。隨著今年中國(guó)開(kāi)源AI大模型DeepSeek-V3/R1風(fēng)靡全球之后,李彥宏的這句話(huà)再被熱議。
李彥宏曾強(qiáng)調(diào),大模型的算力推理其實(shí)很貴。所以說(shuō)開(kāi)源大模型的價(jià)值在教學(xué)科研這些領(lǐng)域,要想搞清楚大模型的工作原理是什么,如果不知道源代碼什么的肯定是有劣勢(shì)的,但是真正在商業(yè)領(lǐng)域,當(dāng)你追求的是效率、效果,追求的是最低的成本時(shí),開(kāi)源模型是沒(méi)有優(yōu)勢(shì)的。
李彥宏表示,DeepSeek不是萬(wàn)能的,比如它只能處理文本,還不能夠理解聲音、圖片、視頻等多模態(tài)內(nèi)容,而百度智能云的很多客戶(hù)都需要這種多模理解和生成的能力;同時(shí)再比如,它的幻覺(jué)率比較高,在很多場(chǎng)合你不能夠放心使用,如果在電商直播當(dāng)中幻覺(jué)出“買(mǎi)一送一”的優(yōu)惠,那么商家就要賠慘了;此外,中國(guó)市場(chǎng)上絕大多數(shù)大模型API的調(diào)用的價(jià)格都比DeepSeek滿(mǎn)級(jí)版要低,而且反應(yīng)速度也更快。

如今,李彥宏發(fā)布全新文心大模型4.5 Turbo和文心大模型X1 Turbo。對(duì)比文心4.5,Turbo版速度更快、價(jià)格下降80%,每百萬(wàn)tokens的輸入價(jià)格僅為0.8元,輸出價(jià)格3.2元,僅為DeepSeek-V3的40%;而文心大模型X1 Turbo價(jià)格,僅為DeepSeek R1調(diào)用價(jià)格的25%,輸入價(jià)格1元/百萬(wàn)tokens,輸出價(jià)格4元/百萬(wàn)tokens。
此外,百度還公布基于昆侖芯三代P800的中國(guó)首個(gè)點(diǎn)亮的全自研的3萬(wàn)卡集群,李彥宏稱(chēng)其同時(shí)承載多個(gè)滿(mǎn)血版DeepSeek這樣千億參數(shù)大模型進(jìn)行全量訓(xùn)練,也可以支持1000個(gè)客戶(hù)做百億參數(shù)大模型精調(diào)。
“現(xiàn)在可以說(shuō),在中國(guó)開(kāi)發(fā)應(yīng)用,我們有底氣?!崩顝┖暝谘葜v結(jié)尾表示,堅(jiān)信應(yīng)用創(chuàng)造未來(lái),開(kāi)發(fā)者創(chuàng)造未來(lái)。
(本文首發(fā)于鈦媒體App,作者|林志佳)
熱門(mén)跟貼