
8月21日,在2024火山引擎AI創(chuàng)新巡展上海站的采訪環(huán)節(jié),火山引擎總裁譚待用上面這句話,談到了大模型與云之間的關(guān)系。
他表示,無論是公有云,還是私有云,本質(zhì)上大模型都是其中的一部分,大模型私有化也是私有云的一部分;在公有云中,調(diào)用大模型,本質(zhì)上是在調(diào)用云上的一個PaaS服務,只不過這個PaaS服務特別重要。

也因此,譚待強調(diào),沒有必要把AI和云對立來看——而火山引擎作為云服務廠商的定位,是沒有變化。
不過,不得不承認的是,大模型的加持,讓火山引擎看到了它在云計算市場的未來機遇。所以,借重于這個千載難逢的機遇,火山引擎作為字節(jié)跳動的云計算業(yè)務板塊,正在花大力氣推動旗下豆包大模型的技術(shù)突破、成本降低和應用拓展,并且面向不同的行業(yè)尋找落地機遇。
從目前的情況來看,火山引擎已經(jīng)取得了具備巨大可能性的突破。
進擊的大模型:不僅僅是技術(shù)
作為火山引擎旗下的破局利器,豆包大模型的進化速度令人刮目相看。
這其中,一個典型且容易被外界感知的數(shù)據(jù)是:根據(jù)公開及內(nèi)部測評集顯示,最新版豆包大語言模型相比發(fā)布初期綜合能力提升了20.3%。
從具體的細分能力來看,豆包大模型實現(xiàn)了如下方面的提升:
- 角色扮演能力提升了38.3%,具備了更強的上下文感知,讓對話情境更連貫、角色更擬人化。
- 語言理解能力提升了33.3%,讓豆包大模型在信息分類、抽取、摘要、理解和問答等NLP方面都有了顯著提升,能夠在更多生產(chǎn)力場景中得到應用。
- 此外,模型在長文任務、數(shù)學、專業(yè)知識、代碼能力上也有不同程度的增強。
基于這些技術(shù)能力的升級,火山引擎還在本次活動中公布了多個豆包垂類模型的最新升級,具體來說:
- 豆包·文生圖模型對長文本有更精準的圖文匹配能力,多主體、多位置、手部結(jié)構(gòu)等復雜場景的生圖能力更強,更善于理解中國特色元素,創(chuàng)造更具美感的中國風圖片。
- 豆包·語音識別模型基于大語言模型豐富的知識和推理能力,通過上下文感知,提升語音識別準確性,在多個公開測試集中,與國內(nèi)公開發(fā)布的語音識別大模型相比,錯誤率最高降低40%;支持一個模型識別普通話和粵語、上海話、四川話、西安話、閩南語等方言。
- 豆包·語音合成模型升級了流式語音合成能力,能夠?qū)崟r響應、精準斷句,支持「邊想邊說」。
另外,基于上述能力,火山引擎還專門發(fā)布了對話式AI實時交互解決方案,該方案整合了豆包大模型和實時音視頻(RTC)技術(shù),提供端到端的大模型實時對話方案。
基于該方案,企業(yè)可以輕松地在自己AI應用中嵌入該實時語音功能,用戶不僅能用語音與AI進行交談,還能像平時說話一樣,在對話過程中適時打斷或插話,經(jīng)過升級后的AI聲音具備較好表現(xiàn)力和感情色彩,對話更自然、更真實、更流暢。
另外,除了模型效果,針對企業(yè)生產(chǎn)環(huán)境對AI高并發(fā)需求出發(fā),豆包通用模型pro提供了國內(nèi)最高標準的800k初始TPM(每分鐘處理tokens數(shù)量)?;谶@樣的能力,火山引擎可以在客戶高并發(fā)的對話場景要求下,幫助客戶完成多輪提示詞的優(yōu)化,并且提供充分的高并發(fā)保障,幫助客戶應對高峰場景。
總體來看,經(jīng)過技術(shù)能力的持續(xù)迭代,豆包大模型在三個月的時間里,已經(jīng)完成了新一輪肉眼可見的能力進化,涵蓋了基礎(chǔ)能力提升、垂類模型優(yōu)化、實時對話方案、高并發(fā)場景保障等多個與客戶關(guān)聯(lián)密切的方面。

除了能力本身,我們還也注意到,火山引擎還在活動現(xiàn)場介紹了一系列面向客戶的大模型相關(guān)產(chǎn)品升級點,比如說火山方舟最新推出的全周期安全可信方案、扣子專業(yè)版、HiAgent的最新能力等。
這背后,自然也離不開字節(jié)跳動本身在AI領(lǐng)域的深厚技術(shù)積累。
值得一提的是,除了技術(shù)開發(fā),火山引擎也尤其注重于降低豆包大模型的成本,從而使得它的快速走向「價值創(chuàng)造階段」。實際上,在5月15日的活動上,豆包主力模型面向企業(yè)市場就掀起了一場價格戰(zhàn),并由此掀起了行業(yè)里的大模型降價風潮。
熱門跟貼