編輯 | 虞爾湖

出品 | 潮起網(wǎng)「于見專欄」

2024年,全球大模型競爭進(jìn)入“深水區(qū)”,國產(chǎn)AI廠商中,字節(jié)跳動(dòng)旗下豆包大模型以“技術(shù)+成本+生態(tài)”的差異化路徑強(qiáng)勢突圍。

從對標(biāo)國際頂尖模型的性能躍升,到日均4萬億tokens調(diào)用量的爆發(fā)式增長,再到覆蓋3億終端設(shè)備的生態(tài)滲透,豆包大模型不僅改寫了國內(nèi)AI產(chǎn)業(yè)格局,更以“高質(zhì)低價(jià)”的普惠理念推動(dòng)技術(shù)落地千行百業(yè)。而且,豆包用數(shù)據(jù)詮釋了“規(guī)模效應(yīng)”這個(gè)關(guān)鍵詞的豐富內(nèi)涵。

順勢而為,從“對齊”到“超越”的國產(chǎn)化路徑

眾所周知,AI大模型賽道,拼的是大模型的算法與性能。難能可貴的是,豆包通過對標(biāo)國際頂尖,目前已正在逐步實(shí)現(xiàn)超越。例如,早在2024年底,華泰證券的調(diào)研數(shù)據(jù)就表明,豆包通用模型pro升級后全面對標(biāo)GPT-4o,價(jià)格僅為后者的1/8。

在當(dāng)今的AI領(lǐng)域,模型性能與成本效益是衡量一個(gè)大模型是否具備競爭力的關(guān)鍵指標(biāo)。豆包通用模型Pro在這兩方面展現(xiàn)出了卓越的表現(xiàn)。

打開網(wǎng)易新聞 查看精彩圖片

據(jù)媒體報(bào)道,豆包通用模型pro升級后,相較于2024年5月版本,其綜合能力實(shí)現(xiàn)了32%的顯著提升,在指令遵循、數(shù)學(xué)推理、代碼生成等核心維度,已成功實(shí)現(xiàn)與GPT-4o的全面對齊。這也意味著,豆包通用模型Pro能夠以與國際頂尖模型相媲美的水平,處理各種復(fù)雜的任務(wù)。

而在價(jià)格方面,豆包通用模型Pro卻展現(xiàn)出了極大的優(yōu)勢。這一價(jià)格策略徹底打破了長期以來在行業(yè)中存在的“高價(jià)即高質(zhì)”的固有觀念。

過去,許多企業(yè)因高昂的成本,而對先進(jìn)的大模型望而卻步,而豆包通用模型Pro的出現(xiàn),卻為這些企業(yè)提供了一個(gè)性價(jià)比極高的選擇,使得更多的企業(yè)能夠在合理的預(yù)算范圍內(nèi),享受到頂尖水平的AI技術(shù)服務(wù),為AI技術(shù)在企業(yè)級市場的廣泛應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。

值得注意的是,豆包升級后的大模型產(chǎn)品,其多模態(tài)能力持續(xù)升級。據(jù)了解,隨著AI技術(shù)的不斷發(fā)展,多模態(tài)能力已成為大模型發(fā)展的重要趨勢。

而豆包大模型在這一領(lǐng)域持續(xù)發(fā)力,不斷實(shí)現(xiàn)技術(shù)突破與升級。其視覺理解模型具備強(qiáng)大的圖像分析能力,能夠精準(zhǔn)識(shí)別圖像中的情緒與邏輯關(guān)系。無論是分析一張人物照片中的情感表達(dá),還是解析復(fù)雜圖表中的數(shù)據(jù)邏輯,該模型都能給出準(zhǔn)確而深入的理解。

文生圖模型則為用戶帶來了便捷且強(qiáng)大的創(chuàng)意實(shí)現(xiàn)工具,通過簡單的文字描述,即可生成高質(zhì)量的圖片,實(shí)現(xiàn)了“一鍵海報(bào)”功能。

這一功能不僅大大降低了設(shè)計(jì)門檻,讓沒有專業(yè)設(shè)計(jì)技能的用戶也能輕松創(chuàng)作出精美的海報(bào),而且為廣告、營銷等行業(yè)提供了高效的創(chuàng)意素材生成方式。

與此同時(shí),其音樂模型同樣表現(xiàn)出色,能夠在短時(shí)間內(nèi)生成3分鐘完整作品,從旋律的譜寫到和聲的編排,均展現(xiàn)出較高的專業(yè)水準(zhǔn),覆蓋了從創(chuàng)意構(gòu)思到作品完成的創(chuàng)作全流程。

可以預(yù)見,這些多模態(tài)能力的不斷升級,將會(huì)讓豆包大模型能夠滿足用戶在不同領(lǐng)域、不同場景下的多樣化需求,也將進(jìn)一步拓寬其應(yīng)用邊界,其市場競爭力也將進(jìn)一步增強(qiáng)。

低成本推動(dòng)技術(shù)普惠,豆包以“性價(jià)比”取勝

在推動(dòng)AI技術(shù)普惠的道路上,成本是一個(gè)關(guān)鍵因素。例如,豆包大模型的視頻理解模型在成本控制方面取得了顯著成果,其調(diào)用價(jià)格低至0.003元/千tokens,換算下來,1元即可處理多達(dá)284張720P圖片,這一價(jià)格較行業(yè)均價(jià)降低了85%。

如此低廉的價(jià)格,使得視覺AI技術(shù)不再是少數(shù)企業(yè)的專屬,眾多中小企業(yè)甚至個(gè)人創(chuàng)作者都能夠輕松使用,真正推動(dòng)了AI從“分時(shí)代”邁入“厘時(shí)代”,讓更多的人能夠享受到AI技術(shù)帶來的便利和創(chuàng)新。值得注意的是,該模型已經(jīng)接入豆包App和PC端產(chǎn)品。

打開網(wǎng)易新聞 查看精彩圖片

此外,為了進(jìn)一步降低企業(yè)在AI應(yīng)用過程中的成本,火山引擎推出了一系列算力優(yōu)化方案。其中,vRDMA網(wǎng)絡(luò)通過優(yōu)化網(wǎng)絡(luò)傳輸性能,大幅提升了數(shù)據(jù)傳輸速度,減少了數(shù)據(jù)處理過程中的延遲,從而提高了模型訓(xùn)練和推理的效率。

與此同時(shí),其彈性緩存則能夠根據(jù)企業(yè)的實(shí)際需求,靈活分配緩存資源,避免了資源的浪費(fèi),降低了企業(yè)的運(yùn)營成本。這些優(yōu)化方案相互配合,形成了一個(gè)高效的成本控制體系,促使企業(yè)在使用豆包大模型時(shí),實(shí)現(xiàn)“技術(shù)降本→價(jià)格普惠→調(diào)用量激增”的正向循環(huán)。

而隨著調(diào)用量的不斷增加,豆包大模型還能夠收集到更多的用戶數(shù)據(jù),進(jìn)而進(jìn)行更精準(zhǔn)的模型優(yōu)化和迭代,為用戶提供更優(yōu)質(zhì)的服務(wù),形成一個(gè)良性的生態(tài)發(fā)展模式。

據(jù)觀察,豆包大模型憑借其強(qiáng)大的技術(shù)實(shí)力和成本優(yōu)勢,在多個(gè)行業(yè)實(shí)現(xiàn)了深度應(yīng)用場景滲透。在汽車行業(yè),它已與80%主流汽車品牌展開合作,為汽車智能化發(fā)展提供了有力支持。

從智能駕駛輔助系統(tǒng)的優(yōu)化,到車內(nèi)智能交互系統(tǒng)的升級,豆包大模型的技術(shù)應(yīng)用讓汽車變得更加智能、安全和舒適。

據(jù)了解,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入到多家手機(jī)、PC等智能終端,覆蓋終端設(shè)備約3億臺(tái),來自智能終端的豆包大模型調(diào)用量在半年時(shí)間內(nèi)增長100倍。

在金融領(lǐng)域,豆包大模型同樣取得了顯著成果。華泰證券推出的“股市助手”智能體,基于豆包大模型的強(qiáng)大數(shù)據(jù)分析和智能決策能力,為投資者提供精準(zhǔn)的股市行情分析和投資建議。

截至目前,已有數(shù)十家券商積極擁抱AI大模型,在投研、投顧、風(fēng)控、運(yùn)營等多個(gè)領(lǐng)域展開了深入探索和應(yīng)用。這一趨勢不僅反映了券商們對前沿技術(shù)的敏銳洞察力,也預(yù)示著證券行業(yè)即將迎來一場深刻的智能化變革。以華泰證券為例,其短短上線僅幾個(gè)月,對話量就出現(xiàn)暴漲現(xiàn)象,成為投資者在復(fù)雜股市環(huán)境中的得力助手。

此外,招商銀行也引入豆包大模型打造智能體,實(shí)現(xiàn)了個(gè)性化財(cái)富管理服務(wù)。通過對客戶的資產(chǎn)狀況、投資偏好、風(fēng)險(xiǎn)承受能力等多維度數(shù)據(jù)的分析,為客戶量身定制專屬的財(cái)富管理方案,提升了客戶的滿意度和忠誠度。這些金融領(lǐng)域的標(biāo)桿案例,充分展示了豆包大模型在提升金融服務(wù)效率和質(zhì)量方面的巨大潛力。

除了這些行業(yè)應(yīng)用外,豆包大模型還借助AIGC賦能內(nèi)容爆發(fā),不斷完善基于抖音、頭條、番茄小說等字節(jié)旗下產(chǎn)品的創(chuàng)作者生態(tài),并將其應(yīng)用到即夢AI等產(chǎn)品生成高質(zhì)量內(nèi)容方面。例如,即夢AI借助豆包大模型的強(qiáng)大能力,成功生成了首部單日播放破40萬的科幻短劇《覺醒》。

這部短劇從劇本創(chuàng)作、角色設(shè)計(jì)到視頻制作,都在一定程度上借助了AI技術(shù),不僅大大縮短了創(chuàng)作周期,而且在劇情和視覺效果上展現(xiàn)出了獨(dú)特的創(chuàng)意和魅力。

悟空AI團(tuán)隊(duì)更是憑借豆包大模型,僅用3人即可完成8集內(nèi)容制作,這在傳統(tǒng)的內(nèi)容創(chuàng)作模式下幾乎是難以想象的,充分驗(yàn)證了AI技術(shù)對創(chuàng)作生產(chǎn)力的顛覆性提升。

用戶體驗(yàn)正向循環(huán),從“可用”到“好用”的生態(tài)閉環(huán)

用戶體驗(yàn)是衡量一款產(chǎn)品是否成功的重要標(biāo)準(zhǔn),豆包大模型除了服務(wù)B端企業(yè)展現(xiàn)出了強(qiáng)大的技術(shù)能力外,其面向C端用戶的豆包APP,也展現(xiàn)出了其極高的粘性。

深度合成算法高速增長,意味著傳統(tǒng)APP正在快速接入AI進(jìn)行“轉(zhuǎn)型”。QuestMobile報(bào)告數(shù)據(jù)顯示,2024年12月份,豆包等AI原生APP月活已達(dá)1.2億。而月活用戶過億的APP中,有超過七成已經(jīng)接入了AI功能或插件。

算法應(yīng)用APP的高速增長,也意味著AI原生APP快速發(fā)展。同月,AI原生APP月活規(guī)模已經(jīng)達(dá)到1.2億,月人均使用時(shí)長達(dá)到132.8分鐘,同比分別增長了232%、54.7分鐘。具體來看,截至12月,AI原生APP行業(yè),豆包、Kimi智能助手、文小言APP月活用戶分別達(dá)到0.75億、0.21億、0.12億。橫向?qū)Ρ葋砜?,豆包的行業(yè)地位也不言而喻。

打開網(wǎng)易新聞 查看精彩圖片

這一龐大的用戶群體不僅體現(xiàn)了豆包APP的廣泛影響力,更反映出用戶對其產(chǎn)品體驗(yàn)的高度認(rèn)可。其3日留存率達(dá)到28%,意味著有相當(dāng)比例的用戶在初次使用后的短時(shí)間內(nèi),會(huì)再次主動(dòng)使用該應(yīng)用,這是用戶對產(chǎn)品產(chǎn)生興趣和依賴的重要標(biāo)志。而且,因?yàn)槎拱麬PP能夠?yàn)橛脩籼峁┴S富、有趣且實(shí)用的功能,吸引用戶長時(shí)間沉浸其中,其用戶使用時(shí)長也不斷攀升。

實(shí)際上,這得益于豆包APP在功能設(shè)計(jì)上具有諸多差異化特點(diǎn),這些特點(diǎn)是其吸引用戶的重要因素。實(shí)時(shí)語音通話功能支持情感化對話,通過先進(jìn)的語音識(shí)別和合成技術(shù),能夠捕捉用戶語音中的情感信息,并以相應(yīng)的情感化語言進(jìn)行回應(yīng),讓用戶在與APP的交流中感受到溫暖和關(guān)懷。

在英語口語練習(xí)場景中,豆包APP的表現(xiàn)尤為出色,其滿意度超過了GPT-4o。它為用戶提供了逼真的口語練習(xí)環(huán)境,能夠?qū)崟r(shí)糾正用戶的發(fā)音錯(cuò)誤,提供準(zhǔn)確的語法和詞匯建議,成為眾多英語學(xué)習(xí)者在教育領(lǐng)域的“隱形剛需”,滿足了用戶在語言學(xué)習(xí)方面的實(shí)際需求。

結(jié)語

作為國產(chǎn)大模型的佼佼者,豆包大模型在市場份額、品牌口碑等方面成績斐然。在全球大模型月活榜中成績優(yōu)異,調(diào)用量在短時(shí)間內(nèi)實(shí)現(xiàn)數(shù)十倍增長,在國內(nèi)大模型市場占有重要的一席之地。

通過硬件與軟件雙輪驅(qū)動(dòng)構(gòu)建生態(tài)聯(lián)盟,豆包大模型若與蘋果達(dá)成合作,市場影響力將進(jìn)一步提升。而且,通過不斷與B端企業(yè)達(dá)成合作,豆包大模型還獲得了越來越多機(jī)構(gòu)與資本的高度認(rèn)可。在AIGC賦能內(nèi)容爆發(fā)方面,豆包大模型也為創(chuàng)作者生態(tài)、UGC創(chuàng)作等注入了活力。

可以預(yù)見,未來隨著技術(shù)持續(xù)迭代,尤其在Agent模式與端側(cè)應(yīng)用深度融合下,豆包大模型有望進(jìn)一步拓展應(yīng)用邊界,推動(dòng)更多行業(yè)智能化轉(zhuǎn)型,成為全球AI競賽中“中國力量”的典型代表,引領(lǐng)從技術(shù)到商業(yè)的革新,在全球大模型競爭中占據(jù)更重要的地位,釋放出更為強(qiáng)大的產(chǎn)業(yè)價(jià)值。