打開網(wǎng)易新聞 查看精彩圖片

過去十年,語音識(shí)別技術(shù)的演進(jìn)是線性的:識(shí)別更準(zhǔn)、響應(yīng)更快、語調(diào)更自然。行業(yè)沉迷在“聽清楚”這場(chǎng)馬拉松里,以為跑得更快就能贏。但AI大模型的降維打擊,正把這場(chǎng)馬拉松變成短兵相接的巷戰(zhàn):聽清楚早已不是優(yōu)勢(shì),聽得“懂”、聽得“準(zhǔn)”、聽得“值錢”才是入場(chǎng)券。

2024年初,Sora發(fā)布震撼業(yè)界,而在同一時(shí)間,GPT-4.0的語音能力也悄然更新。你可以用自然語言與AI實(shí)時(shí)對(duì)話,語調(diào)、語義、上下文理解都接近人類水平。這并不意味著傳統(tǒng)語音廠商要“死”,但這毫無疑問意味著:時(shí)代換算法了,換邏輯了,甚至連需求本身都換了。

智能語音的核心不再是“轉(zhuǎn)文字”,而是“變接口”——AI語音正在成為企業(yè)業(yè)務(wù)流程的主動(dòng)入口。你以為它是客服,其實(shí)它在替你判斷意圖;你以為它是字幕工具,其實(shí)它在提取情緒標(biāo)簽;你以為它是語音助手,其實(shí)它在替你做決策預(yù)判。一切人類對(duì)話的邊緣,都開始被語音AI滲透。

這是一場(chǎng)由AI重寫的產(chǎn)業(yè)戰(zhàn)局,最先出局的是只會(huì)“識(shí)別”的玩家,正在崛起的,是那些將語音當(dāng)作數(shù)據(jù)引擎、交互入口、業(yè)務(wù)操盤手的系統(tǒng)型企業(yè)。他們不靠識(shí)別率講故事,而是圍繞“語音即場(chǎng)景”的打法進(jìn)行重新建模。AIGC、智能座艙、語音內(nèi)容生成、醫(yī)療記錄、金融風(fēng)控、實(shí)時(shí)會(huì)議協(xié)作,語音正在悄無聲息地滲透每一個(gè)數(shù)據(jù)密集型行業(yè)。

與此同時(shí),整個(gè)市場(chǎng)正在發(fā)生“上下兩頭熱,中間腰部塌”的格局變化——大廠憑借大模型壟斷基礎(chǔ)能力,小廠靈活切入垂直場(chǎng)景,而中腰部玩家被夾擊:產(chǎn)品同質(zhì)、模型依賴、業(yè)務(wù)缺乏閉環(huán),成了AI語音時(shí)代最危險(xiǎn)的位置。

但危險(xiǎn)也意味著重新洗牌的機(jī)會(huì)。未來真正有價(jià)值的語音企業(yè),不是賣“識(shí)別引擎”的技術(shù)服務(wù)商,而是構(gòu)建“數(shù)據(jù)交互閉環(huán)”的系統(tǒng)級(jí)玩家。它們必須兼具算法深度、產(chǎn)品理解和行業(yè)洞察,把“能說會(huì)聽”變成“能懂會(huì)干”。

誰在技術(shù)上有壁壘,誰在場(chǎng)景里有閉環(huán),誰在業(yè)務(wù)中能變現(xiàn),誰就會(huì)在大模型時(shí)代的語音戰(zhàn)場(chǎng)里活下來。

對(duì)此,在歷經(jīng)數(shù)月的時(shí)間里,由數(shù)據(jù)猿、上海大數(shù)據(jù)聯(lián)盟工作人員與外部專家成員聯(lián)合組成的評(píng)選推薦委員會(huì),從眾多企業(yè)中通過直接申報(bào)交流、訪談?wù){(diào)研、外界評(píng)價(jià)、匿名訪問等交叉驗(yàn)證的層層篩選推薦機(jī)制下,最終制作形成了《2025中國(guó)智能語音領(lǐng)域最具商業(yè)合作價(jià)值企業(yè)盤點(diǎn)》。

本期盤點(diǎn)列舉了智能語音領(lǐng)域里的一些成熟玩家,主要涵蓋企業(yè)相關(guān)產(chǎn)品及服務(wù)介紹、相關(guān)榮譽(yù)、代表性客戶評(píng)價(jià)等,希望能為讀者提供新角度的行業(yè)理解。

以下是本期盤點(diǎn)的相關(guān)內(nèi)容:經(jīng)數(shù)據(jù)猿整理發(fā)布:

打開網(wǎng)易新聞 查看精彩圖片

以下為本期盤點(diǎn)策劃的部分典型性企業(yè)詳情,排名不分先后:

打開網(wǎng)易新聞 查看精彩圖片

企業(yè)名稱:出門問問

企業(yè)文化:
·Slogan:
更美好AI世界
·定位:人工智能出門問問是一家以生成式AI與語音交互為核心的人工智能公司
·使命:打造國(guó)際領(lǐng)先的通用大模型,通過AI技術(shù)、產(chǎn)品及商業(yè)化三位一體發(fā)展,成為全球AI CoPilot的引領(lǐng)者
·愿景:Make AGI Accessible and AI CoPilot everywhere.

企業(yè)簡(jiǎn)介

出門問問是一家以生成式AI和語音交互為核心的人工智能公司,為全球多個(gè)國(guó)家提供面向創(chuàng)作者的AIGC工具、AI政企服務(wù),以及AI智能硬件。出門問問致力于打造國(guó)際領(lǐng)先的通用大模型,通過AI技術(shù)、產(chǎn)品及商業(yè)化三位一體發(fā)展,成為全球AI CoPilot的引領(lǐng)者。

出門問問共完成多輪融資,與全球知名投資機(jī)構(gòu)紅杉資本、真格基金、SIG海納亞洲、Google、大眾汽車集團(tuán)等達(dá)成投資及戰(zhàn)略合作,并于2024年4月24日港交所上市(出門問問 02438.HK),成為“AIGC第一股”。

相關(guān)業(yè)務(wù)及產(chǎn)品服務(wù):

魔音工坊(海外版DupDub)是一款全球領(lǐng)先的集文案、配音、剪輯全流程一站式AI軟件,海內(nèi)外擁有超過800萬注冊(cè)會(huì)員,付費(fèi)會(huì)員超60萬。魔音工坊擁有千款A(yù)I音色,全方言多語種,百變風(fēng)格適合各類視頻創(chuàng)作及配音場(chǎng)景的聲音商店;獨(dú)創(chuàng)的精準(zhǔn)調(diào)音平臺(tái)“聲音的word編輯器”;以及含聲音搜索,聲音克隆、生成式TTS“捏聲音”等多種創(chuàng)造方式。

代表性客戶:新華社、自媒體大V一顆紅星(695w抖音粉絲)、力哥影視(1306w+抖音粉絲)

相關(guān)榮譽(yù):

魔音工坊寫入聯(lián)通研究院金磚白皮書

創(chuàng)業(yè)邦2024年AIGC產(chǎn)品創(chuàng)新榜

2023中國(guó)「+大模型」先鋒案例 TOP10

出門問問論文入選全球語音技術(shù)頂會(huì)INTERSPEECH 2023(出門問問與西北工業(yè)大學(xué)謝磊教授ASLP實(shí)驗(yàn)室合作撰寫的論文《PromptStyle: Controllable Style Transfer for Text-to-Speech with Natural Language Descriptions》入選)

外界評(píng)價(jià)

用了魔音工坊就不想用其他配音軟件,就數(shù)他方便,配音功能也是豐富多樣,配音就像寫word文檔一樣簡(jiǎn)單方便。

——自媒體大V一顆紅星

新華社“夜讀”欄目讀者反饋熱烈,表示內(nèi)容有共鳴,聲音有溫度,是睡前的不二選擇。(欄目聲音由魔音工坊和新華社新媒體中心AIGC工作室聯(lián)合制作)

——新華社新媒體中心AIGC工作室

★數(shù)據(jù)猿評(píng)價(jià):在語音AIGC陷入模型同質(zhì)化、功能內(nèi)卷的紅海時(shí),出門問問選擇從“工具”躍升為“平臺(tái)”。以魔音工坊為代表,它不僅構(gòu)建了一個(gè)多語言、多音色、高自由度的聲音創(chuàng)作生態(tài),更通過“聲音的Word編輯器”等創(chuàng)新功能,率先打通了語音生成的用戶體驗(yàn)閉環(huán)。背靠自研大模型和全球化產(chǎn)品視野,出門問問是當(dāng)前極少數(shù)真正將語音AIGC做到技術(shù)、產(chǎn)品、商業(yè)三線合一的玩家,其“AI CoPilot”戰(zhàn)略,正讓語音不再只是交互方式,而是成為生產(chǎn)力工具的“主控引擎”。

打開網(wǎng)易新聞 查看精彩圖片

企業(yè)名稱:聲網(wǎng)

企業(yè)文化
·定位:
全球?qū)崟r(shí)互動(dòng)云開創(chuàng)者和引領(lǐng)者,致力于打造生成式AI時(shí)代最實(shí)時(shí)的云
·使命:幫助人們跨越距離實(shí)時(shí)互動(dòng),如聚一堂
·愿景:讓實(shí)時(shí)互動(dòng)像空氣和水一樣,無處不在

企業(yè)簡(jiǎn)介:

聲網(wǎng)成立于2014年,是全球?qū)崟r(shí)互動(dòng)云服務(wù)開創(chuàng)者和引領(lǐng)者。開發(fā)者只需簡(jiǎn)單調(diào)用聲網(wǎng)API,即可在應(yīng)用內(nèi)構(gòu)建多種實(shí)時(shí)音視頻互動(dòng)場(chǎng)景。

聲網(wǎng)API已經(jīng)賦能社交直播、教育、游戲電競(jìng)、IoT、AR/VR、金融、保險(xiǎn)、醫(yī)療、企業(yè)協(xié)作等20余行業(yè)賽道,共200多種場(chǎng)景,單月服務(wù)超過700億分鐘;截至2024年12月31日,聲網(wǎng)全球注冊(cè)應(yīng)用已超93.1萬。

聲網(wǎng)的實(shí)時(shí)互動(dòng)技術(shù)服務(wù)覆蓋全球200多個(gè)國(guó)家和地區(qū),同時(shí)聲網(wǎng)遵循國(guó)際認(rèn)可的信息安全和隱私保護(hù)標(biāo)準(zhǔn)以及行業(yè)要求,致力于采用國(guó)際最佳實(shí)踐來建設(shè)隱私和安全管理體系。聲網(wǎng)的客戶包括小米、陌陌、斗魚、嗶哩嗶哩、小紅書、Yalla等巨頭、獨(dú)角獸及創(chuàng)業(yè)企業(yè)。聲網(wǎng)的技術(shù)同樣被HTC VIVE 、The Meet Group、Bunch等遍布全球的知名企業(yè)采用。

相關(guān)業(yè)務(wù)及產(chǎn)品服務(wù):

今年,聲網(wǎng)發(fā)布了全球首個(gè)對(duì)話式AI引擎。聲網(wǎng)對(duì)話式AI引擎可支持任意文本大模型快速升級(jí)為“能說會(huì)道”的對(duì)話式多模態(tài)大模型。同時(shí),對(duì)話式AI引擎的價(jià)格也更為優(yōu)惠,只需0.098元/分鐘。

聲網(wǎng)對(duì)話式AI引擎具備以下功能及優(yōu)勢(shì)

>AI語音秒回:通過全鏈路深度優(yōu)化,并在中、美、歐、東南亞主要城市實(shí)測(cè),語音對(duì)話延遲中位數(shù)低至650ms

>選擇性注意力鎖定:屏蔽95%環(huán)境人聲、噪聲干擾,精準(zhǔn)識(shí)別對(duì)話人聲

>智能打斷:超低打斷延時(shí),自研“智能打斷”技術(shù),模擬真人對(duì)話節(jié)奏,隨時(shí)打斷與AI的對(duì)話,響應(yīng)低至340ms

>全模型適配:支持包含DeepSeek、ChatGPT等在內(nèi)的全球幾乎所有大模型廠商,更有音視頻SDK支持30000+終端機(jī)型適配,解決多設(shè)備兼容性的后顧之憂

>不懼弱網(wǎng):地鐵、地下車庫等弱網(wǎng)環(huán)境下,人與AI也能流暢對(duì)話,80%丟包率下仍能穩(wěn)定流暢對(duì)話,斷網(wǎng)3-5s依舊流暢對(duì)話

>開發(fā)省心、更省錢:聲網(wǎng)對(duì)話式AI引擎提供了極簡(jiǎn)的開發(fā)部署,只需2行代碼,15分鐘就能讓AI開口說話,大幅降低了開發(fā)門檻。只需填入與復(fù)制LLM與TTS相關(guān)的URL與Key,就能實(shí)現(xiàn)快速部署,具體流程可查看聲網(wǎng)官網(wǎng)的文檔中心

代表性客戶:MiniMax

相關(guān)榮譽(yù):

2024人工智能年度領(lǐng)航企業(yè)

2024人工智能年度杰出解決方案

CSDN2024中國(guó)開發(fā)者影響力年度評(píng)選創(chuàng)新產(chǎn)品與解決方案

大模型之家2024年度獎(jiǎng)項(xiàng)評(píng)選優(yōu)秀應(yīng)用方案榜單

2024年產(chǎn)業(yè)AI數(shù)字化金鏟獎(jiǎng)

外界評(píng)價(jià):

聲網(wǎng)與MiniMax共同打造了國(guó)內(nèi)首個(gè)Realtime API實(shí)時(shí)交互服務(wù)方案,綜合效果可對(duì)標(biāo)GPT-4o。

★數(shù)據(jù)猿評(píng)價(jià):在AI語音競(jìng)逐多為“誰更像人”時(shí),聲網(wǎng)另辟蹊徑,押注“誰更快反應(yīng)”。作為全球?qū)崟r(shí)互動(dòng)云的開創(chuàng)者,聲網(wǎng)并不試圖與大模型廠商正面競(jìng)爭(zhēng),而是以對(duì)話式AI引擎構(gòu)建AI語音時(shí)代真正的“實(shí)時(shí)操作系統(tǒng)”。650ms延遲、340ms打斷、80%丟包下仍可對(duì)話的韌性能力,讓其成為AI從“可聊”邁向“可用”的底層加速器。在AI語音場(chǎng)景普遍落地難、成本高的當(dāng)下,聲網(wǎng)正憑借極致的實(shí)時(shí)性和極簡(jiǎn)接入邏輯,把“語音能力”變成“產(chǎn)品能力”的通用接口,工具的“主控引擎”。

打開網(wǎng)易新聞 查看精彩圖片

企業(yè)名稱:網(wǎng)易云商(網(wǎng)易數(shù)智旗下)

企業(yè)文化
·定位:AI驅(qū)動(dòng)的服務(wù)營(yíng)銷一體化平臺(tái)
·使命:用最好的技術(shù)和服務(wù),助力客戶內(nèi)生成長(zhǎng),共創(chuàng)美好世界
·愿景:成為最具價(jià)值的智慧科技公司,幫助各行各業(yè)的組織,連接和服務(wù)10億人企業(yè)簡(jiǎn)介:

企業(yè)簡(jiǎn)介:

網(wǎng)易云商是網(wǎng)易數(shù)智旗下的服務(wù)營(yíng)銷一體化平臺(tái)。2016年從客服SaaS產(chǎn)品七魚起家,整合云計(jì)算、大數(shù)據(jù)、人工智能等新興技術(shù),目前已形成三大產(chǎn)品體系:七魚智能客服、智能洞察、私域增長(zhǎng)。

2022年2月,網(wǎng)易云商智能外呼產(chǎn)品正式上線,為企業(yè)打造科學(xué)策略驅(qū)動(dòng)下的會(huì)員觸達(dá)體驗(yàn)。截至2025年3月,累計(jì)穩(wěn)定外呼通話數(shù)量15億+,服務(wù)客戶數(shù)量9000+,為零售、游戲等行業(yè)客戶創(chuàng)造營(yíng)收增量上億元。

相關(guān)業(yè)務(wù)及產(chǎn)品服務(wù):

網(wǎng)易云商智能外呼是一款多輪交互、代替人工自主呼叫的智能機(jī)器人,深度應(yīng)用網(wǎng)易自研的語音語義頂尖算法,結(jié)合AI大模型能力,最新升級(jí)推出視頻外呼、外呼智能體等創(chuàng)新應(yīng)用。

實(shí)施過程中,幫助企業(yè)基于網(wǎng)易人群大數(shù)據(jù)形成精細(xì)化的外呼策略,適用于品牌零售、游戲、企服、會(huì)展等行業(yè)中的新客增長(zhǎng)、留存激活、流失挽回、通知調(diào)研等海量場(chǎng)景,能顯著降低人力成本,讓運(yùn)營(yíng)更加精準(zhǔn)高效,為企業(yè)創(chuàng)造更多營(yíng)收增量。

代表性客戶:大潤(rùn)發(fā)、百麗、波司登、江南布衣、網(wǎng)易游戲、37手游、華墨展覽等

相關(guān)榮譽(yù):

虎嗅大鯨榜·2024 AIGC 數(shù)字營(yíng)銷技術(shù)商TOP15
2024未來數(shù)商大會(huì)·2024數(shù)商典型應(yīng)用場(chǎng)景“乘數(shù)榜”
2023To B行業(yè)影響力價(jià)值榜·創(chuàng)新力產(chǎn)品榜

外界評(píng)價(jià)

網(wǎng)易云商的智能外呼在實(shí)際運(yùn)營(yíng)中性能穩(wěn)定、可靠,是眾多同類產(chǎn)品中的可信賴的選擇,也確實(shí)在新游預(yù)約、流失召回等場(chǎng)景上為我們帶來了實(shí)實(shí)在在的增長(zhǎng)。

——37手游

在外呼項(xiàng)目中,網(wǎng)易云商不僅能夠及時(shí)與我們進(jìn)行有效溝通,還能主動(dòng)發(fā)現(xiàn)外呼話術(shù)、外呼策略中的問題及可優(yōu)化項(xiàng)并提出相應(yīng)的解決建議,他們的認(rèn)真負(fù)責(zé)和專業(yè)精神為外呼項(xiàng)目的順利推進(jìn)提供了重要保障。

——大潤(rùn)發(fā)

★數(shù)據(jù)猿評(píng)價(jià):在“語音+AI”逐漸從技術(shù)賣點(diǎn)轉(zhuǎn)向ROI考核的今天,網(wǎng)易云商用一套商業(yè)閉環(huán)給行業(yè)上了一課。從七魚客服到智能外呼,從語義引擎到大模型驅(qū)動(dòng)的視頻外呼,網(wǎng)易云商不再單純講“聽得懂”,而是圍繞“叫得準(zhǔn)、說得值、轉(zhuǎn)得動(dòng)”構(gòu)建出一整套智能營(yíng)銷操作系統(tǒng)。在用戶增長(zhǎng)、召回、轉(zhuǎn)化這些最貼近企業(yè)利潤(rùn)表的場(chǎng)景里,它用15億+通話跑出一條可復(fù)用、可擴(kuò)展、可交付的AI變現(xiàn)路徑,是語音賽道里極少數(shù)真正把“服務(wù)”變“營(yíng)收”的實(shí)戰(zhàn)派玩家。

打開網(wǎng)易新聞 查看精彩圖片

企業(yè)名稱:追一科技

企業(yè)文化
·Slogan:更美好AI世界
·定位:人工智能和AI員工解決方案提供商
·使命:更美好AI世界
·愿景:讓AI員工服務(wù)每個(gè)組織和個(gè)人
·價(jià)值觀:正直 卓越 共贏

企業(yè)簡(jiǎn)介

追一科技是一家致力成就客戶價(jià)值的領(lǐng)先NLP人工智能公司與AI員工解決方案提供商,擁有自研的領(lǐng)域大模型追一博文,并拓展到智能語音多模態(tài)的AI全棧技術(shù)。

公司累計(jì)服務(wù)超過 300 家中大型企業(yè)/政府類客戶,助力客戶在服務(wù)、營(yíng)銷,運(yùn)營(yíng)等多個(gè)場(chǎng)景上實(shí)現(xiàn)智能化轉(zhuǎn)型升級(jí)。2023年7月,追一科技獲得國(guó)家級(jí)專精特新“小巨人”企業(yè)稱號(hào)。目前,公司在深圳、上海、北京、成都等地均有專業(yè)服務(wù)團(tuán)隊(duì)。

相關(guān)業(yè)務(wù)及產(chǎn)品服務(wù)

追一科技提供語音識(shí)別(ASR)和語音合成(TTS)等一站式智能語音解決方案,統(tǒng)稱IVC(Intelligent Voice Cloud),除底層能力以外,同時(shí)也提供一系列引擎管理以及運(yùn)營(yíng)運(yùn)維能力,包括語音運(yùn)營(yíng)管理平臺(tái),自學(xué)習(xí)平臺(tái)以及標(biāo)注平臺(tái)等。

追一科技的IVC面向語音交互場(chǎng)景、金融運(yùn)營(yíng)商和政務(wù)領(lǐng)域,專門訓(xùn)練和優(yōu)化,獲得比通用語音識(shí)別更好的技術(shù)指標(biāo)。

代表性客戶:浦發(fā)銀行、招商銀行、合肥12345熱線、廣發(fā)銀行、中國(guó)移動(dòng)等

相關(guān)榮譽(yù)

與大連稅務(wù)局合作的數(shù)字人或國(guó)務(wù)院頒發(fā)的《優(yōu)化營(yíng)商環(huán)境專項(xiàng)督查發(fā)現(xiàn)典型經(jīng)驗(yàn)做法的通報(bào)》

金融賽道算法模型或BPAA大賽全場(chǎng)大獎(jiǎng)(冠軍)

創(chuàng)業(yè)邦2024年AIGC產(chǎn)品創(chuàng)新榜

2024年IDC中國(guó)新興金融科技50強(qiáng)

2024福布斯中國(guó)人工智能科技企業(yè)

華為昇騰技術(shù)驗(yàn)證

外界評(píng)價(jià):

追一科技的AI機(jī)器人表現(xiàn)非常高效,其全新UI交互界面、語義分析能力、意圖識(shí)別上下文關(guān)聯(lián)、多類型的富文本答案、配置管理功能、多渠道的快速接入與區(qū)分以及任務(wù)型等功能都給我們業(yè)務(wù)提升了解決效率。

——某城商行呼叫中心經(jīng)理

現(xiàn)在各項(xiàng)稅費(fèi)優(yōu)惠政策頻出,我們公司很多員工都不太了解今年新推出的個(gè)稅匯算政策,就有人推薦我安裝了稅可思,不僅方便了我們會(huì)計(jì),也方便了我們公司員工,使用更方便,解答效率更高。

——大連市市民

★數(shù)據(jù)猿評(píng)價(jià):在智能語音邁入“理解力為王”的下半場(chǎng),追一科技不再滿足于做技術(shù)工具的提供者,而是走在“AI員工系統(tǒng)化落地”的前線。憑借自研的“追一博文”領(lǐng)域大模型和完整的語音交互云(IVC)方案,追一跳脫了語音識(shí)別的基礎(chǔ)競(jìng)爭(zhēng),轉(zhuǎn)而構(gòu)建“AI助理即業(yè)務(wù)節(jié)點(diǎn)”的解決路徑。在金融、政務(wù)等高復(fù)雜場(chǎng)景中,其語音產(chǎn)品不僅“聽得清”,更能“聽得準(zhǔn)、干得穩(wěn)”,是為數(shù)不多真正將語音能力嵌入組織運(yùn)營(yíng)流程的實(shí)干型玩家。