3月29日-30日,2025正和島案例共學(xué)大課·安徽站在合肥舉辦,本次大會(huì)以“贏在AI+,與趨勢(shì)共舞”為主題,300余位企業(yè)家齊聚合肥,共同探討企業(yè)家如何馭勢(shì)而上,企業(yè)如何借AI實(shí)現(xiàn)價(jià)值躍遷。
在大會(huì)上,科大訊飛董事長(zhǎng)劉慶峰做了分享,“如果今天不讓自己的企業(yè)和生命運(yùn)行在大模型之上,大概率現(xiàn)在所有靠人力和市場(chǎng)的商業(yè)模式都會(huì)在一兩年內(nèi)被徹底顛覆掉?!?/strong>
他從大模型的發(fā)展階段出發(fā),提出目前大模型還有很大的增長(zhǎng)空間,并分享了科大訊飛作為唯一國(guó)產(chǎn)范圍構(gòu)建的自主可控大模型如今的發(fā)展情況,以及未來準(zhǔn)備為企業(yè)提供的服務(wù)。
以下內(nèi)容為本次演講內(nèi)容精編,希望對(duì)你有所啟發(fā)。
口 述:劉慶峰 科大訊飛董事長(zhǎng)
編 輯:一厘米
來 源:正和島(ID:zhenghedao)
各位企業(yè)家朋友,大家好。我將從兩個(gè)角度做個(gè)分享。
首先,我們?nèi)绾慰创?dāng)前技術(shù)發(fā)展的趨勢(shì),以及下一步產(chǎn)業(yè)可能帶來的變革性影響。其次,企業(yè)如何抱團(tuán),如何發(fā)展AI。

一、AI大模型離天花板還很遠(yuǎn)
今天的底座大模型實(shí)際上還有很大的增長(zhǎng)空間。
大家都知道,DeepSeek在春節(jié)前出圈,隨后OpenAI o1將其升級(jí)為o3-mini,最近又出了GPT-4o的升級(jí)版本,對(duì)圖片的理解、邏輯推理與創(chuàng)造力都有所提升。
在硅谷,其實(shí)還有一個(gè)比OpenAI更難進(jìn)的公司Anthropic,它有很多物理學(xué)博士,那些天才們都特別想加入。
它的CEO Dario Amodei發(fā)了一篇長(zhǎng)文,大膽預(yù)言:兩年內(nèi),“強(qiáng)大AI”將達(dá)到諾獎(jiǎng)級(jí)智商水平。
目前大家對(duì)通用人工智能發(fā)展大致分為幾個(gè)階段,雖然各個(gè)角度不同,但是基本認(rèn)知相對(duì)一致。
第一步是對(duì)話者。通過對(duì)話控制人工智能,只要進(jìn)行語言提示,就可以激發(fā)他們學(xué)習(xí)、記憶、訓(xùn)練內(nèi)容。
第二步是智能行動(dòng)者,可以完成相關(guān)指令的工作。
第三步是智能體,它可以自動(dòng)聽懂你的指令,并將其分解成相關(guān)任務(wù),找到每個(gè)任務(wù)完成所需的工具,之后再對(duì)接內(nèi)部和外部信源,將它們組合起來完成任務(wù)。
第四步是創(chuàng)新者,不僅可以完成既定工作,還可以自己創(chuàng)意和創(chuàng)新。
第五步是組織者,到后期它就具備整合社會(huì)要素資源整和調(diào)度能力,大致分為這幾個(gè)階段。
目前,我們基于大模型,為央國(guó)企業(yè)做了很多智能體平臺(tái)。
他們不需要編程,只需要理解場(chǎng)景并提出要求,我們會(huì)自動(dòng)幫助他申請(qǐng)相關(guān)工具。中國(guó)能源通過這種方式已經(jīng)有50多個(gè)非常優(yōu)秀的智能體工具在全集團(tuán)內(nèi)部使用。
其最大意義在于隨著大模型語言理解能力和編程能力的提升,我們已經(jīng)擁有越來越多專項(xiàng)的人工智能技術(shù)。因此,智能體平臺(tái)在下一個(gè)階段對(duì)各企業(yè)非常關(guān)鍵。
在第四個(gè)階段中,創(chuàng)新者是什么概念?前年中央經(jīng)濟(jì)工作會(huì)議上明確提出,要將科技、人才、教育三位一體,并在經(jīng)濟(jì)工作中排名第一的是創(chuàng)新。
目前全球范圍內(nèi)非常清楚的是,AI for science大模型是未來創(chuàng)新的最重要的助推器和底座支撐。去年諾貝爾化學(xué)獎(jiǎng)和物理學(xué)獎(jiǎng)分別頒發(fā)給了大模型與人工智能相關(guān)的科學(xué)家。
我給大家舉個(gè)例子,中國(guó)科學(xué)技術(shù)大學(xué)生命學(xué)院的劉海燕教授團(tuán)隊(duì),要做蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè),生成活性蛋白質(zhì)。原來需要6個(gè)月做的實(shí)驗(yàn),現(xiàn)在借助科研大模型一天就做完了,已經(jīng)做出48個(gè)活性蛋白質(zhì),并且在《Nature》上發(fā)表文章。
再比如合肥的“人造小太陽”,它通過技術(shù)途徑解決能源的問題。原來做模擬實(shí)驗(yàn)時(shí),要把粒子加速到一定速度,產(chǎn)生聚變反應(yīng)發(fā)出能量,達(dá)到一定高度可以留存1000秒。
原來做模擬實(shí)驗(yàn)需要10-20天,現(xiàn)在用AI幫它做一次實(shí)驗(yàn)只用一個(gè)小時(shí),原來10-20天的實(shí)驗(yàn)成功率93%,現(xiàn)在一個(gè)小時(shí)成功率97%,極大提升了科研效率。
所以有人說今天如果科研不用新的人工智能工具,就是原來的農(nóng)業(yè)水平階段。
到工業(yè)階段,會(huì)將大量?jī)?yōu)秀的、有創(chuàng)新能力的年輕人從簡(jiǎn)單、重復(fù)的科研活動(dòng)中釋放出來,就像我們?cè)瓉碜鎏祗w研究一樣,如果發(fā)現(xiàn)一個(gè)新的行星,那導(dǎo)師招博士時(shí)不敢招太多人,因?yàn)槟怯泻艽蟮倪\(yùn)氣成分,你可能一輩子都沒找到一個(gè),那博士就畢業(yè)不了。
現(xiàn)在大模型可以把大海撈針變成茶壺里倒茶葉,利用人工智能可以加速現(xiàn)有科研從農(nóng)業(yè)到工業(yè)階段。
但這還是用現(xiàn)有的技術(shù),加速科研方式,減少重復(fù)性的科研勞動(dòng),仍然屬于人工智能的第二和第三階段。
第四階段就是創(chuàng)新,雖然我不清楚路徑,但是我可以給很多新的關(guān)于科研的啟發(fā)。這些科研是腦洞大開的,有可能都沒有人做,很多時(shí)候是我們自己都沒想到的。
目前我們正在與中國(guó)科學(xué)院大連物理化學(xué)所和中科院非常有名的院士合作,與他們做化工大模型,不僅將現(xiàn)有技術(shù)路線明確為相對(duì)清晰的科研方向,使研發(fā)效率大幅提升,同時(shí)幫助他們創(chuàng)造更多可能的創(chuàng)新方法。
最后一個(gè)階段就是組織者,現(xiàn)在有一點(diǎn)小苗頭,雖然不能完全替代人類,但是兩個(gè)機(jī)器人協(xié)同工作,能夠組織社會(huì)資源,開始組織協(xié)同性工作,更復(fù)雜地構(gòu)建整個(gè)任務(wù)體系。
在這條發(fā)展的路上,大模型的天花板仍然被持續(xù)打開。所以Anthropic的CEO表示到2026年,有可能達(dá)到諾獎(jiǎng)級(jí)。
從第二個(gè)階段的智能者到第四個(gè)階段的創(chuàng)新者,正在不斷進(jìn)步,這個(gè)進(jìn)步并不需要依靠新的不可預(yù)知的算法或者腦機(jī)接口、類腦計(jì)算等,而是用預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)兩種方法。
強(qiáng)化學(xué)習(xí)是針對(duì)已有的學(xué)完的內(nèi)容,在特定任務(wù)中自己相互PK,有的是人參與,有的是完全依靠自己。例如AlphaGo下圍棋,要學(xué)幾千萬張棋譜,后來自己與跟自己對(duì)弈,一周后就能擊敗所有世界冠軍。
所以通過預(yù)訓(xùn)練和強(qiáng)化訓(xùn)練兩種方法,大模型的自主進(jìn)化在未來2-3年內(nèi)還有巨大的提升空間,天花板非常之高。
二、科大訊飛堅(jiān)持國(guó)產(chǎn)大模型
去年底有人說今天不用做底座大模型,而是要做行業(yè)落地??拼笥嶏w一直強(qiáng)調(diào)我們必須在底座模型上繼續(xù)前進(jìn),因?yàn)樗目臻g潛力巨大。
在這個(gè)底座上,中國(guó)的基本架構(gòu)相當(dāng)清晰,大概頭部就是幾家公司。
現(xiàn)在最火出圈的是DeepSeek,在工程化上有很多積累,他們專注做語言模型,而且開源,做的確實(shí)相當(dāng)不錯(cuò)。訊飛主要是在語音、圖片、視頻、多模態(tài)上。
國(guó)內(nèi)還有像豆包、騰訊元寶等也都做得很好。
但今天大模型落地實(shí)際上已經(jīng)開始出現(xiàn)了不同的戰(zhàn)略角度,有的專注于娛樂、電商、開源,有的專注于其他領(lǐng)域。
我們?cè)?023年5月6日推出訊飛星火1.0,我們的口號(hào)就是解放生產(chǎn)力,釋放生產(chǎn)力,我們是“1+N”,底座模型必須自己掌控,才能不斷地在上面做更好的強(qiáng)化訓(xùn)練,更好的升級(jí),然后“N”是我們落地的。
我們現(xiàn)在與教育、醫(yī)療、司法、央國(guó)企、汽車、金融、能源等的落地都是行業(yè)第一。
去年我們央國(guó)企招標(biāo)數(shù)比前年多了15個(gè)億,招標(biāo)金額多了7.2倍,我們是中標(biāo)第一,超過第二名到第六名加起來的水平。
為什么?因?yàn)榻裉熘髁鞯娜窨上螺d的通用大模型,除了星火以外,其他全是由英偉達(dá)的卡訓(xùn)練的。
2022年美國(guó)規(guī)定中國(guó)的卡要限高限寬,所以美國(guó)人用A100,中國(guó)只能用閹割后的A800,結(jié)果2023年美國(guó)的政策更加嚴(yán)格,不光中國(guó)買不了,可能給中國(guó)做中間地帶輸送算力的四十幾個(gè)國(guó)家業(yè)全被堵死了。特朗普上臺(tái)以后,可能這些智算的訓(xùn)練卡全部會(huì)被限制。
芯片方面,原來我們可以使用12納米、16納米的芯片,例如三星、臺(tái)積電,生產(chǎn)完成后,可以利用芯片堆疊技術(shù)堆到7納米以下的性能。
目前這條路從今年一二月份開始已經(jīng)被堵死。
因此在這個(gè)背景下,中國(guó)是否有自主可控的國(guó)產(chǎn)算力支撐大模型訓(xùn)練非常關(guān)鍵。
大模型對(duì)算力最重要的兩個(gè)地方,一是訓(xùn)練,二是推理。訓(xùn)練就像我們學(xué)習(xí),學(xué)會(huì)后參加高考,參加博士考試,然后工作。學(xué)的過程中訓(xùn)練的難度極大,訓(xùn)練完成后對(duì)外提供服務(wù)的推理相對(duì)簡(jiǎn)單。
2023年10月24日,我們?cè)诤戏式酥袊?guó)首個(gè)萬卡的國(guó)產(chǎn)算力,華為910B,當(dāng)時(shí)對(duì)標(biāo)美國(guó)的算力只有百分之二十幾的效率,人家三個(gè)月而我們要一年多,所以2023年一年我們?cè)趪?guó)產(chǎn)算力上發(fā)力,把它從對(duì)標(biāo)美國(guó)A800做到A100的能力從百分之二十幾提升到90%。
我們?nèi)ツ?月30日推出中國(guó)首個(gè)用國(guó)產(chǎn)算力訓(xùn)練出來的千億大模型,訊飛星火3.5。
為什么大家都不愿意用國(guó)產(chǎn)卡?英偉達(dá)每一個(gè)新的工具出來,在國(guó)產(chǎn)上少則一周,多則需要一個(gè)半月做各種適配。
其實(shí)我們?nèi)ツ?0月份就跑通了深度推理和長(zhǎng)思維鏈的模式,但是在國(guó)產(chǎn)算力上整整花了兩個(gè)月把各種工具匹配好,才能夠進(jìn)行訓(xùn)練。
2025年1月15日,訊飛星火X1發(fā)布,是首個(gè)用國(guó)產(chǎn)算力訓(xùn)練出來的長(zhǎng)思維鏈模型,但是R1是671B,我們只有13B,因?yàn)闀r(shí)間太短,國(guó)產(chǎn)算力剛剛把數(shù)據(jù)調(diào)完。
到了3月3日,我們用70B在數(shù)學(xué)上已經(jīng)達(dá)到R1的效果,比它低一個(gè)數(shù)量級(jí),數(shù)學(xué)跑通了,長(zhǎng)思維鏈的邏輯就全通了。
但我想說的是這個(gè)事情在國(guó)產(chǎn)算力上要把它跑通,有特別多的坑。如果中國(guó)沒有一家企業(yè)做,我們的大模型又會(huì)回到當(dāng)年和英特爾CPU一樣,龍芯出來了,可是誰都不用,中國(guó)芯就永遠(yuǎn)發(fā)展不起來。
因此在國(guó)產(chǎn)戰(zhàn)略上,我們必須認(rèn)真對(duì)待,無論多困難,耗費(fèi)多大的算力,都必須堅(jiān)定不移地繼續(xù)前進(jìn)。
三、企業(yè)如何擁抱AI?
在當(dāng)前的態(tài)勢(shì)下,我認(rèn)為大家應(yīng)該特別關(guān)注底座大模型的快速發(fā)展。如果現(xiàn)在底座模型達(dá)到70分、80分,那么兩年后可能達(dá)到80分、90分,甚至可能達(dá)到諾獎(jiǎng)級(jí)別,在專業(yè)領(lǐng)域進(jìn)行科研。
再到場(chǎng)景定制,在提升5到10個(gè)點(diǎn),達(dá)到95分、100分,到時(shí)候它就可以獨(dú)立完成任務(wù)。
原本人機(jī)協(xié)同需要1萬人完成,現(xiàn)在只要100人就能完成。
但是只靠通用大模型還不夠,幻覺問題解決不了,最近有第三方機(jī)構(gòu)測(cè)的,比如大家都知道的DS,我覺得它提升了中國(guó)社會(huì)各階層對(duì)自主創(chuàng)新的自信心。
但是拿DS作為例子來說,V3的幻覺是百分之三點(diǎn)幾,R1是百分之十幾,因?yàn)樗脧?qiáng)化學(xué)習(xí)用的訓(xùn)練數(shù)據(jù)更少。所以必須要在大模型底座能力上結(jié)合專業(yè)行業(yè)數(shù)據(jù),而且能夠外掛企業(yè)自己的實(shí)時(shí)產(chǎn)生的各種數(shù)據(jù)和支持,才能把幻覺降到能用的門檻,否則沒法使用。
所謂的第一眼驚艷到我們企業(yè)的研產(chǎn)供銷服管產(chǎn)品落地,必須要做定制化。
今天的大模型在C端的用戶數(shù)量春節(jié)前后已經(jīng)達(dá)到2.49億,已經(jīng)跨越技術(shù)規(guī)?;瘧?yīng)用的鴻溝。
早期創(chuàng)新者的占比為2.5%,探索型早期嘗鮮者占比是13.5%,跨越16%后就可以進(jìn)入規(guī)?;l(fā)階段。
所以2025被稱為全民AI的時(shí)代,成為全行業(yè)AI應(yīng)用的拐點(diǎn)。
那么在這個(gè)時(shí)候,大家如果不讓自己的企業(yè)和生意運(yùn)行在大模型之上,大概率現(xiàn)在所有靠堆人力和時(shí)長(zhǎng)的商業(yè)模式都會(huì)在一兩年內(nèi)被徹底顛覆掉。
關(guān)注這個(gè)變化不應(yīng)該盲目地被焦慮感推動(dòng),而是要客觀地分析自己的每一個(gè)業(yè)務(wù)環(huán)節(jié),研產(chǎn)供銷服務(wù)各個(gè)場(chǎng)景,認(rèn)認(rèn)真真地去構(gòu)建平臺(tái),因?yàn)闃I(yè)界開源越來越多,有非常多的單點(diǎn)的整合的各種工具,大家可以去嘗試。
現(xiàn)在底座模型7大方面已經(jīng)有1000多個(gè)細(xì)分的維度,雖然應(yīng)用場(chǎng)景我們自己的探索不如全行業(yè)在開源上做的多,但是科大訊飛今天必須是運(yùn)行在AI之上的微軟公司。
原來我們給央國(guó)企、金融與汽車這些行業(yè)龍頭做方案,下一步我們要把這些能力開放給所有人使用,你不用自己建算力,直接租用服務(wù)就行。
甚至我們跟工業(yè)園區(qū)聯(lián)合部署大模型,根據(jù)大模型成效合作分潤(rùn)。
所以我覺得我們第一,大家要關(guān)注這個(gè)業(yè)務(wù),找到切入點(diǎn)。第二,我們正在與許多城市合作構(gòu)建智算生態(tài),例如成都、武漢、無錫、蘇州和溫州。
訊飛是唯一國(guó)產(chǎn)算力構(gòu)建的自主可控大模型,未來中國(guó)的城市生態(tài)既服務(wù)于本地的創(chuàng)業(yè),又服務(wù)于本地產(chǎn)業(yè)發(fā)展,他們都需要構(gòu)建以算力和底座大模型算力支撐的產(chǎn)業(yè)生態(tài)。
如果大家利用算力,要借助這些生態(tài),這些城市會(huì)發(fā)放優(yōu)惠券并且打折,有公共平臺(tái)吸引大家。我認(rèn)為我們可以通過這方面拓展技術(shù)賦能和行業(yè)經(jīng)驗(yàn),共同站在AI的平臺(tái)上共同發(fā)展。
謝謝大家。
排版| 椰子| 允允主編| 孫允廣
熱門跟貼