打開網(wǎng)易新聞 查看精彩圖片

行云集成電路創(chuàng)始人、CEO季宇

4月30日消息,鈦媒體AGI獲悉,清華90后創(chuàng)立的北京行云集成電路有限公司(簡稱“行云集成電路”)宣布,推出全新的一體機產(chǎn)品“褐蟻”,僅需最高15萬元就可以跑滿血版DeepSeek R1/V3大模型,并且對話速度達到了20token/s。

今天下午,行云集成電路創(chuàng)始人、CEO季宇對鈦媒體AGI表示,目前“褐蟻”一體機已經(jīng)支持阿里最新發(fā)布的Qwen3系列開源大模型,包括頂配版Qwen3-235B-A22B。

具體來說,“褐蟻”一體機有三款不同的配置:最高性價比的“超大杯”褐蟻HY90,搭載雙路AMD EPYC 9355服務(wù)器、24條 48G 6400M頻率內(nèi)存和NV 5090D計算卡,支持FP8、INT4兩種數(shù)據(jù)精度,在FP8精度下跑滿血版DS能達到21token/s的對話速度,在INT4精度下則能達到28token/s,最高支持128K的上下文,售價14.9萬元;此外,行云集成電路還將推出“大杯”褐蟻HY70、“中杯”褐蟻HY50兩個配置版本。

打開網(wǎng)易新聞 查看精彩圖片

季宇團隊表示,行云通過對推理引擎的獨家優(yōu)化提升了推理效率,是國內(nèi)首個在10萬價位提供滿血FP8精度模型20+tps速率的一體機產(chǎn)品,并且可配置各類調(diào)用大模型API的應(yīng)用。

據(jù)悉,行云集成電路成立于2023年8月,其核心團隊主要來自清華大學(xué)及全球頂尖芯片公司,致力于研發(fā)下一代針對大模型推理場景的高效能GPU芯片,創(chuàng)始人包括季宇,以及公司CTO余洪敏。

其中,31歲的季宇是清華大學(xué)物理本科、計算機體系結(jié)構(gòu)方向博士,也是“華為天才少年”之一,主攻體系結(jié)構(gòu)、AI芯片方向。而在華為期間,季宇曾是海思昇騰芯片編譯器專家,負責(zé)多個昇騰編譯器項目,同時作為研究科學(xué)家,展開AI編譯器領(lǐng)域和處理器微架構(gòu)域諸多挑戰(zhàn)性問題攻關(guān);類腦計算機體系結(jié)構(gòu)《自然》論文共同一作,中國計算機學(xué)會CCF優(yōu)博獎獲得者。

2024年11月,行云集成電路宣布完成總額數(shù)億元的天使輪及天使+輪融資,投資方包括智譜AI、仁愛集團、中科創(chuàng)星、奇績創(chuàng)壇、水木清華校友基金、嘉御資本、春華資本、同創(chuàng)偉業(yè)、峰瑞資本等機構(gòu)。

季宇早前表示,當(dāng)機器的門檻低到消費級可以接受的成本,邊際成本承擔(dān)的商業(yè)模型也會發(fā)生變化,帶來進一步的產(chǎn)業(yè)繁榮。如果計算機體系能支撐消費級可以接受的價格享受極致的AI體驗,大模型產(chǎn)業(yè)會進一步進入一個類似軟件行業(yè)零邊際成本的超高速爆發(fā)期。

事實上,目前多家芯片、服務(wù)器、云計算、運營商、AI Infra等領(lǐng)域的公司都發(fā)布了DeepSeek一體機產(chǎn)品,堪稱“百機大戰(zhàn)”,但其中可以運行滿血版DeepSeek-V3/R1模型的企業(yè)并不多,目前國產(chǎn)GPU芯片層面主要有壁仞科技、摩爾線程等。

據(jù)第一財經(jīng)引述券商數(shù)據(jù),預(yù)計到2027年,國內(nèi)一體機的市場規(guī)模將超過5000億元,超過30家企業(yè)已向市場推出了一體機產(chǎn)品。

一位行業(yè)人士早前對鈦媒體AGI表示,一體機核心解決的是部署易用性問題。相比復(fù)雜的云計算解決方案,項目落地周期更快、私有化安全性更高、價格更有性價比,但DeepSeek一體機比較大的問題在于持續(xù)維護、升級以及大規(guī)模數(shù)據(jù)調(diào)度等,以及一體機綜合使用成本沒有辦法復(fù)用。

“從當(dāng)年數(shù)據(jù)庫年代,一體機就興起,這個大家非常喜歡,但不同的一體機,里面的東西差別是非常大的。DeepSeek出來以后,DeepSeek一體機爆火,我跟一些領(lǐng)導(dǎo)也聊過,數(shù)據(jù)中心算力這塊賣得特別好,但都是短期租賃,因為本身硬件固定資產(chǎn)的年限也就4到5年。所以,我們可以看到一體機比較大的問題是以后持續(xù)性的維護、升級以及大規(guī)模數(shù)據(jù)調(diào)度等,比如DeepSeek一體機是很新鮮,但是大模型演進非???,現(xiàn)在DeepSeek已經(jīng)不是最領(lǐng)先的了,其他公司也能升上去,而客戶本身可能根本沒有這方面的技術(shù)能力?!鄙鲜鋈耸勘硎荆?strong>推理一體機只是過渡態(tài)產(chǎn)品,最終大模型還是要和云計算進行結(jié)合,當(dāng)整個技術(shù)成熟以后,跟多云整合,最后會變成云平臺的一部分。

對此,在季宇看來,現(xiàn)在一體機依然能夠跑得動超大杯的MoE模型和30b當(dāng)量的dense模型,后續(xù)模型迭代其實還好。據(jù)悉,相比其他一體機產(chǎn)品,行云集成電路的“褐蟻”在顯存、KTransformers等層面有更多的技術(shù)研發(fā)能力。

據(jù)鈦媒體AGI了解,下一步,行云集成電路將自研GPU卡,持續(xù)帶來更低價格,更高tps體驗,并且還將實施由30臺褐蟻一體機組成的“蟻群”方案,進一步發(fā)揮分布式系統(tǒng)優(yōu)化能力,或?qū)⒅С?00-1000的有效并發(fā)數(shù),而價格有望降至300萬-400萬元——低于英偉達HGX H200集群的整體硬件成本。

鈦媒體AGI分析認(rèn)為,從整個商業(yè)市場的視角來看,當(dāng)前國內(nèi)有很多人都投身于一體機、AI Infra,以及GPU服務(wù)器等類似算力“賣水人”工作。隨著推理模型技術(shù)迅猛發(fā)展,大規(guī)模算力投入被質(zhì)疑,所以國內(nèi) AI 算力行業(yè)是否將如同AGI基座模型市場一般,經(jīng)歷大浪淘沙后最終僅剩下大廠及頭部的幾家企業(yè),還是說依然會有更多人“卷”性價比,這一點仍有待進一步觀察。

根據(jù)規(guī)劃,季宇的最終目標(biāo)是:為AI構(gòu)建x86,目標(biāo)是讓AI PC與互聯(lián)網(wǎng)底座重回組裝機模式(PC及服務(wù)器),將組裝機打造成 AI 基座,低成本搭建高端大模型,激活A(yù)I服務(wù)器組裝機體系,讓大家能組裝出支撐高端AI應(yīng)用的設(shè)備,帶動體系運轉(zhuǎn)。

(本文首發(fā)于鈦媒體App,作者|林志佳)