打開網易新聞 查看精彩圖片

階躍星辰CEO姜大昕

5月8日消息,鈦媒體AGI獲悉,階躍星辰今天下午在北京舉行一場媒體溝通會。

階躍星辰創(chuàng)始人、CEO姜大昕鈦媒體AGI等透露,預計未來兩、三個月(7-8月),階躍星辰會發(fā)布滿血版推理模型Step R1。同時,未來幾個月,階躍星辰還將發(fā)布更先進的Step圖片編輯模型。

姜大昕強調,模型的突破是早于商業(yè)化的。“多模理解生成一體化”是當前階躍星辰建立世界模型的最佳路徑之一,從而往智能涌現(xiàn)、AI Agent和通用人工智能(AGI)方向發(fā)展。

談及C端投流話題,姜大昕對鈦媒體AGI表示,DeepSeek出來之后已經證明,投流邏輯是不成立的,大家還是需要重新思考這個問題。

“DeepSeek給我們的經驗或是學到的東西,投流的邏輯實際上是不成立的,因為ChatGPT沒有去說過,但是他如果放開流量的話,他破億是沒有問題的。其實就是大家要重新思考一下,AI時代的產品,它的流量增長是不是真的是像傳統(tǒng)互聯(lián)網狀態(tài),還是靠投入上去的,大家需要重新看待這個問題。不只是DeepSeek,像哪吒、黑悟空神話等都有一些共性,不是靠傳統(tǒng)的鋪天蓋地的去投入、去積累?!苯箨糠Q。

姜大昕表示,AI Agent智能體爆發(fā)的前提需要多模態(tài)和慢思考能力,恰好2024年這兩個能力獲得了突破性進展。“多模態(tài)對于Agent的輸出是一個必備功能。”

姜大昕表示,模型的“理解生成一體化”非常重要,它是整個計算機視覺需要突破的一個堡壘。所謂GPT-4時刻,就是指模態(tài)層面AI模型真正能夠達到人的智能水平。因此,在階躍星辰看來,最終的目標是做“世界模型”。

“為什么大家覺得AGI路線越來越清晰,我確實有同樣的感覺,文本這條路已經看到了這里(當前)。雖然視覺最根本的問題當下沒有解決,但一旦突破以后,今后的道路會更加順暢?!苯箨糠Q。

打開網易新聞 查看精彩圖片

階躍星辰成立于2023年4月,是行業(yè)領先的通用大模型創(chuàng)業(yè)公司,堅定探索實現(xiàn)通用人工智能(AGI)的道路,已對外發(fā)布Step系列基座大模型矩陣。

階躍星辰以“智能階躍,十倍每一個人的可能”為使命,堅定自研超級模型,積極布局算力、數(shù)據(jù)等關鍵資源,發(fā)揮算法和人才優(yōu)勢,微軟前全球副總裁姜大昕擔任公司創(chuàng)始人、CEO,ResNet作者之一的AI科學家張祥雨、擁有豐富大規(guī)模集群與系統(tǒng)建設經驗的AI系統(tǒng)專家朱亦博等都先后加入階躍星辰。

融資方面,2024年12月,階躍星辰宣布完成B輪融資,總融資金額達數(shù)億美元,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰(zhàn)略和財務投資人包括騰訊投資、五源資本、啟明創(chuàng)投等。

產品層面,成立兩年,階躍星辰已經累計發(fā)布了22款自研基座模型,覆蓋文字、語音、圖像、視頻、音樂、推理等全系列。

其中,16款是多模態(tài)模型,占比超過7成,在行業(yè)內被稱為“多模態(tài)卷王”。多模態(tài)模型矩陣覆蓋圖像理解、視頻理解、圖像生成、視頻生成、圖像編輯、音樂生成等,全部處于行業(yè)領先水平。

打開網易新聞 查看精彩圖片

產業(yè)應用層面,階躍星辰聚焦智能終端Agent,已在汽車、手機、具身智能、IoT等關鍵應用場景與行業(yè)頭部達成深度合作。

今年1月,階躍星辰發(fā)布了Step R-mini,成為Step系列的首款推理模型,進一步拓展了大模型的能力邊界;2月,階躍星辰宣布開源新的文生視頻/圖生視頻模型Step-Video-T2V/TI2V,并與吉利汽車集團、千里科技、OPPO、智元機器人、TCL等企業(yè)展開合作,以及發(fā)布全新升級的“繁星計劃”2.0等。

進入5月,階躍星辰宣布與ACE Studio聯(lián)合開源3.5B版本的音樂大模型ACE-Step,并且與燦星文化戰(zhàn)略合作,開展AI+娛樂的深度融合。

姜大昕表示,多模態(tài)是實現(xiàn)AGI的必經之路。

他進一步表示,因為首先AGI對標的是人類的智能,人的智能是多元化的,每個人除了有來自語言的符號智能,還包括視覺智能、空間智能、運動智能等,這些智能需要通過視覺和其他模態(tài)來學習。所以,在多模態(tài)領域任何一個方向出現(xiàn)短板,都會延續(xù)這個實現(xiàn)AGI進程。

打開網易新聞 查看精彩圖片

姜大昕談到三個AI技術方向(預測):

  • 1、預訓練基礎模型+強化學習,可以激發(fā)模型推理的時候產生長思維鏈,極大提高模型的推理能力,從而把長思維鏈能力加入到語言模型,以及多模態(tài)模型里面。
  • 2、視覺領域理解生成一體化。理解和生成是用一個模型來完成,從而保證生成內容有意義和價值,需要對上下文做更好的理解。
  • 3、有了ChatBot App應用產品以后,我們就可以用它解數(shù)學題、寫代碼,然后下一步進化現(xiàn)在就是非常火熱的Agent,就是智能體?!拔蚁嘈胖悄荏w終將從這個數(shù)字世界走向物理世界,逐漸引申到像智能駕駛、人形機器人等領域?!?/li>

姜大昕認為,目前汽車輔助駕駛VLA是簡單預測模型,并沒有推理的VLA。對應來說,人是腦海里有一個action的分布,通過對未來的預判來決定,才能呈現(xiàn)出真正的VLA。

智能終端Agent是階躍星辰的發(fā)力領域。姜大昕稱,Agent首先要能夠更好去幫助人類去完成任務,需要理解用戶所處的環(huán)境和任務情況,其實很多終端是用戶感知、用戶體驗的延伸,比如說手機、AI眼鏡或是AI耳機,被認為是人體器官延伸,它可以去收集我們所處的環(huán)境,從而能幫助模型更好地理解用戶的上下文。

姜大昕稱,他非常看好AI眼鏡的發(fā)展,人形機器人的泛化能力還有很長的路要走。

談及階躍星辰依然堅持基礎大模型,姜大昕認為有兩層:一、現(xiàn)在AI技術的行業(yè)趨勢和需求還是非常強烈的,整個行業(yè)技術發(fā)展很快,所以,公司需要這樣一個前進趨勢,從而堅持做基礎模型研發(fā);二、從應用角度看,我們一直覺得應用和模型是相輔相成的,模型可以決定應用的上限,然后應用給模型提供具體的應用場景,它的數(shù)據(jù),這是非常重要的。

談到C端盈利空間,姜大昕稱,階躍星辰是通過端側AI Agent服務提供,最終這些企業(yè)和終端還是服務于消費者。

談及階躍多模態(tài)在行業(yè)里定位時,姜大昕表示,海外層面,OpenAI和Google是第一梯隊xAI的隱藏實力是很強的,需要時間爆發(fā);國內的 AI 產品更強調理解領先性,或者專注在AI視頻生成單一領域,而階躍星辰不太一樣的點在于,不僅做基礎模型,還在代際層面做很多應用。

“最后總結一下,第一個,我們目前狀態(tài)是堅持基礎大模型研發(fā),所以追求AGI是我們的初心,我們也不會改變;第二是在當前競爭格局當中,階躍差異化的特點其實是多模態(tài)能力,在業(yè)界內性能是領先的,而且我們也在積極探索前沿方向,我們也認為還存在非常巨大的機會;最后在應用層面,我們也走了一條差異化路線,攜手合作伙伴在智能終端AI Agent方向上發(fā)力,最終形成一個從模型到Agent,從云上到端側的這樣的生態(tài)體系?!苯箨勘硎?。

(本文首發(fā)鈦媒體App,作者|林志佳)