4月10日,商湯科技發(fā)布其最新大模型「日日新 SenseNova V6」。主打多模態(tài)推理、長(zhǎng)思維鏈訓(xùn)練與低成本推理能力,意圖在國(guó)產(chǎn)大模型競(jìng)爭(zhēng)中建立領(lǐng)先地位。

打開網(wǎng)易新聞 查看精彩圖片

據(jù)商湯介紹,V6版本在語言、圖像、視頻等多模態(tài)任務(wù)中均實(shí)現(xiàn)大幅性能躍升,標(biāo)志性能力包括長(zhǎng)文本推理、數(shù)理分析、全局記憶和視頻理解。

據(jù)悉,其多模態(tài)推理能力已超過 GPT-4o,并對(duì)標(biāo) GPT-o1和 Gemini 2.5 Turbo。

V6的模型訓(xùn)練效率與推理成本被稱為“業(yè)內(nèi)最低”,并推出了輕量級(jí)全模態(tài)交互版本 SenseNova V6 Omni,應(yīng)用于翻譯、講解和導(dǎo)游等消費(fèi)場(chǎng)景。

在視頻能力上,V6成為國(guó)內(nèi)首個(gè)支持10分鐘中長(zhǎng)視頻高效解析的大模型,具備“全幀率解析”與內(nèi)容生成能力。技術(shù)核心包括多模態(tài)統(tǒng)一時(shí)序表征和內(nèi)容敏感壓縮,能將視頻壓縮至16K tokens,同時(shí)保留關(guān)鍵語義信息。

此外,V6搭載基于200B高質(zhì)量數(shù)據(jù)訓(xùn)練的長(zhǎng)思維鏈系統(tǒng),支持最長(zhǎng)64K上下文處理。

商湯董事長(zhǎng)兼CEO徐立表示:“AI之道,在于百姓之日用?!?V6意圖從日常生活高頻場(chǎng)景出發(fā),拓展AI“可用性”邊界。(袁寧)

本文來自網(wǎng)易科技報(bào)道,更多資訊和深度內(nèi)容,關(guān)注我們。