作者 | 鄧詠儀
編輯 | 蘇建勛
“講卡傷感情,沒(méi)卡沒(méi)感情?!?/p>
2024年的IDEA大會(huì)上,IDEA創(chuàng)院理事長(zhǎng)、美國(guó)國(guó)家工程院外籍院士沈向洋,拋出了一句格外現(xiàn)實(shí)又幽默的話。
另一方面,這也展現(xiàn)了他對(duì)未來(lái)AI時(shí)代一種鮮明的樂(lè)觀情緒。
大模型的發(fā)展已經(jīng)不如ChatGPT發(fā)布后那樣,經(jīng)歷陡峭增長(zhǎng)。進(jìn)入到人類(lèi)探索AGI(通用人工智能)的第二年,大語(yǔ)言模型的迭代已經(jīng)放緩。相應(yīng)地,AI應(yīng)用、落地,占據(jù)了全球話題的中心。
但沈向洋覺(jué)得,雖然GPT-5尚未見(jiàn)身影,但算力的增長(zhǎng)還是呈樂(lè)觀趨勢(shì)——根據(jù)EPOCH AI數(shù)據(jù)統(tǒng)計(jì),大模型對(duì)于算力的需求,每年都是呈現(xiàn)四倍多的增長(zhǎng)。
按這樣的增長(zhǎng)速度,以往按18個(gè)月算力漲一倍的摩爾定律也不再奏效。沈向洋重點(diǎn)解釋了黃仁勛的“黃氏定律”,以模型訓(xùn)練來(lái)衡量算力的增長(zhǎng)。若恒定按照一年漲四倍的算力速度增長(zhǎng),十年或許會(huì)預(yù)見(jiàn)100萬(wàn)倍的算力需求增長(zhǎng)。不過(guò)這一定律,仍需要時(shí)間來(lái)檢驗(yàn)。
“大模型要往前走,不單是參數(shù)擴(kuò)大、模型規(guī)模大了之后,對(duì)訓(xùn)練的要求變高了,數(shù)據(jù)量也要增長(zhǎng)。某種意義上來(lái)講,對(duì)算力的需求呈跟參數(shù)的平方關(guān)系,這就是不得了的算力需求?!彼f(shuō)。

沈向洋 來(lái)源:作者拍攝
“過(guò)去這幾年大家都講‘人工智能三件套’,實(shí)際上都繞不開(kāi)‘算力、算法、數(shù)據(jù)’這三件事情。”在這次大會(huì)上,沈向洋穿針引線,花了3個(gè)小時(shí)圍繞“算法、算力、數(shù)據(jù)”這三個(gè)方向,來(lái)介紹IDEA的全新進(jìn)展。
視覺(jué)模型仍是IDEA的研究重點(diǎn)——IDEA正式發(fā)布的最新通用視覺(jué)大模型DINO-X,可以擁有真正的物體級(jí)別理解能力。
這意味著,不像普通的視覺(jué)模型有訓(xùn)練數(shù)據(jù)的限制,DINO-X可以實(shí)現(xiàn)開(kāi)放世界(Open-world)實(shí)現(xiàn)目標(biāo)檢測(cè)——無(wú)需用戶提示,直接就可以檢測(cè)所有物體,包括罕見(jiàn)的長(zhǎng)尾物體(出現(xiàn)頻率低但種類(lèi)繁多的物體)。
這也會(huì)大大拓展模型的落地場(chǎng)景。
比如,“具身智能”是2024年火了一整年的AI行業(yè)話題。對(duì)于視障人士服務(wù)、服務(wù)類(lèi)機(jī)器人等高難度場(chǎng)景,以往非常依賴大量的高質(zhì)量數(shù)據(jù)標(biāo)注,耗費(fèi)巨量人力。但在DINO-X的幫助下,視覺(jué)模型可以幫助標(biāo)注公司快速完成大批量的高質(zhì)量圖像標(biāo)注或者為標(biāo)注員提供自動(dòng)化的輔助結(jié)果,從而降低手工標(biāo)注的工作量。

來(lái)源:IDEA
對(duì)傳統(tǒng)的視覺(jué)模型應(yīng)用廣泛的場(chǎng)景,DINO-X也在自動(dòng)駕駛、智能安防、工業(yè)檢測(cè)等領(lǐng)域,會(huì)成為一個(gè)有力的補(bǔ)充,系統(tǒng)能夠應(yīng)對(duì)各種復(fù)雜場(chǎng)景,識(shí)別出傳統(tǒng)模型難以檢測(cè)的物體。
IDEA團(tuán)隊(duì)還推出行業(yè)平臺(tái)架構(gòu),通過(guò)一個(gè)大模型基座,結(jié)合通用識(shí)別技術(shù)結(jié)合,讓模型不需重新訓(xùn)練,就可邊用邊學(xué),支撐多種多樣的B端應(yīng)用需求。
“用一個(gè)模型解決一百萬(wàn)個(gè)問(wèn)題”,是這次模型發(fā)布的關(guān)鍵理念。
有別于主流的“全圖理解”的方法,IDEA通過(guò)在物體級(jí)別的理解上加入語(yǔ)言模塊,來(lái)優(yōu)化大模型的幻覺(jué)問(wèn)題。結(jié)合自研的“視覺(jué)提示優(yōu)化”方法后,無(wú)需更改模型結(jié)構(gòu),不用重新訓(xùn)練模型,也可以實(shí)現(xiàn)小樣本下的場(chǎng)景化定制。

來(lái)源:IDEA研究院
不過(guò),隨著模型體量不斷變大,高質(zhì)量數(shù)據(jù)已經(jīng)成為桎梏?!艾F(xiàn)在人工智能的發(fā)展,已經(jīng)耗盡了人類(lèi)社會(huì)的所有高質(zhì)量數(shù)據(jù)?!鄙蛳蜓蟊硎尽?/p>
合成數(shù)據(jù)隨之而生。IDEA團(tuán)隊(duì)此次也發(fā)布了自研的語(yǔ)境圖譜技術(shù),解決過(guò)往文本數(shù)據(jù)合成方案的多樣性匱乏等問(wèn)題。該技術(shù)相當(dāng)于是合成數(shù)據(jù)引入“指導(dǎo)手冊(cè)”,以圖譜為綱,指導(dǎo)用于合成的語(yǔ)境采樣。
從實(shí)驗(yàn)結(jié)果顯示,IDEA團(tuán)隊(duì)的方案能持續(xù)為大模型帶來(lái)能力提升,表現(xiàn)超過(guò)目前的最佳實(shí)踐(SOTA);從token消耗來(lái)看,平均節(jié)約成本85.7%。目前,該技術(shù)內(nèi)測(cè)平臺(tái)已開(kāi)放,通過(guò)API提供服務(wù)。
在2024年,IDEA在AI應(yīng)用落地層面明顯提速。相較去年的科研論文閱讀平臺(tái),今年IDEA公布了更多垂直領(lǐng)域的應(yīng)用探索。
在預(yù)測(cè)方面,IDEA研發(fā)了多個(gè)化學(xué)領(lǐng)域?qū)<掖竽P?,在分子屬性預(yù)測(cè)和化學(xué)反應(yīng)預(yù)測(cè)能力上,都可以達(dá)到業(yè)界領(lǐng)先水平。
AI模型也可以應(yīng)用在科研數(shù)據(jù)上,加快科研數(shù)據(jù)的處理速度。IDEA新發(fā)布的化學(xué)文獻(xiàn)多模態(tài)大模型,就聯(lián)合晶泰科技發(fā)布專(zhuān)利數(shù)據(jù)挖掘平臺(tái)PatSight。這一模型將藥物領(lǐng)域的專(zhuān)利化合物數(shù)據(jù)挖掘時(shí)間,從數(shù)周縮短至1小時(shí)。
而今年的一大熱門(mén)方向——AI編程,正是因?yàn)槟P椭橇λ讲粩嗵嵘?,而成為下一個(gè)熱門(mén)的應(yīng)用方向。IDEA研究院的MoonBit團(tuán)隊(duì),就展示了其開(kāi)發(fā)平臺(tái)的編程模塊MoonBit。這個(gè)云原生AI編程工具,已具備完備的多后端支持和跨平臺(tái)能力,可在硬件上直接運(yùn)行,支持RISC-V架構(gòu),并將于12月正式開(kāi)放。
模型也從軟件層面走到硬件層面,更多在現(xiàn)實(shí)世界產(chǎn)生效用。
坐落在大灣區(qū)IDEA,有著得天獨(dú)厚的硬件產(chǎn)業(yè)基礎(chǔ)和優(yōu)勢(shì)。這次會(huì)議上,IDEA也一連宣布三個(gè)合作:與騰訊合作,在深圳福田區(qū)、河套深港科技創(chuàng)新合作區(qū)落地建設(shè)福田實(shí)驗(yàn)室,聚焦人居環(huán)境具身智能技術(shù);與美團(tuán)合作,探索無(wú)人機(jī)視覺(jué)智能技術(shù);與比亞迪合作,拓展工業(yè)化機(jī)器人智能應(yīng)用。
“低空經(jīng)濟(jì)”則是另一個(gè)IDEA強(qiáng)調(diào)的領(lǐng)域。IDEA不僅發(fā)布了《低空經(jīng)濟(jì)發(fā)展白皮書(shū)3.0》,還發(fā)起共建OpenSILAS創(chuàng)新聯(lián)合體,與17家首批發(fā)起單位攜手,預(yù)期打造一個(gè)開(kāi)放共享、技術(shù)領(lǐng)先、不斷迭代的系統(tǒng)和平臺(tái)。
2024年,已經(jīng)是IDEA大會(huì)的第四屆大會(huì)。在這四年中,AI不僅從以CV(視覺(jué)識(shí)別)為主的1.0時(shí)代,跨越到以生成式AI為主的2.0時(shí)代,更是帶來(lái)了AI治理等下一個(gè)時(shí)代的重要命題。如今的人類(lèi)社會(huì)也許需要更多思考:我們與AI該如何更好地共存?
“AI的發(fā)展,能不能從經(jīng)濟(jì)最大的增長(zhǎng),轉(zhuǎn)化到人類(lèi)的最大福祉?這是在座的,在IDEA研究院從事技術(shù)研發(fā)的同事,以及產(chǎn)業(yè)落地的同事,在人工智能發(fā)展的道路上必須要去思考的問(wèn)題?!鄙蛳蜓笳f(shuō)。
熱門(mén)跟貼