11月14日,網(wǎng)絡(luò)上流傳著一張圖,阿里前AI科學(xué)家賈揚(yáng)清指稱,某國產(chǎn)大模型實(shí)際上是抄襲的LLaMA,然后更換了幾個(gè)變量名就宣稱是自己研發(fā)。雖然他沒有明確指出該模型的名字,但有國外開發(fā)者直接點(diǎn)名,這個(gè)抄襲的模型就是李開復(fù)旗下的“零一萬物(Yi-34B)”,在零一萬物的Hugging Face開源主頁上,開發(fā)者ehartford質(zhì)疑稱該模型使用了Meta LLaMA的架構(gòu),只修改了兩個(gè)tensor(張量)。
李開復(fù)創(chuàng)辦的AI公司零一萬物(01.AI)前幾天發(fā)布了它的開源大模型Yi-34B,公布的基準(zhǔn)測試結(jié)果顯示,雖然模型參數(shù)少于其它大模型,但性能更出色。
李開復(fù)表示:“零一萬物堅(jiān)定進(jìn)軍全球第一梯隊(duì)目標(biāo),從招的第一個(gè)人,寫的第一行代碼,設(shè)計(jì)的第一個(gè)模型開始,就一直抱著成為世界第一的初衷和決心。我們組成了一支有潛力對(duì)標(biāo) OpenAI、Google等一線大廠的團(tuán)隊(duì),經(jīng)歷了近半年的厚積薄發(fā),交出了第一張極具全球競爭力的耀眼成績單。Yi-34B可以說不負(fù)眾望,一鳴驚人?!?/p>
在Hugging Face的討論區(qū),開發(fā)者很快指出Yi-34B其實(shí)是對(duì)Meta開源大模型LlaMa的重構(gòu),最明顯的變化是改了幾個(gè)名字,分別為 input_layernorm 和 post_attention_layernorm。它的開源許可證也沒有提及LlaMa。它也沒有公布調(diào)試數(shù)據(jù),讓其他人能復(fù)現(xiàn)其基準(zhǔn)測試結(jié)果。
對(duì)此,零一萬物表示:GPT是一個(gè)業(yè)內(nèi)公認(rèn)的成熟架構(gòu),Llama在GPT上做了總結(jié)。零一萬物研發(fā)大模型的結(jié)構(gòu)設(shè)計(jì)基于GPT成熟結(jié)構(gòu),借鑒了行業(yè)頂尖水平的公開成果,由于大模型技術(shù)發(fā)展還在非常初期,與行業(yè)主流保持一致的結(jié)構(gòu),更有利于整體的適配與未來的迭代。同時(shí)零一萬物團(tuán)隊(duì)對(duì)模型和訓(xùn)練的理解做了大量工作,也在持續(xù)探索模型結(jié)構(gòu)層面本質(zhì)上的突破。
據(jù)悉,零一萬物的估值高達(dá)10億美元,已躋身獨(dú)角獸行列。
熱門跟貼