o1 是 OpenAI 在今年 9 月發(fā)布的新模型,它有更強(qiáng)推理和數(shù)學(xué)能力。楊植麟曾在 o1 發(fā)布后不久的一場演講中說,o1 的出現(xiàn)意味著大模型的范式轉(zhuǎn)換:從預(yù)測下一個 token 的規(guī)模擴(kuò)展( Next-Token Prediction Scaling)到強(qiáng)化學(xué)習(xí)的規(guī)模擴(kuò)展(Reinforcement Learning Scaling)。 我們獨家獲悉,在探索新技術(shù)變化的同時,月之暗面近期引入一位新技術(shù)負(fù)責(zé)人——華為諾亞方舟實驗室原 AI 基礎(chǔ)理論團(tuán)隊研究員,劉征瀛。他正在月之暗面帶隊探索 o1 方向。 據(jù)了解,劉征瀛也曾被字節(jié)跳動高層邀請加入字節(jié)大模型團(tuán)隊,但他選擇了加入創(chuàng)業(yè)公司。
o1 是 OpenAI 在今年 9 月發(fā)布的新模型,它有更強(qiáng)推理和數(shù)學(xué)能力。楊植麟曾在 o1 發(fā)布后不久的一場演講中說,o1 的出現(xiàn)意味著大模型的范式轉(zhuǎn)換:從預(yù)測下一個 token 的規(guī)模擴(kuò)展( Next-Token Prediction Scaling)到強(qiáng)化學(xué)習(xí)的規(guī)模擴(kuò)展(Reinforcement Learning Scaling)。 我們獨家獲悉,在探索新技術(shù)變化的同時,月之暗面近期引入一位新技術(shù)負(fù)責(zé)人——華為諾亞方舟實驗室原 AI 基礎(chǔ)理論團(tuán)隊研究員,劉征瀛。他正在月之暗面帶隊探索 o1 方向。 據(jù)了解,劉征瀛也曾被字節(jié)跳動高層邀請加入字節(jié)大模型團(tuán)隊,但他選擇了加入創(chuàng)業(yè)公司。