機(jī)器之心原創(chuàng)
作者:蛋醬
「21 世紀(jì)什么最貴?人才!」二十年前的黎叔語(yǔ)錄,現(xiàn)在聽(tīng)來(lái)也不過(guò)時(shí)。
這兩年,大模型賽道風(fēng)起云涌??萍脊緜?nèi)ν度肷墒?AI 技術(shù)的研發(fā),期待將新的突破整合到自家產(chǎn)品中。OpenAI 是一個(gè)非常成功的樣本,并受到了研究員、工程師和投資人們的廣泛關(guān)注與深刻討論:為什么是 OpenAI?
它的成功不只來(lái)自于多年的堅(jiān)持技術(shù)探索、投資者不斷注入的資金,更重要的是一批頂尖 AI 研究人員的聚集。我們能看到,在 ChatGPT、Sora、GPT-4o 等劃時(shí)代產(chǎn)品的背后,有一長(zhǎng)串名單的核心貢獻(xiàn)者,
一家科技公司想要持續(xù)「?jìng)ゴ蟆?,技術(shù)人才是關(guān)鍵要素。
目光轉(zhuǎn)回國(guó)內(nèi),我們同樣能看到一群懷抱著理想與熱忱的技術(shù)人:有人苦戰(zhàn)數(shù)月,和團(tuán)隊(duì)一起打造了首個(gè)中文原生 DiT 架構(gòu)文生圖開(kāi)源模型;有人翻遍所有最新論文,為了將用戶(hù)體驗(yàn)到的延遲從 10 毫秒降到 1 毫秒;有人多年如一日投身科學(xué)大模型的研發(fā),希望找到用 AI 闡釋生命的密碼。
這些人是如何工作的?在走近并傾聽(tīng)了他們的故事之后,我們發(fā)現(xiàn)了三個(gè)共同要素:真心熱愛(ài)的賽道、對(duì)前沿技術(shù)的極致追求,以及持之以恒的自我驅(qū)動(dòng)。
當(dāng)然,人才也需要鼓勵(lì)創(chuàng)新的土壤來(lái)適配。一種觀點(diǎn)是,科技公司應(yīng)該不唯學(xué)歷,公平選擇最懂得解決問(wèn)題的人。還有一種觀點(diǎn)是,應(yīng)該不唯資歷,敢于重用新人,讓團(tuán)隊(duì)永遠(yuǎn)流動(dòng)著新鮮血液。總之,這是一個(gè)值得任何科技公司認(rèn)真思考的問(wèn)題。
讓中文原生大模型做到世界領(lǐng)先
七年前,高研(化名)拿到博士學(xué)位踏上回國(guó)航班的時(shí)候,根本想象不到,在接下來(lái)的幾年里,人工智能領(lǐng)域會(huì)經(jīng)歷如此一場(chǎng)巨變。
我們知道,計(jì)算機(jī)視覺(jué)領(lǐng)域存在兩種理解視覺(jué)處理的方式:判別式和生成式。這兩種引導(dǎo)研究者們走上了不同的道路,在高研畢業(yè)之前,以「人臉識(shí)別」為代表的判別式 AI 技術(shù)剛剛經(jīng)歷了一場(chǎng)爆發(fā)。從大洋彼岸到國(guó)內(nèi),技術(shù)創(chuàng)業(yè)的氛圍同樣火熱,門(mén)禁打卡、手機(jī)解鎖、智能家居等場(chǎng)景催生出大量全新的應(yīng)用。
高研就是在這一年來(lái)到騰訊。這是一個(gè)「雙向奔赴」的故事:手握數(shù)篇頂會(huì)頂刊的高研,只投了騰訊一家公司,然后,順利通過(guò)當(dāng)年騰訊的「技術(shù)大咖」項(xiàng)目入職。
如今,僅有 7 年工作經(jīng)驗(yàn)的高研,已經(jīng)先后在多個(gè)重點(diǎn)項(xiàng)目和論文中留下了自己的名字。
只不過(guò)這個(gè)過(guò)程中,他研究的內(nèi)容在與時(shí)俱進(jìn)。特別是從 2022 年開(kāi)始,生成式 AI 的爆發(fā)幾乎顛覆了以往的研究思路,文生圖成為了視覺(jué)領(lǐng)域的新熱點(diǎn)。
「技術(shù)不斷發(fā)展,當(dāng)年學(xué)的東西很多都『淘汰』了。」因此,學(xué)習(xí)也就成為了高研日常工作的一部分:每天下班回到家,都要瀏覽最新的技術(shù)研究,追蹤最新的論文。
作為騰訊混元大模型團(tuán)隊(duì)最早的一批成員,高研的研發(fā)成果已經(jīng)被很多人用上 —— 過(guò)去一年,混元大模型的文生圖能力實(shí)現(xiàn)了「從無(wú)到有」,然后是更加「精準(zhǔn)、美觀」。
強(qiáng)大的文生圖能力背后,是高研和團(tuán)隊(duì)成員的數(shù)月奮戰(zhàn):業(yè)內(nèi)首個(gè)中文原生的 DiT 架構(gòu)文生圖模型「混元 - DiT」。最近,混元 - DiT 已經(jīng)全面對(duì)外開(kāi)源。
- 模型地址:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
- 技術(shù)報(bào)告地址:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
混元 - DiT 的視覺(jué)生成效果對(duì)比前代混元文生圖大模型提升超過(guò) 20%。它支持中英文雙語(yǔ)輸入及理解,參數(shù)量 15 億,不僅可以支持文生圖,也可以作為視頻等多模態(tài)視覺(jué)生成的基礎(chǔ)。
多次迭代后,混元文生圖大模型已經(jīng)解決了「語(yǔ)義、內(nèi)容、質(zhì)感」這三點(diǎn)關(guān)鍵難題,且率先邁出了落地的步伐:騰訊很早就開(kāi)始在廣告場(chǎng)景進(jìn)行 AI 自動(dòng)生成廣告投放素材的探索,比如生成商品廣告或廣告配圖的產(chǎn)品「騰訊廣告妙思」。在廣告業(yè)務(wù)下的多輪測(cè)評(píng)中,騰訊混元文生圖的案例優(yōu)秀率和廣告主采納率分別達(dá)到 86% 和 26%,均高于同類(lèi)模型。
我們經(jīng)常說(shuō)幕后團(tuán)隊(duì)成就了一款產(chǎn)品的輝煌,但從另一個(gè)角度說(shuō),產(chǎn)品的成功也成就了團(tuán)隊(duì)中的每一個(gè)人。對(duì)于高研個(gè)人而言,他將參與混元大模型項(xiàng)目的經(jīng)歷比喻為「人生開(kāi)了加速器」—— 手中掌握的技術(shù)不僅能在更廣闊的場(chǎng)景上進(jìn)行充分應(yīng)用和驗(yàn)證,還能拓展出新的業(yè)務(wù)合作,這讓人真正感受到自己在做一件改變世界的事。
「博士畢業(yè)后,我教 AI 打游戲」
「父母知道你工作時(shí)打游戲嗎?」
聽(tīng)到這個(gè)問(wèn)題,傅志遠(yuǎn)(化名)笑了:「只知道我在游戲部門(mén)搞研究,但不知道我原來(lái)也打游戲?!?/p>
相比于博士期間大部分時(shí)間沉浸于論文和實(shí)驗(yàn)的生活節(jié)奏,傅志遠(yuǎn)工作之后確實(shí)「花了更多時(shí)間」在游戲上。
傅志遠(yuǎn)的研究方向是強(qiáng)化學(xué)習(xí)和多智能體系統(tǒng),高校實(shí)驗(yàn)室的環(huán)境相對(duì)純粹,大多時(shí)候是集中力量去突破領(lǐng)域內(nèi)的某一個(gè)課題。在智能體技術(shù)的落地探索中,游戲行業(yè)是一個(gè)非常理想的試驗(yàn)場(chǎng)。與現(xiàn)實(shí)世界一樣,游戲也是豐富的學(xué)習(xí)環(huán)境,具有反應(yīng)靈敏的實(shí)時(shí)設(shè)置和不斷變化的目標(biāo)。很多研究者致力于構(gòu)建更強(qiáng)大的 AI 智能體,賦予整個(gè)系統(tǒng)更強(qiáng)的規(guī)劃或解決問(wèn)題的能力。
這也是傅志遠(yuǎn)在畢業(yè)之際思考的問(wèn)題:新興 AI 技術(shù)能給游戲帶來(lái)哪些新的突破?
在南洋理工大學(xué)拿到博士學(xué)位之后,傅志遠(yuǎn)決定回國(guó),加入騰訊 IEG 光子工作室群。像騰訊這樣的大廠,不管是算力資源還是用來(lái)訓(xùn)練和優(yōu)化 AI 系統(tǒng)的游戲環(huán)境資源,都能提供最頂配的條件。
來(lái)到騰訊后,傅志遠(yuǎn)從游戲玩家變成了幫助開(kāi)發(fā)游戲的人。「粗略算來(lái),60% 的時(shí)間跟游戲本身的業(yè)務(wù)打交道,40% 的時(shí)間在學(xué)習(xí)、應(yīng)用新的游戲技術(shù)。」具體地說(shuō),他的工作任務(wù)是使用 AI 改善游戲體驗(yàn)。
通常來(lái)說(shuō),AI 會(huì)被事先設(shè)置一個(gè)「獎(jiǎng)懲機(jī)制」,然后自主進(jìn)行玩法機(jī)制的探索和檢查游戲功能是否有 bug,有時(shí)候還能發(fā)現(xiàn)一些人類(lèi)沒(méi)挖掘到的「亮點(diǎn)」:比如哪種匹配方式更有利于獲勝、哪里可以鉆空子、哪里可以有無(wú)限資源。最終,這些發(fā)現(xiàn)都會(huì)被用來(lái)改進(jìn)游戲體驗(yàn)。
與實(shí)驗(yàn)室不同的是,技術(shù)落地需要更多地考慮用戶(hù)體驗(yàn)。比如,加入 AI 模型能力固然有好處,卻會(huì)增加游戲安裝包的體量,團(tuán)隊(duì)要考慮如何在極限條件下讓模型高效運(yùn)轉(zhuǎn),不然會(huì)帶來(lái)高延遲、高耗能、占內(nèi)存、手機(jī)發(fā)燙等問(wèn)題。
「20 毫秒延遲和 1 毫秒延遲,對(duì)于用戶(hù)體驗(yàn)來(lái)說(shuō)有差異的。AI 的目標(biāo)是讓用戶(hù)玩游戲的時(shí)候更快樂(lè)!」
在一個(gè)優(yōu)秀人才集聚的地方,或多或少會(huì)有些「卷」。特別是與業(yè)務(wù)緊密相關(guān)的研究項(xiàng)目,會(huì)驅(qū)動(dòng)人不停地思考和創(chuàng)造,既要熟悉游戲業(yè)務(wù),也要追蹤最新的 AI 技術(shù)。所以,每當(dāng)有一篇重要的 AI 智能體新論文出現(xiàn),內(nèi)部團(tuán)隊(duì)都會(huì)馬上坐下來(lái)認(rèn)真討論。
當(dāng)自己參與訓(xùn)練的第一個(gè)模型在真實(shí)的商業(yè)環(huán)境里跑起來(lái),傅志遠(yuǎn)的心理活動(dòng)很強(qiáng)烈:「有一種聽(tīng)到賽車(chē)發(fā)動(dòng)機(jī)在轟鳴的感覺(jué),會(huì)很興奮和期待?!?/p>
做有長(zhǎng)期價(jià)值的事
和高研和傅志遠(yuǎn)相比,王艾文(化名)多年來(lái)的攻關(guān)方向一直很「學(xué)術(shù)」,從博士到入職騰訊 AI Lab 后都是如此。
近年來(lái),將 AI 技術(shù)應(yīng)用于傳統(tǒng)的科學(xué)領(lǐng)域,如物理、化學(xué)、生物、醫(yī)學(xué),即所謂的 AI for Science,是被寄予厚望的交叉領(lǐng)域,很多此前無(wú)法計(jì)算的復(fù)雜問(wèn)題能夠被很好地建模,并且得出足以指導(dǎo)現(xiàn)實(shí)世界中工程實(shí)踐的有效預(yù)測(cè),前所未有地促進(jìn)了科學(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新。
其中,蛋白質(zhì)組學(xué)是一個(gè)非常前沿的課題??茖W(xué)界曾經(jīng)認(rèn)為,只要繪制出人類(lèi)基因組序列圖,就能了解疾病的根源,但事實(shí)并非如此。相同的基因往往有不同的表達(dá),這就是蛋白質(zhì)組不一樣的體現(xiàn)。
一個(gè)有趣的比喻是:基因組和蛋白質(zhì)組的關(guān)系就像詞典與文章、元素表與化工廠。因此,要真正闡釋生命,必須從蛋白質(zhì)組中尋找答案。
這就是王艾文近年來(lái)在做的事情。今年,她參與的三項(xiàng)「蛋白質(zhì)組」主題的研究相繼登上國(guó)際頂級(jí)學(xué)術(shù)期刊,分別為解決蛋白組學(xué)中的數(shù)據(jù)庫(kù)、AI 建模和 AI 輔助臨床分析問(wèn)題提出了極具前瞻性的研究方案。
對(duì)王艾文個(gè)人而言,最難得的是騰訊 AI Lab 提供了一種非常純粹的研究環(huán)境。
相較于所見(jiàn)即所得的商業(yè)價(jià)值,長(zhǎng)期價(jià)值往往更難被看清楚。今時(shí)今日,我們很難確定幾項(xiàng)蛋白質(zhì)組學(xué)的研究能不能撬動(dòng)一個(gè)大規(guī)模的市場(chǎng),但也許生物產(chǎn)業(yè)的下一個(gè)爆發(fā)點(diǎn)很快就會(huì)到來(lái)。
騰訊 2025 青云計(jì)劃啟動(dòng):大模型人才擴(kuò)招 50%
如果將眼光放長(zhǎng)遠(yuǎn)一些,技術(shù)人才不僅是科技公司之間的爭(zhēng)奪,也關(guān)乎國(guó)家層面的綜合實(shí)力競(jìng)爭(zhēng)。
大模型浪潮的爆發(fā),某種程度上增加了爭(zhēng)奪頂尖 AI 人才的激烈程度。今年,騰訊在新一屆青云計(jì)劃中特別強(qiáng)調(diào):要加強(qiáng)大模型領(lǐng)域人才的招募,名額要比去年再增加 50%。招募范圍面向「全球頂尖學(xué)子」,提供的是「極具競(jìng)爭(zhēng)力的薪酬」,還有定制化的培養(yǎng)方案、核心業(yè)務(wù)工作機(jī)會(huì)、前瞻性技術(shù)課題等極具吸引力的條件。
今年 3 月,一份「全球人工智能人才追蹤調(diào)查報(bào)告 2.0」,追蹤了多位頂級(jí) AI 研究人員和科學(xué)家的全球分布與流動(dòng)情況。報(bào)告發(fā)現(xiàn),中國(guó)培養(yǎng)了相當(dāng)大比例的全球頂級(jí) AI 研究人員,這一數(shù)字從 2019 年的 29% 上升到了 2022 年的 47%,而且越來(lái)越多的 AI 人才選擇了在中國(guó)發(fā)展。
中國(guó)不斷增長(zhǎng)的產(chǎn)業(yè)需求,正是吸引這些 AI 人才的因素。經(jīng)歷了去年的一場(chǎng)百模大戰(zhàn),中國(guó)已有 200 多個(gè)大模型,且還在快速增長(zhǎng)。在大模型時(shí)代,不管是科技巨頭還是初創(chuàng)企業(yè)都有廣闊的發(fā)展空間。
可以看到,中國(guó)在大模型技術(shù)落地層面已經(jīng)走在前列。論起做產(chǎn)品,中國(guó)公司比海外公司多了一份「場(chǎng)景」優(yōu)勢(shì),而大模型市場(chǎng)的升溫會(huì)帶動(dòng)起上下游產(chǎn)業(yè)鏈,同時(shí)提升了數(shù)據(jù)、算力和算法等領(lǐng)域的人才需求,也為這些人才提供了施展才華的廣闊空間。
一直以來(lái),騰訊都非常重視對(duì)技術(shù)人才的招募和培養(yǎng),過(guò)往通過(guò)頂尖技術(shù)人才招募項(xiàng)目加入騰訊的同學(xué)中,目前已有幾十位已成長(zhǎng)為各大業(yè)務(wù)部門(mén)的核心骨干和技術(shù)中高管。他們?cè)诟鱾€(gè)項(xiàng)目中貢獻(xiàn)自己的才華,也找到了更清晰的人生目標(biāo)。
6 月 19 日,騰訊宣布全新一年的青云計(jì)劃正式啟動(dòng)。
本年度青云計(jì)劃招募的范圍包括 AI 大模型、基礎(chǔ)設(shè)施 / 硬件、金融科技、存儲(chǔ) / 數(shù)據(jù)庫(kù)、機(jī)器人、多媒體、游戲引擎、安全、量子、大數(shù)據(jù)共十大技術(shù)領(lǐng)域。特別是,加入騰訊青云計(jì)劃的人才,將由騰訊首席科學(xué)家張正友和俞棟、吳石等杰出科學(xué)家擔(dān)任導(dǎo)師。
報(bào)名候選人的畢業(yè)時(shí)間需符合:
- 2023 年 1 月 - 2025 年 12 月的博士同學(xué)
- 2024 年 1 月 - 2025 年 12 月的本碩同學(xué)
同時(shí),報(bào)名青云計(jì)劃的候選人要滿(mǎn)足以下三項(xiàng)要求:
- 有真正的技術(shù)理想,技術(shù)熱忱,技術(shù)執(zhí)著,愿用技術(shù)力量提升全球各地人們的生活品質(zhì);
- 學(xué)生時(shí)代便取得了出色的技術(shù)成就,在學(xué)術(shù)、實(shí)踐、競(jìng)賽等任一領(lǐng)域有卓越表現(xiàn);
- 能以獨(dú)到的洞察力,穿透技術(shù)本質(zhì)并應(yīng)用落地,為復(fù)雜問(wèn)題提供創(chuàng)新而深遠(yuǎn)的答案。
另外,預(yù)計(jì)從 7 月起,騰訊將組織多場(chǎng)青云技術(shù)沙龍活動(dòng) & 技術(shù)開(kāi)放日,攜手業(yè)務(wù)領(lǐng)軍人、科學(xué)界學(xué)術(shù)大咖、騰訊技術(shù)大牛等共同探討技術(shù)領(lǐng)域最前沿的話題,助力技術(shù)人才發(fā)展。
更多信息請(qǐng)查看:《騰訊2025青云計(jì)劃全球啟動(dòng)》
鏈接:
https://mp.weixin.qq.com/s?__biz=MTkyNTM0MzA4MQ==&mid=2650942330&idx=1&sn=8d981ae72306a29dfe9ca7393e6b1350&scene=21#wechat_redirect
熱門(mén)跟貼