機器之心原創(chuàng)
作者:蛋醬
「21 世紀什么最貴?人才!」二十年前的黎叔語錄,現在聽來也不過時。
這兩年,大模型賽道風起云涌??萍脊緜內ν度肷墒?AI 技術的研發(fā),期待將新的突破整合到自家產品中。OpenAI 是一個非常成功的樣本,并受到了研究員、工程師和投資人們的廣泛關注與深刻討論:為什么是 OpenAI?
它的成功不只來自于多年的堅持技術探索、投資者不斷注入的資金,更重要的是一批頂尖 AI 研究人員的聚集。我們能看到,在 ChatGPT、Sora、GPT-4o 等劃時代產品的背后,有一長串名單的核心貢獻者,
一家科技公司想要持續(xù)「偉大」,技術人才是關鍵要素。
目光轉回國內,我們同樣能看到一群懷抱著理想與熱忱的技術人:有人苦戰(zhàn)數月,和團隊一起打造了首個中文原生 DiT 架構文生圖開源模型;有人翻遍所有最新論文,為了將用戶體驗到的延遲從 10 毫秒降到 1 毫秒;有人多年如一日投身科學大模型的研發(fā),希望找到用 AI 闡釋生命的密碼。
這些人是如何工作的?在走近并傾聽了他們的故事之后,我們發(fā)現了三個共同要素:真心熱愛的賽道、對前沿技術的極致追求,以及持之以恒的自我驅動。
當然,人才也需要鼓勵創(chuàng)新的土壤來適配。一種觀點是,科技公司應該不唯學歷,公平選擇最懂得解決問題的人。還有一種觀點是,應該不唯資歷,敢于重用新人,讓團隊永遠流動著新鮮血液??傊?,這是一個值得任何科技公司認真思考的問題。
讓中文原生大模型做到世界領先
七年前,高研(化名)拿到博士學位踏上回國航班的時候,根本想象不到,在接下來的幾年里,人工智能領域會經歷如此一場巨變。
我們知道,計算機視覺領域存在兩種理解視覺處理的方式:判別式和生成式。這兩種引導研究者們走上了不同的道路,在高研畢業(yè)之前,以「人臉識別」為代表的判別式 AI 技術剛剛經歷了一場爆發(fā)。從大洋彼岸到國內,技術創(chuàng)業(yè)的氛圍同樣火熱,門禁打卡、手機解鎖、智能家居等場景催生出大量全新的應用。
高研就是在這一年來到騰訊。這是一個「雙向奔赴」的故事:手握數篇頂會頂刊的高研,只投了騰訊一家公司,然后,順利通過當年騰訊的「技術大咖」項目入職。
如今,僅有 7 年工作經驗的高研,已經先后在多個重點項目和論文中留下了自己的名字。
只不過這個過程中,他研究的內容在與時俱進。特別是從 2022 年開始,生成式 AI 的爆發(fā)幾乎顛覆了以往的研究思路,文生圖成為了視覺領域的新熱點。
「技術不斷發(fā)展,當年學的東西很多都『淘汰』了。」因此,學習也就成為了高研日常工作的一部分:每天下班回到家,都要瀏覽最新的技術研究,追蹤最新的論文。
作為騰訊混元大模型團隊最早的一批成員,高研的研發(fā)成果已經被很多人用上 —— 過去一年,混元大模型的文生圖能力實現了「從無到有」,然后是更加「精準、美觀」。
強大的文生圖能力背后,是高研和團隊成員的數月奮戰(zhàn):業(yè)內首個中文原生的 DiT 架構文生圖模型「混元 - DiT」。最近,混元 - DiT 已經全面對外開源。
- 模型地址:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
- 技術報告地址:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
混元 - DiT 的視覺生成效果對比前代混元文生圖大模型提升超過 20%。它支持中英文雙語輸入及理解,參數量 15 億,不僅可以支持文生圖,也可以作為視頻等多模態(tài)視覺生成的基礎。
多次迭代后,混元文生圖大模型已經解決了「語義、內容、質感」這三點關鍵難題,且率先邁出了落地的步伐:騰訊很早就開始在廣告場景進行 AI 自動生成廣告投放素材的探索,比如生成商品廣告或廣告配圖的產品「騰訊廣告妙思」。在廣告業(yè)務下的多輪測評中,騰訊混元文生圖的案例優(yōu)秀率和廣告主采納率分別達到 86% 和 26%,均高于同類模型。
我們經常說幕后團隊成就了一款產品的輝煌,但從另一個角度說,產品的成功也成就了團隊中的每一個人。對于高研個人而言,他將參與混元大模型項目的經歷比喻為「人生開了加速器」—— 手中掌握的技術不僅能在更廣闊的場景上進行充分應用和驗證,還能拓展出新的業(yè)務合作,這讓人真正感受到自己在做一件改變世界的事。
「博士畢業(yè)后,我教 AI 打游戲」
「父母知道你工作時打游戲嗎?」
聽到這個問題,傅志遠(化名)笑了:「只知道我在游戲部門搞研究,但不知道我原來也打游戲?!?/p>
相比于博士期間大部分時間沉浸于論文和實驗的生活節(jié)奏,傅志遠工作之后確實「花了更多時間」在游戲上。
傅志遠的研究方向是強化學習和多智能體系統,高校實驗室的環(huán)境相對純粹,大多時候是集中力量去突破領域內的某一個課題。在智能體技術的落地探索中,游戲行業(yè)是一個非常理想的試驗場。與現實世界一樣,游戲也是豐富的學習環(huán)境,具有反應靈敏的實時設置和不斷變化的目標。很多研究者致力于構建更強大的 AI 智能體,賦予整個系統更強的規(guī)劃或解決問題的能力。
這也是傅志遠在畢業(yè)之際思考的問題:新興 AI 技術能給游戲帶來哪些新的突破?
在南洋理工大學拿到博士學位之后,傅志遠決定回國,加入騰訊 IEG 光子工作室群。像騰訊這樣的大廠,不管是算力資源還是用來訓練和優(yōu)化 AI 系統的游戲環(huán)境資源,都能提供最頂配的條件。
來到騰訊后,傅志遠從游戲玩家變成了幫助開發(fā)游戲的人。「粗略算來,60% 的時間跟游戲本身的業(yè)務打交道,40% 的時間在學習、應用新的游戲技術。」具體地說,他的工作任務是使用 AI 改善游戲體驗。
通常來說,AI 會被事先設置一個「獎懲機制」,然后自主進行玩法機制的探索和檢查游戲功能是否有 bug,有時候還能發(fā)現一些人類沒挖掘到的「亮點」:比如哪種匹配方式更有利于獲勝、哪里可以鉆空子、哪里可以有無限資源。最終,這些發(fā)現都會被用來改進游戲體驗。
與實驗室不同的是,技術落地需要更多地考慮用戶體驗。比如,加入 AI 模型能力固然有好處,卻會增加游戲安裝包的體量,團隊要考慮如何在極限條件下讓模型高效運轉,不然會帶來高延遲、高耗能、占內存、手機發(fā)燙等問題。
「20 毫秒延遲和 1 毫秒延遲,對于用戶體驗來說有差異的。AI 的目標是讓用戶玩游戲的時候更快樂!」
在一個優(yōu)秀人才集聚的地方,或多或少會有些「卷」。特別是與業(yè)務緊密相關的研究項目,會驅動人不停地思考和創(chuàng)造,既要熟悉游戲業(yè)務,也要追蹤最新的 AI 技術。所以,每當有一篇重要的 AI 智能體新論文出現,內部團隊都會馬上坐下來認真討論。
當自己參與訓練的第一個模型在真實的商業(yè)環(huán)境里跑起來,傅志遠的心理活動很強烈:「有一種聽到賽車發(fā)動機在轟鳴的感覺,會很興奮和期待?!?/p>
做有長期價值的事
和高研和傅志遠相比,王艾文(化名)多年來的攻關方向一直很「學術」,從博士到入職騰訊 AI Lab 后都是如此。
近年來,將 AI 技術應用于傳統的科學領域,如物理、化學、生物、醫(yī)學,即所謂的 AI for Science,是被寄予厚望的交叉領域,很多此前無法計算的復雜問題能夠被很好地建模,并且得出足以指導現實世界中工程實踐的有效預測,前所未有地促進了科學發(fā)現和技術創(chuàng)新。
其中,蛋白質組學是一個非常前沿的課題??茖W界曾經認為,只要繪制出人類基因組序列圖,就能了解疾病的根源,但事實并非如此。相同的基因往往有不同的表達,這就是蛋白質組不一樣的體現。
一個有趣的比喻是:基因組和蛋白質組的關系就像詞典與文章、元素表與化工廠。因此,要真正闡釋生命,必須從蛋白質組中尋找答案。
這就是王艾文近年來在做的事情。今年,她參與的三項「蛋白質組」主題的研究相繼登上國際頂級學術期刊,分別為解決蛋白組學中的數據庫、AI 建模和 AI 輔助臨床分析問題提出了極具前瞻性的研究方案。
對王艾文個人而言,最難得的是騰訊 AI Lab 提供了一種非常純粹的研究環(huán)境。
相較于所見即所得的商業(yè)價值,長期價值往往更難被看清楚。今時今日,我們很難確定幾項蛋白質組學的研究能不能撬動一個大規(guī)模的市場,但也許生物產業(yè)的下一個爆發(fā)點很快就會到來。
騰訊 2025 青云計劃啟動:大模型人才擴招 50%
如果將眼光放長遠一些,技術人才不僅是科技公司之間的爭奪,也關乎國家層面的綜合實力競爭。
大模型浪潮的爆發(fā),某種程度上增加了爭奪頂尖 AI 人才的激烈程度。今年,騰訊在新一屆青云計劃中特別強調:要加強大模型領域人才的招募,名額要比去年再增加 50%。招募范圍面向「全球頂尖學子」,提供的是「極具競爭力的薪酬」,還有定制化的培養(yǎng)方案、核心業(yè)務工作機會、前瞻性技術課題等極具吸引力的條件。
今年 3 月,一份「全球人工智能人才追蹤調查報告 2.0」,追蹤了多位頂級 AI 研究人員和科學家的全球分布與流動情況。報告發(fā)現,中國培養(yǎng)了相當大比例的全球頂級 AI 研究人員,這一數字從 2019 年的 29% 上升到了 2022 年的 47%,而且越來越多的 AI 人才選擇了在中國發(fā)展。
中國不斷增長的產業(yè)需求,正是吸引這些 AI 人才的因素。經歷了去年的一場百模大戰(zhàn),中國已有 200 多個大模型,且還在快速增長。在大模型時代,不管是科技巨頭還是初創(chuàng)企業(yè)都有廣闊的發(fā)展空間。
可以看到,中國在大模型技術落地層面已經走在前列。論起做產品,中國公司比海外公司多了一份「場景」優(yōu)勢,而大模型市場的升溫會帶動起上下游產業(yè)鏈,同時提升了數據、算力和算法等領域的人才需求,也為這些人才提供了施展才華的廣闊空間。
一直以來,騰訊都非常重視對技術人才的招募和培養(yǎng),過往通過頂尖技術人才招募項目加入騰訊的同學中,目前已有幾十位已成長為各大業(yè)務部門的核心骨干和技術中高管。他們在各個項目中貢獻自己的才華,也找到了更清晰的人生目標。
6 月 19 日,騰訊宣布全新一年的青云計劃正式啟動。
本年度青云計劃招募的范圍包括 AI 大模型、基礎設施 / 硬件、金融科技、存儲 / 數據庫、機器人、多媒體、游戲引擎、安全、量子、大數據共十大技術領域。特別是,加入騰訊青云計劃的人才,將由騰訊首席科學家張正友和俞棟、吳石等杰出科學家擔任導師。
報名候選人的畢業(yè)時間需符合:
- 2023 年 1 月 - 2025 年 12 月的博士同學
- 2024 年 1 月 - 2025 年 12 月的本碩同學
同時,報名青云計劃的候選人要滿足以下三項要求:
- 有真正的技術理想,技術熱忱,技術執(zhí)著,愿用技術力量提升全球各地人們的生活品質;
- 學生時代便取得了出色的技術成就,在學術、實踐、競賽等任一領域有卓越表現;
- 能以獨到的洞察力,穿透技術本質并應用落地,為復雜問題提供創(chuàng)新而深遠的答案。
另外,預計從 7 月起,騰訊將組織多場青云技術沙龍活動 & 技術開放日,攜手業(yè)務領軍人、科學界學術大咖、騰訊技術大牛等共同探討技術領域最前沿的話題,助力技術人才發(fā)展。
更多信息請查看:《騰訊2025青云計劃全球啟動》
鏈接:
https://mp.weixin.qq.com/s?__biz=MTkyNTM0MzA4MQ==&mid=2650942330&idx=1&sn=8d981ae72306a29dfe9ca7393e6b1350&scene=21#wechat_redirect
熱門跟貼