打開(kāi)網(wǎng)易新聞 查看精彩圖片

五一,打工人的節(jié)日;搞錢(qián),打工人的標(biāo)簽。對(duì)普通人來(lái)說(shuō),到底哪些新職業(yè)還有“掘金”的空間?《財(cái)經(jīng)天下》特別策劃了“黃金打工人”專題,將目光聚焦在五大新職業(yè)群體身上。通過(guò)他們的故事,來(lái)呈現(xiàn)一些新的就業(yè)趨勢(shì)觀察。本篇講述的是,用數(shù)據(jù)標(biāo)注來(lái)“馴化”大模型的四位工程師,他們?nèi)绾螌⒂脩粜枨笈c模型嫁接起來(lái),讓大模型變得更加聰明。

2023年初,看到國(guó)內(nèi)不斷涌現(xiàn)的大語(yǔ)言模型,研究生剛畢業(yè)的萬(wàn)玉磊感到AI潮流勢(shì)不可當(dāng),做出了人生最重要的選擇。

他毅然放棄了某互聯(lián)網(wǎng)大廠OCR(圖片文字識(shí)別)工程師的offer,以提示詞工程師的身份,加盟了一家多模態(tài)大模型初創(chuàng)公司。他的任務(wù)是訓(xùn)練AI,讓它更加聰明,不斷提升和人類(lèi)對(duì)話的能力。

作為大模型的智能基礎(chǔ),AI和用戶的交互能力,以及數(shù)據(jù)做得如何,直接決定了大模型的上限。DeepSeek的超強(qiáng)性能和驚人表現(xiàn)背后,便離不開(kāi)它更強(qiáng)大的語(yǔ)義理解能力和高質(zhì)量數(shù)據(jù)的支持。業(yè)界甚至傳出,梁文鋒也親自參與了數(shù)據(jù)標(biāo)注工作。

智聯(lián)招聘數(shù)據(jù)顯示,今年2月,算法工程師、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等崗位招聘量同比大幅增加。其中,承擔(dān)“AI訓(xùn)練”的數(shù)據(jù)標(biāo)注崗位,招聘需求同比增長(zhǎng)超50%,平均招聘月薪也突破了2萬(wàn)元。

《財(cái)經(jīng)天下》注意到,近期不少大廠特別為“AI訓(xùn)練師”開(kāi)出了高薪。如字節(jié)跳動(dòng)給AI訓(xùn)練崗開(kāi)出了月薪2萬(wàn)~4萬(wàn)元、15薪;小紅書(shū)也對(duì)“AI標(biāo)注產(chǎn)品”崗開(kāi)出了2萬(wàn)~4萬(wàn)元、16薪的標(biāo)準(zhǔn)。

“有良好產(chǎn)品意識(shí)、了解模型訓(xùn)練”是這些崗位的基本要求,更令不少求職者心動(dòng)的是,其中不少大廠職位還對(duì)文科生相當(dāng)友好,不同專業(yè)背景都可入行。

“AI訓(xùn)練師”的行業(yè)壁壘有多高,在AI技術(shù)的高速迭代中,其行業(yè)前景和含金量能保持多久?《財(cái)經(jīng)天下》找到了四位不同行業(yè)、年齡的“AI訓(xùn)練師”,他們對(duì)于數(shù)據(jù)標(biāo)注有著或樂(lè)觀、或焦慮的思考。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

01、年薪百萬(wàn),并不罕見(jiàn)

01、年薪百萬(wàn),并不罕見(jiàn)

“就像訓(xùn)練貓抓老鼠,你需要不斷試探模型的觸發(fā)機(jī)制?!边@個(gè)五一前兩天,在位于北京海淀五道口的辦公室里,萬(wàn)玉磊向《財(cái)經(jīng)天下》描述了他們經(jīng)歷過(guò)的提示詞與大模型的早期碰撞。

在他看來(lái),2023年前后,提示詞與大模型的碰撞還充滿“神秘”色彩。萬(wàn)玉磊團(tuán)隊(duì)曾嘗試通過(guò)“情緒激勵(lì)”的方式,提升模型表現(xiàn)?!敖o予大模型小費(fèi)獎(jiǎng)勵(lì)”,或者讓工程師扮演“殘障程序員”等人格化設(shè)定,竟能讓模型輸出質(zhì)量大幅提升。

隨著DeepSeek-R1等長(zhǎng)序列推理模型問(wèn)世,思維鏈(Chain-of-Thought)技術(shù)普及讓強(qiáng)化學(xué)習(xí)技術(shù)飛速突破,給大模型投喂簡(jiǎn)單“咒語(yǔ)”的方法逐漸失效,提示詞工程也朝向數(shù)據(jù)自動(dòng)化的方向深化。

“我們現(xiàn)在已經(jīng)在用母提示詞(預(yù)先設(shè)計(jì)好的、可復(fù)用的提示詞框架)生成上千條候選指令,通過(guò)自動(dòng)評(píng)估系統(tǒng)篩選出最優(yōu)解。”萬(wàn)玉磊介紹道。

在他看來(lái),基于Transformer架構(gòu)的大模型技術(shù)革命,會(huì)將傳統(tǒng)AI領(lǐng)域的知識(shí)體系徹底顛覆。之所以選擇以提示詞工程師的身份擁抱變革:“因?yàn)樘崾驹~是新世界的敲門(mén)磚,它用最低成本,讓普通人接觸到大模型核心能力?!?/p>

萬(wàn)玉磊觀察,不少頭部企業(yè)確實(shí)正在以百萬(wàn)年薪爭(zhēng)奪提示詞優(yōu)化專家,數(shù)據(jù)策略崗需求激增。據(jù)其透露,字節(jié)在瘋狂招各個(gè)領(lǐng)域的博士生來(lái)幫他們調(diào)數(shù)據(jù);小紅書(shū)則嘗試組建“藝術(shù)+代碼”的跨學(xué)科人才團(tuán)隊(duì),試圖更好地解決圖文生成的審美瓶頸。

在萬(wàn)玉磊領(lǐng)導(dǎo)的7人團(tuán)隊(duì)中,5名數(shù)據(jù)標(biāo)注員都是本科應(yīng)屆生,工作要完成大量語(yǔ)義標(biāo)注。另外2位提示詞工程師則要兼具代碼能力與跨學(xué)科視野。不過(guò)在他看來(lái),當(dāng)下能勝任AI訓(xùn)練的人,持續(xù)學(xué)習(xí)的能力是核心門(mén)檻。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

技術(shù)人員每月都要不斷消化頂級(jí)會(huì)刊論文,這種高壓環(huán)境也催生了獨(dú)特的學(xué)習(xí)文化。每周一的論文研討會(huì)上,萬(wàn)玉磊都會(huì)專門(mén)讓團(tuán)隊(duì)成員拆解一份最新的模型技術(shù)報(bào)告,互相探討?!吧现苊嬖嚂r(shí),我們最關(guān)注候選人是否第一時(shí)間體驗(yàn)過(guò)Claude 3的新版本?!?/p>

比起設(shè)計(jì)母提示詞,評(píng)估體系的數(shù)字化正在成為工作的新焦點(diǎn)?!霸u(píng)估標(biāo)準(zhǔn)的制定比寫(xiě)提示詞更關(guān)鍵,這也決定了系統(tǒng)的進(jìn)化方向?!?/p>

“比如,我們團(tuán)隊(duì)搭建的自動(dòng)化評(píng)測(cè)系統(tǒng)包含30余個(gè)量化指標(biāo):從回答相關(guān)性、中立性到情感親和力,每個(gè)維度的權(quán)重會(huì)隨業(yè)務(wù)場(chǎng)景動(dòng)態(tài)調(diào)整?!蹦壳?,他所在團(tuán)隊(duì)中已經(jīng)有70%的工作集中到了評(píng)估模型優(yōu)化,僅有30%的工作放到了提示詞生成。

特別是當(dāng)大模型走向商業(yè)化后,大量垂類(lèi)模型讓針對(duì)性的提示詞訓(xùn)練變得更加不可或缺?!癇端用戶需求非常明確,用戶數(shù)據(jù)有效,提示詞也會(huì)更加明確。”

萬(wàn)玉磊目前已做過(guò)電力運(yùn)營(yíng)、城市治理等垂直模型,在某個(gè)電網(wǎng)AI項(xiàng)目中,對(duì)方提供了百萬(wàn)量級(jí)的故障樣本和精準(zhǔn)工況描述,這也讓提示詞的設(shè)計(jì)效率大幅提升。

與之形成鮮明對(duì)比的,是設(shè)計(jì)C端產(chǎn)品的迷茫。面對(duì)數(shù)億用戶千奇百怪的提問(wèn),萬(wàn)玉磊曾因用戶需求“過(guò)度發(fā)散”而苦惱不已?!癈端的用戶場(chǎng)景不明確,你也不知道他到底要什么,這種提示詞做起來(lái)就會(huì)很難?!彼嘈Φ馈?/p>

雖然提示詞工程師總要跟枯燥的數(shù)據(jù)打交道,但隨著模型能力的進(jìn)化,萬(wàn)玉磊也會(huì)時(shí)不時(shí)地被震撼到。尤其是DeepSeek的“頓悟時(shí)刻(AHA moment)”閃現(xiàn),讓他印象極深。

在DeepSeek的論文中提到,模型讓作者“見(jiàn)證了強(qiáng)化學(xué)習(xí)的力量和美感”。在開(kāi)發(fā)DeepSeek-R1-Zero的中間版本時(shí),模型曾學(xué)會(huì)了以人類(lèi)的語(yǔ)氣進(jìn)行反思,領(lǐng)悟到了訓(xùn)練數(shù)據(jù)里完全沒(méi)有的東西。

“我們正在經(jīng)歷技術(shù)史上的‘亂紀(jì)元’?!比f(wàn)玉磊用《三體》中的故事比喻當(dāng)前行業(yè)態(tài)勢(shì):當(dāng)大模型每月突破一個(gè)技術(shù)里程碑,傳統(tǒng)的職業(yè)規(guī)劃已失去意義,唯有構(gòu)建“終身學(xué)習(xí)”的能力,才能保持競(jìng)爭(zhēng)力。

02、行業(yè)需要工程師變成產(chǎn)品經(jīng)理

02、行業(yè)需要工程師變成產(chǎn)品經(jīng)理

2022年11月,ChatGPT橫空出世時(shí),張遠(yuǎn)辰還在準(zhǔn)備研究生備考。

2023年初,一位專欄作者與New Bing(微軟基于GPT-4模型的AI搜索引擎)進(jìn)行了數(shù)輪對(duì)話,意外發(fā)現(xiàn)New Bing不僅會(huì)表達(dá)感情,還會(huì)PUA甚至威脅人類(lèi),看起來(lái)似乎擁有了“自我意識(shí)”。這讓張遠(yuǎn)辰大為震撼,“我第一次真切感受到AI的擬人化潛力,甚至產(chǎn)生過(guò)退學(xué)、投身AI行業(yè)的想法?!?/p>

不久后,張遠(yuǎn)辰通過(guò)實(shí)習(xí)進(jìn)入了AI領(lǐng)域,首份工作便是用封裝提示詞實(shí)現(xiàn)產(chǎn)品化。比如,根據(jù)用戶輸入的書(shū)名和字?jǐn)?shù),生成讀后感。這也讓張遠(yuǎn)辰第一次意識(shí)到,提示詞對(duì)于模型質(zhì)量提升的關(guān)鍵作用。

“特別是模型能力較弱時(shí),提示詞工程與模型訓(xùn)練同等重要。一份完整的結(jié)構(gòu)化提示詞屬于核心資產(chǎn),可以拿到網(wǎng)上去做售賣(mài)?!?/p>

張遠(yuǎn)辰暗下決心,將畢業(yè)后的求職目標(biāo)對(duì)準(zhǔn)大廠。但當(dāng)時(shí)間撥到2025年,在面試字節(jié)、阿里等公司的過(guò)程中,張遠(yuǎn)辰發(fā)現(xiàn),大廠對(duì)提示詞工程師的需求每年都在變化。

“2023年,大廠會(huì)選擇直接招一些AI產(chǎn)品經(jīng)理來(lái)做相關(guān)的探索,對(duì)于提示詞沒(méi)有太重視。到2024年初,專門(mén)的提示詞工程師已經(jīng)出現(xiàn),大模型行業(yè)開(kāi)始細(xì)致分工?!?/p>

而到了2025年,DeepSeek讓普通用戶通過(guò)自然語(yǔ)言就能玩轉(zhuǎn)AI。“大廠也更傾向于將提示詞能力視為產(chǎn)品經(jīng)理、研發(fā)等崗位的基礎(chǔ)技能,而非獨(dú)立崗位?!边@也讓張遠(yuǎn)辰意識(shí)到,提示詞工程師正在向通用技能遷移,甚至可能逐漸 “消失”,其職責(zé)會(huì)被其他崗位吸收。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

張遠(yuǎn)辰結(jié)合自身和周?chē)那闆r粗略判斷,2024年,大廠給1~3年經(jīng)驗(yàn)從業(yè)者的薪資約在月薪2.2萬(wàn)~3.5萬(wàn)元之間。

但她也表示,對(duì)于提示詞工程師高薪、高學(xué)歷的標(biāo)簽要理性看待。單純的提示詞撰寫(xiě),已經(jīng)難以構(gòu)成長(zhǎng)期壁壘。提示詞工程師水平的高低,本質(zhì)取決于能否直擊問(wèn)題本質(zhì)、識(shí)別模型輸出的價(jià)值。

“提示詞工程師的工作并非單純的提示詞撰寫(xiě)技巧,而是對(duì)用戶需求的洞察、跨領(lǐng)域知識(shí)儲(chǔ)備,以及利用模型特性創(chuàng)新解決方案的能力?!睆堖h(yuǎn)辰說(shuō)。

在她看來(lái),提示詞工程師的崗位職能正在遷移,發(fā)展路徑更可能朝向AI產(chǎn)品經(jīng)理——理解用戶需求、拆解任務(wù)流程,這都和產(chǎn)品經(jīng)理的核心能力高度重合。

而面對(duì)全新領(lǐng)域的提示詞需求,張遠(yuǎn)辰表示并無(wú)標(biāo)準(zhǔn)的調(diào)研流程,而是更多依賴于實(shí)踐驗(yàn)證。

令她印象深刻的是,2024年上半年 ,她在參與一部AI小說(shuō)寫(xiě)作時(shí),需要將小說(shuō)拆解為題目、提綱、大綱、正文等多個(gè)環(huán)節(jié)。每個(gè)環(huán)節(jié)的提示詞都要抽象提煉為前文已生成過(guò)的內(nèi)容(如題目、文風(fēng)要求),才能確保上下文連貫。

雖然聽(tīng)著簡(jiǎn)單,但實(shí)際處理過(guò)程中難題不斷,如模型輸出格式錯(cuò)誤、模型崩塌(重復(fù)輸出單個(gè)字符)和截?cái)啵▋?nèi)容未完成即終止)等。

光是解決格式問(wèn)題,張遠(yuǎn)辰就測(cè)試了20多個(gè)模型。她也因此發(fā)現(xiàn),DeepSeek雖然能穩(wěn)定輸出格式,但對(duì)于中文網(wǎng)文的風(fēng)格支持不足。最終,她是通過(guò)流程切分(如將2萬(wàn)字的小說(shuō)拆分為10個(gè)2000字左右的段落生成),才降低了模型處理壓力。

張遠(yuǎn)辰事后總結(jié)道,提示詞的設(shè)計(jì)往往充斥著很多不確定性,“有效定義AI的工作流程,比提示詞設(shè)計(jì)本身更有用”。這也讓她將職業(yè)規(guī)劃開(kāi)始沿著AI產(chǎn)品經(jīng)理的方向深化:“AI終將成為工具,而把握用戶痛點(diǎn)、設(shè)計(jì)出真正解決問(wèn)題的產(chǎn)品,才是核心競(jìng)爭(zhēng)力?!?/p>

03、離職率高,分化明顯

03、離職率高,分化明顯

2020年,于洪未曾預(yù)料到,她會(huì)在幾年后站在AI浪潮的十字路口,重新思考職業(yè)的意義。作為一名金融行業(yè)數(shù)據(jù)分析師,于洪曾在投行與咨詢公司深耕量化分析領(lǐng)域,卻在AI技術(shù)迭代中感受到了前所未有的危機(jī)。

“ChatGPT剛開(kāi)始連基礎(chǔ)爬蟲(chóng)都寫(xiě)不好,現(xiàn)在它已經(jīng)能處理完整的機(jī)器學(xué)習(xí)項(xiàng)目。我的工作中80%的內(nèi)容,都可能被AI替代?!?/p>

于洪坦言,這種焦慮驅(qū)使她開(kāi)始探索轉(zhuǎn)型路徑,而招聘網(wǎng)站上鋪天蓋地的“AI訓(xùn)練師”崗位,引起了她的注意。

起初,螞蟻金服等大廠對(duì)于“AI訓(xùn)練師”的要求是,不僅要有頂尖學(xué)歷,還要有CFA(特許金融分析師)持證。這讓于洪誤以為,這是一個(gè)與金融業(yè)務(wù)深度結(jié)合的復(fù)合型技術(shù)崗。但在多方打聽(tīng)后,于洪發(fā)現(xiàn)提示詞訓(xùn)練本質(zhì)是“數(shù)據(jù)標(biāo)注”,與金融知識(shí)幾乎無(wú)關(guān)。

“即便是名校畢業(yè)生,進(jìn)去后也只是按機(jī)器規(guī)則打分,沒(méi)有主觀判斷的空間?!备钏馔獾氖?,不少?gòu)氖略搷徫坏膹臉I(yè)者竟來(lái)自牛津、劍橋等頂級(jí)學(xué)府。

可以說(shuō),數(shù)據(jù)標(biāo)注崗因大廠光環(huán)吸引著眾多求職者們。特別是它基礎(chǔ)月薪過(guò)萬(wàn),也面對(duì)文科專業(yè)招聘,更讓不少名校畢業(yè)生一度將其視為“人生奔頭”。

于洪表示,不少企業(yè)正在自建標(biāo)注團(tuán)隊(duì),但工作的高重復(fù)性讓這一行離職率驚人?!霸S多大廠的數(shù)據(jù)標(biāo)注崗都是外包性質(zhì)的,許多人心理落差太大,干一兩個(gè)月就走了。”

打開(kāi)網(wǎng)易新聞 查看精彩圖片

在技術(shù)沖擊、行業(yè)震蕩的雙重壓力下,于洪開(kāi)始重新評(píng)估自己的職業(yè)護(hù)城河。她曾親歷AI工具從“初級(jí)輔助”到“威脅替代”的轉(zhuǎn)折:早期使用ChatGPT時(shí),于洪曾經(jīng)借助信息差,高效完成工作,享受過(guò)“拿著工資摸魚(yú)”的一小段紅利時(shí)光。

但隨著DeepSeek的崛起,老板們對(duì)開(kāi)源工具的接受度提升,人力成本壓縮成為必然?!爱?dāng)AI能獨(dú)立完成數(shù)據(jù)清洗、分析甚至生成報(bào)告時(shí),我的角色將只剩下審核與糾錯(cuò)?!?/p>

在技術(shù)洪流中,于洪試圖尋找新錨點(diǎn)。她坦言曾考慮轉(zhuǎn)向AI算法領(lǐng)域,但與資深工程師的交流讓她望而卻步。思來(lái)想去,于洪最終決定回歸學(xué)術(shù)路徑,計(jì)劃攻讀計(jì)算社會(huì)科學(xué)方向的博士,研究大語(yǔ)言模型與社會(huì)科學(xué)、金融分析的交叉應(yīng)用。

“未來(lái)的機(jī)會(huì)或許會(huì)出現(xiàn)在技術(shù)與業(yè)務(wù)的結(jié)合點(diǎn),比如提升AI對(duì)網(wǎng)絡(luò)話語(yǔ)、金融文本的解析能力?!?/p>

目前,她的工作依舊每天與爬蟲(chóng)和文本情緒識(shí)別模型打交道。而對(duì)于AI技術(shù)的未來(lái),于洪表現(xiàn)出了矛盾心態(tài),她計(jì)劃在歐洲攻讀博士并尋求工作簽證,努力朝學(xué)術(shù)領(lǐng)域發(fā)展。

和于洪類(lèi)似,身處數(shù)據(jù)標(biāo)注崗的王晨,也遇到了作為“AI數(shù)據(jù)打工人”的職場(chǎng)焦慮。2022年,王晨加入了一家創(chuàng)業(yè)公司,投身于智能體研發(fā)的數(shù)據(jù)標(biāo)注。

王晨表示,當(dāng)下AI訓(xùn)練師的專業(yè)門(mén)檻已發(fā)生質(zhì)的躍遷。人才需求向垂直領(lǐng)域拓展,薪資梯度也呈現(xiàn)出結(jié)構(gòu)化差異。醫(yī)療、法律等專業(yè)領(lǐng)域的AI訓(xùn)練師年薪可達(dá)20萬(wàn)以上,相較去年薪資漲幅達(dá)30%以上。

“不過(guò),醫(yī)療領(lǐng)域標(biāo)注崗位要求執(zhí)業(yè)醫(yī)師資質(zhì),影像類(lèi)項(xiàng)目需要醫(yī)學(xué)碩士背景,美學(xué)設(shè)計(jì)相關(guān)崗位更看重從業(yè)者的專業(yè)審美積淀?!?/p>

伴隨高薪而來(lái)的是更嚴(yán)峻的挑戰(zhàn)。王晨透露,某大廠曾為特定項(xiàng)目半年燒掉了500萬(wàn)元標(biāo)注預(yù)算,卻在完成后立即解散團(tuán)隊(duì),“這種不確定性也在倒逼從業(yè)者構(gòu)建核心競(jìng)爭(zhēng)力”。

每次面試新人時(shí),王晨都會(huì)建議新人選擇垂直賽道深耕,將數(shù)據(jù)標(biāo)注視為理解AI底層邏輯的入口,逐步向產(chǎn)品設(shè)計(jì)、質(zhì)量評(píng)估等上游環(huán)節(jié)拓展。但他自己還沒(méi)有徹底想清楚,他只是感覺(jué),無(wú)論如何都不能輕易下了AI這趟高速列車(chē)。

(文中王晨、于洪為化名)

(作者 | 豆蔻,編輯 | 李不清,圖片來(lái)源 | 視覺(jué)中國(guó),本內(nèi)容來(lái)自財(cái)經(jīng)天下WEEKLY)