打開(kāi)網(wǎng)易新聞 查看精彩圖片

打開(kāi)網(wǎng)易新聞 查看精彩圖片

前段時(shí)間,有位同事找我討論了一個(gè)問(wèn)題。

他說(shuō),有一件突發(fā)的事,需要跨部門(mén)合作。但是,這件事并不是對(duì)方的本職工作。所以,他有些不好意思開(kāi)口,就來(lái)找我商量,可不可以設(shè)立一筆小的獎(jiǎng)金,讓對(duì)方能更有動(dòng)力地做這件原本不在工作范圍內(nèi)的事。

嗯。承擔(dān)額外的工作,拿走額外的獎(jiǎng)金。聽(tīng)上去,非常合理。

但是,我還是制止了。同時(shí),我也強(qiáng)調(diào),千萬(wàn)不能隨便在公司里發(fā)錢(qián)。很多時(shí)候,我們希望一個(gè)人去做某件事,就很自然會(huì)想到用金錢(qián)激勵(lì)??墒?,這種方法其實(shí)并不可取。

為什么?

用現(xiàn)在最流行的人工智能語(yǔ)言來(lái)說(shuō),這就相當(dāng)于是亂設(shè)了激勵(lì)函數(shù)。

什么意思?

打個(gè)比方。小孩子學(xué)走路。

爸爸媽媽們是怎么教小孩子學(xué)走路的?不是告訴他如何發(fā)力、如何邁腿。因?yàn)樗€聽(tīng)不懂。而是給他設(shè)定了一個(gè)獎(jiǎng)懲機(jī)制。走得好,爸爸媽媽會(huì)抱。這是獎(jiǎng)勵(lì)。摔倒了,屁股會(huì)痛。這是懲罰。有了這套獎(jiǎng)懲機(jī)制,孩子就會(huì)不斷練習(xí),并根據(jù)獎(jiǎng)勵(lì)和懲罰的反饋不斷嘗試調(diào)整姿勢(shì),直到在某一個(gè)瞬間,突然就“自然而然”地學(xué)會(huì)了走路。

這種學(xué)習(xí)方式,就叫做:強(qiáng)化學(xué)習(xí)。而這套獎(jiǎng)懲機(jī)制,就叫做:激勵(lì)函數(shù)。

那一旦設(shè)錯(cuò)了激勵(lì)函數(shù)呢?得不到玩具,會(huì)哭。因?yàn)橥婢?,是哭的?jiǎng)勵(lì)。得不到關(guān)注,會(huì)叫。因?yàn)殛P(guān)注,是叫的獎(jiǎng)勵(lì)。

就像一個(gè)打掃房間的AI,設(shè)定了“看不見(jiàn)灰塵”的激勵(lì)函數(shù),可能就會(huì)學(xué)會(huì)“關(guān)掉房間里的燈”。醫(yī)療診斷的AI,設(shè)定了“準(zhǔn)確診斷率”的激勵(lì)函數(shù),學(xué)會(huì)“只做籠統(tǒng)的診斷”。棋盤(pán)游戲的AI,設(shè)定了“不輸棋”的激勵(lì)函數(shù),學(xué)會(huì)“無(wú)限延長(zhǎng)游戲”或是“找方法暫停游戲”。

這種現(xiàn)象,也叫做:獎(jiǎng)勵(lì)破譯(Reward Hacking)。發(fā)現(xiàn)并利用捷徑和漏洞,從而獲得獎(jiǎng)勵(lì)。即便這不是設(shè)計(jì)者的真實(shí)意圖。

育兒如此。AI如此。一家公司也是如此。

公司里的員工們,最終會(huì)做出什么樣的行為,采用什么樣的協(xié)作方式,歸根到底,也都是由激勵(lì)函數(shù)塑造出來(lái)的。

比如,如果真的因?yàn)槟臣?,給某個(gè)人發(fā)了一筆額外的錢(qián),那他肯定會(huì)很高興,可能還會(huì)對(duì)公司心懷感激,也為公司多爭(zhēng)取一些利益。但是,等過(guò)一段時(shí)間,又有另外一件計(jì)劃之外的事情需要他幫助的時(shí)候,他可能也會(huì)期待能有一筆額外的錢(qián)。對(duì)這筆錢(qián)的“多少”,也會(huì)有自己的衡量標(biāo)準(zhǔn)。上次是300塊錢(qián),這次是多少?什么。150?這次的事,明明比上次復(fù)雜。怎么著也得是500。怎么會(huì)是150。

最終,公司的內(nèi)部,就會(huì)生長(zhǎng)出一套脫離于激勵(lì)制度的價(jià)格體系。

每一個(gè)人,每一種活兒,都明碼標(biāo)價(jià)。但凡不給錢(qián)的事,就沒(méi)人重視,沒(méi)人干。每件事都得給錢(qián)。而且,不能給得“不公平”。

我們?cè)?jīng)講過(guò)這么一個(gè)故事。

一位創(chuàng)業(yè)者,在一位員工入職5周年的時(shí)候,一個(gè)高興,就送了一臺(tái)當(dāng)時(shí)最新的iPhone 8。第二年,又有幾位員工滿(mǎn)5周年了。接著發(fā)。第三年,第四年,第五年。十個(gè)人,五十個(gè)人,一百個(gè)人。接著發(fā)吧,100多萬(wàn)的成本。不發(fā)了吧,員工又會(huì)憤怒,覺(jué)得憑什么別人有,我沒(méi)有。憑什么到我這兒就停了。

很多公司,在啟動(dòng)新項(xiàng)目的時(shí)候,也會(huì)這樣。比如,只要參加新項(xiàng)目,就有1000塊錢(qián)的獎(jiǎng)金。到最后,名義上的“獎(jiǎng)金”,就變成了實(shí)質(zhì)上的“工資”,起不到任何激勵(lì)作用了。

所以,請(qǐng)記住,輕易不要在正常的激勵(lì)制度之外,再制定任何的獎(jiǎng)勵(lì)制度。

當(dāng)然,隨意發(fā)放金錢(qián),只是一種設(shè)錯(cuò)激勵(lì)函數(shù)的情況。有些公司,還存在著另外一種更加麻煩的,由老板主導(dǎo)的激勵(lì)函數(shù)。

比如,平時(shí)的工作中,一位員工有多大的權(quán)力,全看老板的態(tài)度。出了問(wèn)題,需要承擔(dān)多大的責(zé)任,全憑老板的站隊(duì)。到了年底,能拿多少錢(qián),全憑老板的判斷。因?yàn)槔习鍟?huì)說(shuō),我每次下班都看到小王工作得特別辛苦,一直在干活兒,我不管,無(wú)論如何都得想辦法給他發(fā)點(diǎn)獎(jiǎng)金。

一旦一家公司的激勵(lì)函數(shù),是由老板的主觀判斷決定的,那員工就會(huì)想盡辦法“管理”老板的判斷。

現(xiàn)在,你可能就能理解,為什么會(huì)有人喜歡在老板面前表演了。

因?yàn)樵谝患壹?lì)函數(shù)取決于老板的判斷力的公司里,表演,就是最有效的工作方式。

只要老板在場(chǎng),原本工作效率不高的員工,也會(huì)表現(xiàn)得格外勤奮。只要老板還沒(méi)下班,那我也不下班,看誰(shuí)能坐得住。只要老板參會(huì),那就踴躍發(fā)言,平常懶散拖沓一點(diǎn)沒(méi)關(guān)系。反正演出圓滿(mǎn)了,獎(jiǎng)金、晉升、資源分配也就到手了。

而這種職場(chǎng)版的“獎(jiǎng)勵(lì)破譯”一旦被找到,被允許,很快就會(huì)像病毒一樣擴(kuò)散開(kāi)來(lái)。因?yàn)榭吹健氨硌菡摺鲍@得獎(jiǎng)勵(lì),其他員工也會(huì)被迫加入表演。就像一個(gè)班級(jí)里,老師只獎(jiǎng)勵(lì)那些舉手發(fā)言的學(xué)生。那所有學(xué)生都會(huì)拼命舉手,卻不關(guān)心答案是否正確。

直到,公司形成一種“會(huì)說(shuō)比會(huì)做重要,表現(xiàn)比產(chǎn)出重要,形式比內(nèi)容重要”的價(jià)值觀。直到,員工失去對(duì)真實(shí)價(jià)值的感知能力,開(kāi)始相信表演本身就是工作的重要組成部分,甚至是工作的全部。直到,老板住進(jìn)了自己“精心編織”的信息繭房。

PR部門(mén)會(huì)說(shuō),你的所有決策,都是準(zhǔn)確無(wú)比的。身邊的同事會(huì)說(shuō),你是偶像,是榜樣。

最終,整個(gè)公司只向上負(fù)責(zé),卻不帶來(lái)實(shí)際的市場(chǎng)成果。老板也感受不到市場(chǎng)上的風(fēng)浪,反而感覺(jué)自己英明神武。

是的。有時(shí),我們會(huì)疑惑,為什么有的人這么喜歡拍馬屁。其實(shí),這不是“天生”的,而是被老板的激勵(lì)函數(shù)所催化出來(lái)的。一旦激勵(lì)函數(shù)出了問(wèn)題,通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練出來(lái)的公司就會(huì)出問(wèn)題。就像訓(xùn)練AI一樣。

那么,對(duì)于一家公司來(lái)說(shuō),真正具有價(jià)值的激勵(lì)函數(shù),到底是什么?

答案只有一個(gè)。那就是:市場(chǎng)。

市場(chǎng)的反應(yīng),客戶(hù)的反應(yīng),用戶(hù)的反應(yīng),這些數(shù)據(jù)反饋,才是真正的激勵(lì)函數(shù)。因?yàn)橹挥羞@樣,員工的利益才和市場(chǎng)的真實(shí)利益是一致的。

盈利多少,給予相應(yīng)獎(jiǎng)勵(lì)??蛻?hù)數(shù)量增長(zhǎng)多少,也給予相應(yīng)獎(jiǎng)勵(lì)。不應(yīng)該有人在中間做主觀的判斷,說(shuō)什么“他太辛苦了,得多給一點(diǎn)”,或者“雖然他沒(méi)完成任務(wù),但是表現(xiàn)出了潛力”。這些都不行。

在真正具有價(jià)值的激勵(lì)函數(shù)下,不斷訓(xùn)練。假以時(shí)日,公司才有機(jī)會(huì)擁有扎根臨時(shí)基地、不斷進(jìn)取的沖勁。而不是變成一家,所有人都在圍著老板打轉(zhuǎn)的公司。

當(dāng)然,這就意味著,從今往后,老板得把自己的個(gè)人喜好,死死地關(guān)在籠子里了。

即便這極其的反人性。

但請(qǐng)你相信,難而正確的事,往往都是反人性的。

這些思考,與你共勉。

P.S.

很多人相信,人工智能是未來(lái)。卻不知道,該如何擁抱這個(gè)未來(lái)。

很多人認(rèn)為,人工智能是機(jī)會(huì)。卻不知道,如何才能不錯(cuò)過(guò)機(jī)會(huì)。

所以今年,我和我的團(tuán)隊(duì),也正式推出了,2025“進(jìn)化的力量·劉潤(rùn)年中大課”。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

6月7日,在上海影城,我會(huì)用一天的時(shí)間,和你好好聊聊人工智能。

不做現(xiàn)場(chǎng)直播。也不做事后回放。就讓我與你,獨(dú)家分享。

6月7日,就讓我們,現(xiàn)場(chǎng)見(jiàn)!

*個(gè)人觀點(diǎn),僅供參考。觀點(diǎn)/ 劉潤(rùn)主筆/ 二蔓/ 歌平版面/ 黃靜

這是劉潤(rùn)公眾號(hào)的第2560原創(chuàng)文章