
新智元報道
編輯:英智
【新智元導讀】摩根士丹利的案例表明,企業(yè)應用AI離不開快速試錯與優(yōu)化。AI通過分析海量數(shù)據(jù)打造個性化體驗,Indeed的職位推薦和Lowe’s搜索優(yōu)化證明了數(shù)據(jù)與AI結合的巨大潛力。
AI正以前所未有的速度,重塑企業(yè)運營和競爭格局。
從金融服務到電商零售,從求職招聘到家裝購物,AI帶來了巨大的變革潛力。
OpenAI最新發(fā)布的報告,深入剖析了7家前沿公司應用AI的寶貴經(jīng)驗。

報告鏈接:https://cdn.openai.com/business-guides-and-resources/ai-in-the-enterprise.pdf
這在三個方面帶來了顯著且可衡量的提升:
員工表現(xiàn):助力員工在更短的時間內,產(chǎn)出更高質量的成果。
常規(guī)操作自動化:將人們從重復性任務中解放出來,使他們能專注于更有價值的工作。
賦能產(chǎn)品:通過提供更貼合用戶需求、響應更迅速的服務,提升用戶體驗。
利用AI和開發(fā)軟件或部署云應用不太一樣。那些運用AI最成功的公司,常常把它當作一種新的模式。
這種敢于嘗試的實驗精神,讓他們用迭代的方法,更快實現(xiàn)價值,也更容易獲得用戶和利益相關者的認可。
接下來,結合客戶案例,深入探討每條經(jīng)驗。
經(jīng)驗一:從評估入手
摩根士丹利通過迭代確保質量與安全
作為全球金融服務領域的領軍企業(yè),摩根士丹利的業(yè)務高度依賴客戶關系。
因此,AI如何在注重個性化和隱私性的工作中發(fā)揮價值,成了公司內部關注的重點。
他們的解決辦法是,對每一個打算應用AI的項目進行全面評估。
評估是一個嚴謹、結構化的過程,用來衡量AI模型在特定應用場景中的實際表現(xiàn),是否達到標準。
同時,評估也是借助專家反饋,不斷優(yōu)化AI驅動的業(yè)務流程。
摩根士丹利的首次評估聚焦在提升財務顧問的工作效率和效果。
思路很簡單:要是財務顧問能更快獲取信息,少花時間在重復性任務上,就能為客戶提供更多優(yōu)質見解。
他們開展了三項評估:
語言翻譯:衡量模型翻譯的準確性和質量。
內容總結:依據(jù)準確性、相關性和連貫性等指標,評估模型提煉信息的能力。
人工訓練對比:將AI結果和專家顧問的回復對比,從準確性和相關性方面打分。
這些評估及后續(xù)其他評估,讓摩根士丹利有信心將這些案例逐步投入實際運營。
現(xiàn)在,98%的摩根士丹利財務顧問每天都用OpenAI。文件查閱率從20%上升到80%,搜索時間大幅縮短。

借助任務自動化和更快速的洞察,財務顧問能把更多時間花在維護客戶關系上。
財務顧問們反饋很好,他們和客戶互動更密切,過去要幾天才能完成的跟進工作,現(xiàn)在幾小時就能搞定。
經(jīng)驗二:將AI融入產(chǎn)品
Indeed職位匹配更人性化
當AI用于自動化和加速繁瑣、重復的工作時,員工就能專注于只有人能做的事。
AI能處理多個渠道的海量數(shù)據(jù),打造出更貼合用戶需求、更個性化的體驗,讓人感覺更有人情味。
全球領先的求職網(wǎng)站Indeed,用 GPT-4o mini以新的方式為求職者匹配職位。
給求職者提供優(yōu)質的職位推薦只是Indeed服務的第一步,他們還要向求職者解釋為什么推薦某個特定職位。
Indeed用GPT-4o mini的數(shù)據(jù)分析和自然語言處理能力,在給求職者的郵件和消息里寫這些「推薦理由」。

廣受歡迎的「邀請申請」還能說明求職者的背景或過往工作經(jīng)驗為何與該職位相匹配。
Indeed團隊把之前的職位匹配引擎和基于GPT的新版本對比測試,新版本加了定制化的背景信息。
結果顯示,新版本的性能提升很明顯:
職位申請量增加了20%。
后續(xù)成功率提高了13%——不僅更多求職者愿意申請,雇主也更傾向于錄用他們。
Indeed每月給求職者發(fā)超2000萬條消息,網(wǎng)站每月有3.5億訪問量,這些增長帶來了很大的商業(yè)影響。
不過,規(guī)模擴大也意味著要消耗更多token。
為提高效率,OpenAI和Indeed合作,微調了一個較小的GPT模型,減少60% token消耗的同時,仍能達到類似的效果。
幫求職者找到合適工作,并讓他們明白某個機會為什么適合自己,是一項很人性化的成果。
Indeed團隊借助AI,讓更多求職者更快找到工作,實現(xiàn)了雙贏。
經(jīng)驗三:即刻行動,盡早投資
Klarna如何從AI知識積累中獲益
AI很少能直接拿來就用,實際的應用案例需要不斷迭代,才能變得更成熟,發(fā)揮更大的作用。
越早開始,企業(yè)從持續(xù)改進中獲得的收益就越多。
Klarna是全球支付網(wǎng)絡和購物平臺,推出了一款新的AI客服助手,來優(yōu)化客戶服務。
才幾個月,這個助手就處理了三分之二的客服咨詢,相當于數(shù)百名客服人員的工作量,平均解決問題時間從11分鐘縮減到2分鐘。

預計這一舉措能帶來4000萬美元的利潤增長,而且客戶滿意度和人工客服差不多。
這些成果不是一下子就有的,Klarna通過不斷測試和優(yōu)化客服助手,才有這樣的成果。
現(xiàn)在Klarna 90%的員工日常工作都會用AI。
公司內部對AI熟悉程度越來越高,這讓Klarna節(jié)奏更快,更高效地開展內部項目,還能持續(xù)優(yōu)化客戶體驗。
通過盡早投資并鼓勵廣泛應用,Klarna見證了AI帶來的復合效益,推動了整個業(yè)務發(fā)展。
AI在客戶互動方面的突破,為客戶帶來了更優(yōu)質、更實惠的體驗,給員工提供了更有挑戰(zhàn)的工作,也為投資者創(chuàng)造了更豐厚的回報。
經(jīng)驗四:定制并微調模型
Lowe’s如何優(yōu)化產(chǎn)品搜索
那些在應用AI方面成果顯著的企業(yè),往往愿意花時間、投入資源來定制和訓練AI模型。
OpenAI在API上投入了很多精力,不管是自助操作,還是借助工具和支持,都能更輕松地定制和微調模型。
OpenAI和財富50強企業(yè)、家裝零售商Lowe's緊密合作,致力于提高電商搜索功能的準確性和相關性。
Lowe's有數(shù)千家供應商,產(chǎn)品數(shù)據(jù)經(jīng)常不完整或者不一致。
關鍵在于精確的產(chǎn)品描述和標簽,同時還得了解消費者的搜索習慣,而這個習慣會因產(chǎn)品類別不同而變化。這時候微調就發(fā)揮作用了。

通過微調OpenAI模型,Lowe's把產(chǎn)品標簽標注的準確率提高了20%,錯誤檢測率提升了60%。
如果把GPT模型比作成衣,微調就像是量身定制,根據(jù)企業(yè)的特定數(shù)據(jù)和需求,對模型進行個性化調整。
經(jīng)驗五:讓專家掌握AI
西班牙對外銀行(BBVA)以專家為主導
員工最清楚公司的業(yè)務流程和問題,往往也最有能力找到用AI解決問題的辦法。
讓這些專家掌握AI,比構建通用的解決方案更有效。
全球銀行業(yè)領軍企業(yè)西班牙對外銀行有超12.5萬名員工,他們決定讓員工掌握AI,還和法務、合規(guī)、信息技術安全團隊緊密合作,確保合理使用AI。
他們在全球推出ChatGPT企業(yè)版,讓員工自己探索適用場景。

西班牙對外銀行全球人工智能應用主管Elena Alfaro說:「一般來說,在我們這樣的企業(yè),哪怕做個原型,都需要投入技術資源、花不少時間。但有了定制GPT,任何人都能創(chuàng)建應用程序解決特定問題,上手特別容易?!?/p>
才五個月,西班牙對外銀行的員工就創(chuàng)建了超2900個定制GPT,有些應用把項目和流程的時間從幾周縮到幾小時。
這一舉措在很多專業(yè)領域和部門產(chǎn)生了明顯影響:
信用風險團隊:用ChatGPT更快、更準確地評估信用風險。
法務團隊:每年借助它回答4萬個關于政策、合規(guī)等方面的問題。
客戶服務團隊:實現(xiàn)凈推薦值(NPS)調查的情感分析自動化。
這些成果還在市場營銷、風險管理、運營等部門不斷擴展。
「我們把對ChatGPT的投入看作是對員工的投資。AI能放大我們的潛力,幫我們提高效率、激發(fā)創(chuàng)造力。」
經(jīng)驗六:為開發(fā)者掃除障礙
Mercado Libre如何更快、更穩(wěn)定地構建AI項目
在許多企業(yè)中,開發(fā)者資源是主要的瓶頸,限制了業(yè)務增長。
工程團隊任務太多時,創(chuàng)新速度就會變慢,大量應用程序和創(chuàng)意只能積壓著,難以推進。
拉丁美洲最大的電商和金融科技公司Mercado Libre和OpenAI合作,構建了一個開發(fā)平臺層來解決這個問題。
這個平臺叫Verdi,由GPT-4o和GPT-4o mini提供支持。
現(xiàn)在,它能幫公司的1.7 萬名開發(fā)人員統(tǒng)一并加速AI應用程序的開發(fā)。

Verdi集成了語言模型、Python節(jié)點和API,打造出一個可擴展、穩(wěn)定的平臺,并以自然語言作為核心交互界面。
開發(fā)者現(xiàn)在能更快地構建高質量應用程序,還不用深入源代碼。平臺里還內置了安全機制、規(guī)則限制和路由邏輯。
因此,AI應用程序的開發(fā)速度大幅提升,Mercado Libre的員工用它實現(xiàn)了很多突破:
提升庫存容量:GPT-4o mini的視覺標簽功能給產(chǎn)品打標簽、完成商品上架,讓公司的商品目錄數(shù)量增長了100 倍。
檢測欺詐行為:每天評估數(shù)百萬條商品列表數(shù)據(jù),把標記商品的欺詐檢測準確率提高到近99%。
翻譯產(chǎn)品標題和描述:適應西班牙語和葡萄牙語的細微方言差異。
定制產(chǎn)品描述:滿足不同用戶的需求。
增加訂單量:自動生成評論摘要,幫助用戶快速了解產(chǎn)品反饋。
個性化通知:定制推送通知,提高用戶參與度,優(yōu)化產(chǎn)品推薦。
接下來,Mercado Libre還打算用 Verdi 優(yōu)化物流、減少延遲交付,在公司內部承擔更多有影響力的任務。
經(jīng)驗七:設定大膽的自動化目標
OpenAI如何實現(xiàn)工作自動化
在OpenAI,我們每天都接觸AI,所以經(jīng)常能發(fā)現(xiàn)新的自動化工作方法。
比如,客服團隊以前工作很繁瑣,要花大量時間訪問系統(tǒng)、了解情況、寫回復,還要為客戶采取正確行動。
于是,我們搭建了一個內部自動化平臺。它基于現(xiàn)有的工作流程和系統(tǒng)運行,能自動處理重復性工作,加快分析和行動速度。
首個應用場景是基于Gmail寫客戶回復,并觸發(fā)相關操作。
借助這個自動化平臺,團隊能馬上獲取客戶數(shù)據(jù)和相關知識文章,并把這些信息融入回復郵件或具體操作,像更新賬戶信息、創(chuàng)建客服工單。
把AI融入現(xiàn)有工作流程后,團隊工作效率更高、響應更快,也更以客戶為中心。
這個平臺每月處理幾十萬項任務,讓員工能專注于更有影響力的工作。
不出所料,這個系統(tǒng)現(xiàn)在已經(jīng)在其他部門推廣開了。
這一切能實現(xiàn),是因為我們從一開始就設定了大膽的自動化目標,沒把低效流程當成業(yè)務運營的必須承受的成本。
從前面的案例能看出,每家企業(yè)都有利用AI提升業(yè)務成果的機會。
不同公司和行業(yè)的應用場景可能不同,但這些經(jīng)驗適用于所有市場。
它們的共同特點是:部署人工智能需要開放、勇于嘗試的思維,還要有嚴格的評估和安全保障。
那些成功的企業(yè)不會盲目地把AI模型應用到所有工作流程,而是圍繞高回報、低投入的應用場景開展,在迭代中學習,再把經(jīng)驗用到新領域。
成果很明顯,也能衡量:流程更快速準確,客戶體驗更個性化,員工能專注于擅長的工作,工作也更有價值。
現(xiàn)在,企業(yè)在整合AI工作流程,實現(xiàn)越來越復雜的流程自動化,還經(jīng)常借助工具、資源和其他智能體來完成任務。
參考資料:
https://cdn.openai.com/business-guides-and-resources/ai-in-the-enterprise.pdf
https://openai.com/business/guides-and-resources/
熱門跟貼