打開網易新聞 查看精彩圖片

文/中國銀聯(lián)金融科技研究院 高鵬飛? 周雍愷

中國銀聯(lián)數(shù)據(jù)隱私保護創(chuàng)新技術研究組

人工智能(AI)的概念自20世紀50年代誕生以來,已經歷多次技術革新和應用浪潮。從早期的邏輯符號推理到專家系統(tǒng),再到機器學習和深度學習的突破,AI在各行業(yè)都得到了長足的探索和應用。近年來,隨著計算能力的顯著提升和ChatGPT的橫空出世,AI領域迎來了一個新的里程碑——大模型AI。相比于大模型之前的AI (本文稱之為傳統(tǒng)AI),大模型AI的出現(xiàn)開啟了創(chuàng)造性和適應性智能,兩者都將為數(shù)字經濟持續(xù)注入數(shù)字化能力。

本文將以中國銀聯(lián)與主要金融機構的產業(yè)實踐,從傳統(tǒng)AI與大模型AI分別展開,展示“AI+隱私計算”助力金融數(shù)據(jù)要素有序流動的實踐與探索,并介紹當前隱私計算互聯(lián)互通的最新進展,以及未來與AI生態(tài)深度融合的展望。

人工智能、隱私計算與金融數(shù)據(jù)要素共享流通

人工智能、隱私計算與金融數(shù)據(jù)要素共享流通

現(xiàn)代大參數(shù)量AI的高效運作往往依賴于海量優(yōu)質數(shù)據(jù)的支撐,以便AI系統(tǒng)能夠從中學習模型并準確預測和決策。這些數(shù)據(jù)不僅需要具備足夠的體量,而且要具有多樣性和質量,尤其是在商業(yè)領域,訓練一個優(yōu)質模型僅僅依靠一家企業(yè)的數(shù)據(jù)是不夠的,需要數(shù)據(jù)能夠跨行業(yè)、跨機構融合。

數(shù)據(jù)作為信息載體,蘊含個人隱私、商業(yè)機密,甚至事關國家安全。2020年以來,國家陸續(xù)出臺了一系列法律法規(guī),數(shù)據(jù)安全監(jiān)管趨嚴,數(shù)據(jù)也上升為關鍵生產要素。解決多方數(shù)據(jù)融合需求和數(shù)據(jù)安全、隱私保護的矛盾,需要相關技術予以支撐。隱私計算基于“原始數(shù)據(jù)不出域,可算不可見”的特性,能夠在保障數(shù)據(jù)隱私安全的情況下實現(xiàn)數(shù)據(jù)價值交換,近年來受到業(yè)界重點關注,發(fā)展較快。AI結合隱私計算技術無疑可以助力數(shù)據(jù)在安全合規(guī)的前提下實現(xiàn)更大范圍的融合,推動各行業(yè)數(shù)字化水平的進一步提升。

金融業(yè)是數(shù)據(jù)密集型和科技驅動型行業(yè),現(xiàn)代金融業(yè)務的核心就是信息處理與風險運營。智能化的數(shù)據(jù)處理及數(shù)據(jù)要素的流動對金融業(yè)而言好比大腦與血液。因此,以“AI+隱私計算”驅動的跨域數(shù)據(jù)智能成為金融機構數(shù)字化轉型的必選項。越來越多金融機構間通過隱私計算技術推進了多元化跨域多方數(shù)據(jù)融合,并結合各類人工智能技術在信貸風控、精準營銷、金融反詐等金融數(shù)據(jù)場景上進行模型訓練與深度應用,同步也在更多的業(yè)務領域進行前沿探索。

“傳統(tǒng)AI+隱私計算”在金融風控與營銷領域的應用

“傳統(tǒng)AI+隱私計算”在金融風控與營銷領域的應用

傳統(tǒng)AI與隱私計算的融合日趨成熟,在大幅提升金融業(yè)務的智能化水平的同時,有效保障了金融數(shù)據(jù)的安全與隱私。隱私計算與AI結合的核心技術主要包括:聯(lián)邦學習、多方安全計算(MPC)、可信執(zhí)行環(huán)境(TEE)等。這些技術使得多方可以在不泄露敏感信息與原始數(shù)據(jù)的前提下進行聯(lián)合建模與聯(lián)合預測。

目前,中國銀聯(lián)已經在支付、小微信貸風控、精準營銷等模型場景中通過“傳統(tǒng)AI+隱私計算”為用戶敏感信息提供強有力的安全保障,助力金融數(shù)據(jù)的跨域跨主體流通,發(fā)揮數(shù)據(jù)要素價值。

1.安全生物特征支付。數(shù)字經濟時代,用戶生物特征信息的應用面臨越來越高的合規(guī)與數(shù)據(jù)安全風險?;谏锾卣餍畔⑦M行用戶身份識別的技術,在金融、安防、電子商務等諸多場景實現(xiàn)了廣泛應用。一般通過客戶端采集生物特征信息,將用戶的明文數(shù)據(jù)傳輸?shù)皆粕戏斩诉M行特征值的提取和驗證。對于用戶而言,生物特征信息需明文傳送至云端,面臨個人信息泄露風險;對于金融機構而言,保留用戶生物特征信息也需要承擔數(shù)據(jù)泄露的風險。

在金融支付場景中,更需要平衡業(yè)務需求與個人信息保護之間的關系。在人臉特征識別的支付場景中,為保障數(shù)據(jù)安全,金融機構收集的人臉圖片或特征信息不能完整存儲于一方,需要在多方協(xié)同下完成身份驗證與識別。為滿足此應用需要,形成了以下兩種技術方案。

(1)MPC方案。人臉識別支付是一種利用人工智能技術,特別是神經網絡,來識別個體面部特征并進行身份驗證的支付方式。系統(tǒng)通過卷積神經網絡(CNN)從輸入的圖像中自動提取出人臉的深層特征,將圖像數(shù)據(jù)轉換為低維度的特征向量,通過與已存儲的用戶面部特征相匹配,從而完成支付過程中的身份驗證。

在MPC方案中,通過MPC秘密分享的方式將生物特征隨機切分成碎片存儲至兩個獨立的實體,任一參與方都無法恢復完整的生物特征,降低了泄露風險。同時,基于MPC進行人臉圖像特征提取和特征比對計算,確保生物特征數(shù)據(jù)的安全和計算結果的正確性、完整性。在實用性方面,采用明密文混合運算優(yōu)化深度神經網絡的離線特征提取,采用秘密分享、同態(tài)加密混合計算優(yōu)化1:N特征比對在線處理。在不改變用戶生物特征識別處理流程的基礎上,有效提升MPC安全生物特征處理效率,滿足人臉識別支付場景的生產可用要求(如圖1所示)。

圖1 基于多方安全計算的人臉識別框架
打開網易新聞 查看精彩圖片
圖1 基于多方安全計算的人臉識別框架

該項目于2021年4月入箱人民銀行上海金融科技創(chuàng)新監(jiān)管試點第二批應用試點,依托基于隱私計算技術的數(shù)據(jù)要素安全流通基礎設施,完成銀聯(lián)與某商業(yè)銀行雙邊網絡的多方安全計算系統(tǒng)部署。2023年12月由上海市金融科技創(chuàng)新監(jiān)管工具實施工作組宣布完成出箱。

項目綜合運用了隱私計算MPC技術,深度結合人臉識別場景,為個人信息保護法等法律法規(guī)中對于用戶生物特征(人臉)信息的安全合規(guī)使用要求提供了解決方案。在用戶敏感信息存儲方面,提出了生物特征分散存儲模式。為確保用戶生物特征(人臉)信息的合規(guī)使用,將用戶人臉特征信息經處理后形成計算因子,分散存儲在多個機構,即使單個機構的計算因子泄露,也無法恢復完整的用戶人臉信息。同時,單個機構保存的計算因子無法獨立完成交易驗證過程。

(2)TEE方案?;诳尚艌?zhí)行環(huán)境提供的安全隔離環(huán)境、安全傳輸方式和應用訪問控制能力實現(xiàn)人臉識別服務。其中,用戶側在TEE環(huán)境完成人臉信息的安全采集;機構側在TEE環(huán)境完成人臉信息的密態(tài)處理;用戶側到機構側數(shù)據(jù)全部為加密狀態(tài)傳輸。針對人臉敏感信息的計算處理過程均在可信執(zhí)行環(huán)境完成,機構內外部人員均無法獲取到明文信息,加強了隱私數(shù)據(jù)的安全保護。

2.小微助貸聯(lián)合建模。某商業(yè)銀行在開展小微企業(yè)信貸時,缺乏企業(yè)經營狀況等有效數(shù)據(jù)維度支撐,難以支撐銀行小微助貸業(yè)務有效開展,導致小微企業(yè)融資難、融資貴。在此背景下,銀聯(lián)與商業(yè)銀行圍繞“微業(yè)貸”業(yè)務開展小微信貸風控合作。考慮到國家數(shù)據(jù)安全相關法律法規(guī)要求,本案例通過聯(lián)合建模服務實現(xiàn)銀行和銀聯(lián)雙方數(shù)據(jù)在業(yè)務側的聯(lián)合建模,銀聯(lián)作為數(shù)據(jù)提供方,銀行作為數(shù)據(jù)需求方。同時,為提高模型效果及穩(wěn)定性,對模型進行迭代更新。

(1)基于縱向聯(lián)邦學習技術的解決方案。利用服務底座的縱向聯(lián)邦學習功能及數(shù)據(jù)撮合功能開展聯(lián)合建模工作(如圖2所示)。

圖2 小微企業(yè)信貸評估模型框架
打開網易新聞 查看精彩圖片
圖2 小微企業(yè)信貸評估模型框架

(2)項目合作過程主要包括四個步驟。一是數(shù)據(jù)和平臺接入。銀聯(lián)側和銀行側分別部署隱私計算平臺節(jié)點,雙方開通網絡互通策略,實現(xiàn)平臺的互通。同時,雙方節(jié)點與本地數(shù)據(jù)庫打通。二是聯(lián)合建模特征構建。雙方根據(jù)共有用戶及其所能獲取的相關數(shù)據(jù)特征維度,進行合理切分,制定特征體系。商業(yè)銀行側抽取小微企業(yè)的信貸違約記錄作為標簽;銀聯(lián)側融合多源數(shù)據(jù),構建以支付交易數(shù)據(jù)為核心的小微企業(yè)風險評估體系,包括企業(yè)、企業(yè)主經營、消費等多維度的數(shù)據(jù)特征及宏觀經濟指標。三是聯(lián)合建模。采用縱向邏輯回歸模型,結合特征體系作多輪計算優(yōu)化,實現(xiàn)雙方的聯(lián)邦建模。四是模型效果驗證。從ROC曲線所圍區(qū)域面積來看,聯(lián)合建模的曲線相較于自有數(shù)據(jù)建模更為飽滿,相應的AUC值提升了10多個百分點,超出行方預期。商業(yè)銀行在實際應用中目標客戶授信率與傳統(tǒng)方式相比平均提高了5個百分點,表明雙方數(shù)據(jù)通過聯(lián)合建模融合能夠顯著提升模型的性能表現(xiàn)。

3.精準營銷建模。商業(yè)銀行的精準營銷、數(shù)字化運營、智慧風控都依賴于大數(shù)據(jù),但隨著行內自有數(shù)據(jù)應用天花板的顯現(xiàn),迫切需要引入外部數(shù)據(jù)助力業(yè)務數(shù)字化轉型發(fā)展。為此,商業(yè)銀行積極推動與銀行卡機構開展數(shù)據(jù)合作??紤]到國家數(shù)據(jù)安全相關法律法規(guī)要求,本案例采用聯(lián)邦學習框架,實現(xiàn)商業(yè)銀行和銀聯(lián)雙方數(shù)據(jù)在業(yè)務側的聯(lián)合建模。

本案例基于聯(lián)邦學習技術的建模方案,通過服務底座的聯(lián)合建模完成雙方數(shù)據(jù)合作。其中,商業(yè)銀行作為數(shù)據(jù)應用方,提出業(yè)務需求及建模方案,并準備參與聯(lián)合建模的正負樣本數(shù)據(jù)。銀聯(lián)作為數(shù)據(jù)提供方和平臺方,一方面參與聯(lián)合建模方案設計,并根據(jù)業(yè)務方需求和建模方案,完成自身參與建模的數(shù)據(jù)特征處理,并形成參與建模的樣本數(shù)據(jù)。另一方面提供平臺聯(lián)合建模服務。

聯(lián)合建模結果表明,通過引入銀聯(lián)的數(shù)據(jù),商業(yè)銀行高價值客戶營銷模型效果提升明顯,KS指標提升64%。結合商業(yè)銀行行內客戶畫像系統(tǒng),顯著提升了用戶營銷的精準度和成功率。

“大模型AI+隱私計算”的研究探索

“大模型AI+隱私計算”的研究探索

人工智能大模型的安全性涉及多個方面,例如模型投毒,惡意參與方通過操縱或篡改輸入數(shù)據(jù)影響模型行為。又如大模型知識產權保護問題,大模型存在被抄襲或盜用的風險,一方面,某些企業(yè)可能會通過逆向工程等手段獲取其他公司的大模型結構和參數(shù),并在此基礎上進行修改和使用。另一方面,一些大模型是基于開源技術開發(fā)的,開源協(xié)議通常規(guī)定了使用者的權利和義務,如果使用者違反協(xié)議,對開源模型進行不當?shù)男薷?、分發(fā)或商業(yè)利用,可能引發(fā)知識產權糾紛。

此外,在大模型訓練和推理階段同樣存在各類安全風險。在訓練階段,訓練數(shù)據(jù)中可能包含大量的個人信息、商業(yè)機密等敏感數(shù)據(jù)。如果數(shù)據(jù)存儲、傳輸或使用過程中的安全措施不到位,可能導致敏感信息泄露。

隱私計算技術通過聯(lián)邦學習、可信執(zhí)行環(huán)境及模型切片、端云協(xié)同、差分隱私、提示工程保護、隱私微調、多方安全計算等方法,起到了保障大模型訓練與推理等階段的數(shù)據(jù)安全隱私、平衡計算資源與效率、促進數(shù)據(jù)要素流通的作用。目前,業(yè)界已有研究通過可信執(zhí)行環(huán)境和模型切分實現(xiàn)大模型安全訓練,模型拆分可以提升聯(lián)邦模式下模型參數(shù)在通信信道傳輸?shù)男逝c機密性,而可信執(zhí)行環(huán)境可以保障訓練過程的機密性并防止訓練數(shù)據(jù)泄露;基于多方安全計算協(xié)議的“客戶端—服務器”模式下的大模型協(xié)同訓練可以保障數(shù)據(jù)隱私,同時,利用模型蒸餾方式保護了原始大模型內容隱私;差分隱私算法利用距離范式將原始輸入文本隱私化,并且能夠防范模型梯度逆推攻擊。

銀聯(lián)提出了一種保護隱私與權益的大模型協(xié)作訓練與推理方案,旨在讓金融大模型在定制化訓練過程中實現(xiàn)“模型可用不可見、數(shù)據(jù)安全不出域”。該方案基于Adapter Tuning的大模型微調技術,利用模型拆分和Adapter層密態(tài)計算對訓練數(shù)據(jù)進行保護。同時,模型參數(shù)對數(shù)據(jù)持有者不可知。在訓練與推理過程中,模型持有者的充足計算資源可以得到充分利用。

未來,在數(shù)據(jù)分析與智能決策、風險評估與信貸審批、智能投顧與財富管理、反欺詐與風險管理、客戶畫像與精準營銷、供應鏈金融與中小企業(yè)融資等多個場景中,隱私計算與AI大模型結合的技術方案都將展現(xiàn)出巨大的應用潛力。

隱私計算互聯(lián)互通助力數(shù)據(jù)要素規(guī)?;行蛄魍? data-thumbnail=

隱私計算互聯(lián)互通助力數(shù)據(jù)要素規(guī)?;行蛄魍?/h3>

由上述應用案例可以看出,隱私計算與AI在金融領域的結合,正在加快推動金融服務向數(shù)字化、智能化方向發(fā)展。通過隱私計算,不同機構可以在保護數(shù)據(jù)隱私的同時更好地共享數(shù)據(jù)價值,加強跨機構和跨行業(yè)間合作信任,促進數(shù)據(jù)要素的規(guī)?;魍ê蛻?,切實推動數(shù)據(jù)要素市場化。結合人工智能,隱私計算將得以更為高效地處理和分析加密數(shù)據(jù),提供更精準的數(shù)據(jù)分析結果,從而提高金融數(shù)據(jù)服務的使用規(guī)模、質量和效率。

然而,隱私計算平臺之間的互聯(lián)互通問題成為了制約數(shù)據(jù)要素規(guī)?;行蛄魍ǖ钠款i。由于隱私計算技術實現(xiàn)復雜、技術流派多,沒有一種技術能完全滿足各種業(yè)務需求。不同金融機構、技術廠商采用不同的系統(tǒng)架構和技術框架、用法不一,各隱私計算平臺間難以互聯(lián)互通。即使同一機構,在實現(xiàn)同樣場景功能時,若合作方不同,也要部署不同的平臺,多方數(shù)據(jù)融合應用難以協(xié)調。這種情況不僅帶來資源成本、學習成本、協(xié)調成本和運營成本的高企,還放大了系統(tǒng)安全風險,對隱私計算技術的應用造成阻礙,掣肘數(shù)據(jù)要素的有序流通?;诖耍[私計算產品間的技術壁壘,實現(xiàn)跨機構、跨平臺隱私計算技術的規(guī)?;ヂ?lián)互通,以促進數(shù)據(jù)要素流通、激發(fā)數(shù)據(jù)價值潛能,勢在必行。

在北京金融科技產業(yè)聯(lián)盟數(shù)據(jù)專委會組織協(xié)調下,中國銀聯(lián)自2022年起聯(lián)合商業(yè)銀行、互聯(lián)網機構、金融科技公司、檢測機構、科研院所等50余家單位,共同開展金融業(yè)隱私計算互聯(lián)互通平臺研究及應用工作。歷經兩年多的聯(lián)合研究攻關,現(xiàn)已取得突破性進展,并入選“2023金融信息化10件大事”,相關工作還得到了通信、互聯(lián)網、能源等重要行業(yè)的積極反饋與響應。一是發(fā)布金融業(yè)首部隱私計算互聯(lián)互通標準及業(yè)界首項互聯(lián)互通API接口規(guī)范,完成該標準與通信行業(yè)互聯(lián)互通標準的拉通對齊,促進形成全行業(yè)適用的事實性標準;二是加快標準適配應用進程,率先完成了多方跨平臺、跨算法互通聯(lián)調驗證,為跨域規(guī)?;M網驗證試點奠定了基礎;三是聯(lián)合主流檢測機構完成跨行業(yè)互通檢測能力建設,為產業(yè)化落地保駕護航;四是引領實踐數(shù)據(jù)要素流通場景,聯(lián)合工行、中行、交行、招行、浦發(fā)等商業(yè)銀行與螞蟻、字節(jié)、京東、美團等產業(yè)方合作完成了睡眠卡促活、高價值用戶挖掘、小微信貸風控和反欺詐等示范性行業(yè)標桿案例,為下一步跨行業(yè)規(guī)模化組網(如圖3所示)應用試點提供了堅實支撐。

圖3 基于隱私計算與人工智能技術的跨行業(yè)數(shù)據(jù)規(guī)?;M網流通示意
打開網易新聞 查看精彩圖片
圖3 基于隱私計算與人工智能技術的跨行業(yè)數(shù)據(jù)規(guī)?;M網流通示意

以推進行業(yè)級互聯(lián)互通落地為出發(fā)點,中國銀聯(lián)將繼續(xù)加強與各產業(yè)方的合作,共同推動金融業(yè)數(shù)據(jù)要素流通基礎設施建設,助力構建開放多元的金融科技服務生態(tài)。

小結與展望

小結與展望

隨著數(shù)據(jù)要素的進一步流通,人工智能與隱私計算的結合會更加緊密。隱私計算將成為人工智能,尤其是大模型技術在金融場景應用的重要支撐。一方面,隱私計算互聯(lián)互通技術有望在金融機構間建立起數(shù)據(jù)要素有序流通的“高速路”,從而建立金融行業(yè)級的高質量數(shù)據(jù)集,幫助訓練和強化金融垂直領域大模型,解決當前通用大模型難以滿足金融領域特定需求的問題。另一方面,隨著數(shù)據(jù)要素生態(tài)的逐步發(fā)展,可能會衍生形成規(guī)?;乃惴ㄊ袌龊湍P褪袌?,并配套建立相應的檢測認證體系。大型金融機構、互聯(lián)網公司和人工智能企業(yè)憑借自身的技術優(yōu)勢與資源優(yōu)勢,可以面向中小金融機構提供通用或定制化的人工智能算法和模型,從而推動人工智能在金融行業(yè)低成本、廣泛應用,提升金融行業(yè)整體的數(shù)據(jù)流通效率。

大模型等人工智能技術作為新質生產力的重要引擎,正在引領新一輪產業(yè)變革升級。金融機構和金融科技企業(yè)需要不斷創(chuàng)新和協(xié)作,綜合運用隱私計算等技術保障數(shù)據(jù)有序合規(guī)流通,并進一步打造金融細分場景人工智能應用,實現(xiàn)金融數(shù)據(jù)“活水”精準滴灌實體經濟,切實助力金融高質量發(fā)展。

(研究組成員:王琪、李定洲、趙慶杭、戚文彬、陳鐘正、胡君一、費志軍、邱雪濤、袁航、鄒奮、張高磊、謝袁源、侯騰、丁亞丹、龐悅、袁靜、余洋、郭弘強、王大森、歐陽琛、黃磊、甘恬、劉乃幸、李愛林、陳伯伸、寇惠通、馮碩、羅科勤、安慶文、蔣丹妮、馬偉峰、李潔、崔喆)

(此文刊發(fā)于《金融電子化》2025年1月上半月刊)