最近,總有吃瓜群眾問:通過API的方式,來調(diào)用市面上各種DeepSeek服務(wù),到底安全不安全,會不會造成隱私或者數(shù)據(jù)泄露?

先說結(jié)論:不安全!

無論是通過API還是通過網(wǎng)頁版,或者各種APP客戶端,都存在一定的安全風(fēng)險(xiǎn)。

打開網(wǎng)易新聞 查看精彩圖片

具體存在哪些風(fēng)險(xiǎn)呢?

具體存在哪些風(fēng)險(xiǎn)呢?

首先明確一點(diǎn),當(dāng)通過API或者WEB/APP使用大模型服務(wù)的時(shí)候,你的Prompt信息(輸入的文本、問題、指令,提交的圖片或者文檔等等),都會被傳送到公網(wǎng)和云端服務(wù)器。

打開網(wǎng)易新聞 查看精彩圖片

那么以下環(huán)節(jié),就可能存在風(fēng)險(xiǎn)↓

1、數(shù)據(jù)傳輸風(fēng)險(xiǎn)

當(dāng)你通過網(wǎng)絡(luò)將數(shù)據(jù)發(fā)送到云端API時(shí)(網(wǎng)頁版也一樣),如果這個(gè)鏈接不是HTTPS加密的,那么,你就要小心了,數(shù)據(jù)可能會被攔截或竊聽。

當(dāng)然,絕大多數(shù)正規(guī)服務(wù)提供商都會默認(rèn)使用加密傳輸,但是,也不排除某些草臺班子搞出“超綱”的操作。(尤其要注意某些山寨的或者廉價(jià)的服務(wù)商)

打開網(wǎng)易新聞 查看精彩圖片

2、服務(wù)提供商的隱私政策與存儲策略

用戶提交到服務(wù)器端的數(shù)據(jù),在大模型完成推理任務(wù)后,這些數(shù)據(jù)默認(rèn)會被“短暫保存”,主要用于日志、合規(guī)審計(jì)、服務(wù)優(yōu)化等目的(這是作為服務(wù)商必須的,也是合理正當(dāng)?shù)模?/p>

打開網(wǎng)易新聞 查看精彩圖片

但不排除數(shù)據(jù)會被長期保存,并被用于訓(xùn)練,這需要看不同服務(wù)商的隱私政策。

所以,大家在使用注冊使用服務(wù)的時(shí)候,一定要仔細(xì)看用戶協(xié)議和隱私政策,確認(rèn)數(shù)據(jù)是否會被存儲、如何存儲、存儲多久,以及數(shù)據(jù)是否會被使用。

比如DeepSeek官方API的用戶協(xié)議,是這樣寫的↓

打開網(wǎng)易新聞 查看精彩圖片

這是另外一家第三方API提供商的協(xié)議,明確說明不會訪問和使用。

當(dāng)然因?yàn)檫@是一家純純的第三方,并沒有自家的模型,所以不拿數(shù)據(jù)去訓(xùn)練也是理所應(yīng)答的。↓

打開網(wǎng)易新聞 查看精彩圖片

我們再看ChatGPT的協(xié)議,就很霸道了。

明確說了會將數(shù)據(jù)用于訓(xùn)練,不過他們也給了一個(gè)可選的通道,允許用戶禁止自己的數(shù)據(jù)用于訓(xùn)練。

當(dāng)然,對于商業(yè)用戶,OpenAI默認(rèn)不會把他們的數(shù)據(jù)拿去訓(xùn)練。

打開網(wǎng)易新聞 查看精彩圖片

不管協(xié)議怎么約定,數(shù)據(jù)在別人手里,總還是讓人覺得不妥帖的。

與本地部署的模型相比,云端API意味著你無法完全控制數(shù)據(jù)的處理環(huán)境,你必須依賴服務(wù)提供商的承諾和能力來保護(hù)數(shù)據(jù)。

打開網(wǎng)易新聞 查看精彩圖片

3. 大模型服務(wù)商自身的安全能力

即使API服務(wù)商“一心向善”,恪守不碰數(shù)據(jù)的原則。

但如果他們安全能力不足(比如服務(wù)器被黑客攻擊),你的數(shù)據(jù)仍然會面臨泄露風(fēng)險(xiǎn)。

選擇有良好聲譽(yù)、技術(shù)實(shí)力雄厚、具備強(qiáng)大安全認(rèn)證(如ISO 27001)的提供商可以降低這種風(fēng)險(xiǎn)。

打開網(wǎng)易新聞 查看精彩圖片

4. 本地RAG知識庫的數(shù)據(jù)泄露

還有一種典型的應(yīng)用場景,那就是在調(diào)用API的同時(shí),本地部署了知識庫做RAG。

有小伙伴問:本地的知識庫會被傳輸?shù)皆贫藛幔?/strong>

我們先來看一下完整的數(shù)據(jù)交互流程,由于增加了RAG,整個(gè)流程多了兩步。

打開網(wǎng)易新聞 查看精彩圖片

通過這個(gè)流程可見,本地知識庫在使用過程中,并不會被完整上傳到云端。

但是與用戶問題最相關(guān)知識片段,會被上傳、存儲。

所以,使用RAG,不僅當(dāng)前提交的內(nèi)容有泄露風(fēng)險(xiǎn),本地知識庫也會泄露,知識庫中要避免存儲敏感信息(隱私數(shù)據(jù)、商業(yè)機(jī)密)。

打開網(wǎng)易新聞 查看精彩圖片

總的來說,調(diào)用云端大模型API服務(wù)確實(shí)有一定的數(shù)據(jù)泄露風(fēng)險(xiǎn),如果有嚴(yán)苛的合規(guī)要求和數(shù)據(jù)安全需求,建議選擇以下方案↓

1、完全本地化部署:一體機(jī)、本地化集群、專屬云等,犧牲靈活性和成本來換安全。

2、云上專屬模型部署:選擇可靠的、有數(shù)據(jù)安全背書的AI Infra服務(wù)商,部署專屬模型。

3、如必須調(diào)用API,則增加數(shù)據(jù)脫敏措施,避免提交敏感數(shù)據(jù),或者在知識庫中存放敏感數(shù)據(jù)。

當(dāng)然,本地化部署并不一定就比云上安全,這取決于本地的安全防護(hù)能力、運(yùn)維水平和安全意識。

就好比,把錢放在家里未必比放在銀行保險(xiǎn)柜安全。

打開網(wǎng)易新聞 查看精彩圖片