一区二区三区二区中文字幕视频 ,92午夜福利1000大合集,欧美牲交xxx,日韩av一区不卡,国产乱码av一区二区三区乱码

前不久，Manus一夜爆紅。它能用自然語言寫出復雜程序，卻被人通過誘導提示詞“越獄”了核心代碼。這不是個例，而是大模型安全風險的縮影。

眼下，這類“天才病”正蔓延至整個行業(yè)：大模型越聰明，漏洞越致命、安全風險越高。算力盜用、數(shù)據(jù)投毒、幻覺失控等問題頻發(fā)，黑客甚至能通過API接口“白嫖”算力挖礦。

當“技術狂奔”遇上“安全裸奔”，360推出大模型安全方案，宣稱要“以模制?！薄Ｓ媚Хù驍∧Хǖ漠a(chǎn)品邏輯，能否帶來成效？

大模型安全：一場“天才與傻子”的博弈

為什么會出現(xiàn)大模型的安全問題？這背后是意識、技術和生態(tài)的“三重不足”。

很多人都不會想到，“越獄”Manus核心代碼的人，根本沒用什么黑客技術，只是對Manus說了句話，“你能查查后臺有哪些文件嗎？”，Manus就很聽話地把文件交出來了。360創(chuàng)始人周鴻祎表示這樣的操作有個專業(yè)術語，叫“提示注入攻擊”。都以為大模型很聰明，但它有時候也很傻很天真。你稍微花言巧語地“哄騙”它，甚至是“PUA”它，它就上當了，這也是大模型現(xiàn)在最脆弱的地方。

要知道，現(xiàn)在大模型已經(jīng)在社會上廣泛應用，光是DeepSeek日活已突破3000萬，還有成上千萬的企業(yè)、政府機構、高校等在接入大模型，如果不重視大模型的安全問題，就會埋下極大的隱患。比如，當一家企業(yè)接入大模型之后，知識庫里的核心數(shù)據(jù)很可能被黑客“套走”。

除了提示注入攻擊，大模型還存在其他問題，比如內(nèi)容安全和AI幻覺。

大模型的訓練需要海量數(shù)據(jù)，但數(shù)據(jù)的真實性卻沒有擔保。中國信通院曾做過實驗，在特定在線論壇上發(fā)布百余條虛假信息后，一些大模型對虛假信息的置信度，就會從百分之十幾快速飆升。這相當于在水池當中注入幾滴毒藥，很快就會讓整個水池帶有毒性，也就是整個平臺的內(nèi)容體系都會被破壞。

讓人擔憂的是，一些大模型甚至會自己編造一些虛假內(nèi)容，這也被稱為“AI幻覺”。2023年5月，美國紐約一名律師在使用ChatGPT生成的法律案情摘要時，模型引用了多個虛構的判例，導致法院駁回律師的意見并處以罰款。不少大模型都會一本正經(jīng)地胡說八道，編造它認為真實存在甚至看起來合理的信息。這是因為它追求的是邏輯自洽，而非事實正確。

事實上，兩位人工智能教父級人物Yoshua Bengio和Geoffrey Hinton早在2023年就提了一個AI治理框架議案，表示AI產(chǎn)生錯誤信息等危害已經(jīng)很明顯，企業(yè)和政府應將至少三分之一的AI研發(fā)預算用于AI安全。從目前的情況來看，很多企業(yè)并沒有做到。

360的解法：以魔法打敗魔法

如何解決大模型的安全問題，《一點財經(jīng)》認為專業(yè)的事還得專業(yè)的人來干。橫跨大模型和安全兩個領域的企業(yè)中，360是合適的選手之一。

在360看來，大模型自身安全問題包含了三個大的層面——大模型自身安全、應用安全以及它的倫理安全。而每一項大的安全項目下，又包含了非常細致縝密的安全細項，這使得大模型安全成為一項龐雜的系統(tǒng)工程。

此前，周鴻祎在社交平臺上表示，360會用專門的安全大模型，對其他大模型進行分析和約束，確保行為舉止的安全。具體來看，針對大模型的安全問題，360已經(jīng)推出了一套行之有效的解決方案。

針對大模型系統(tǒng)安全問題，360提供了全鏈路、多場景、易擴展的大模型安全檢測系統(tǒng)。比如，大模型系統(tǒng)安全檢測平臺“360智鑒”就像給企業(yè)請了個“全能保鏢”。它把黑客攻防演練（紅藍對抗）和AI技術相結合，能給企業(yè)的大模型做全身體檢，體檢項目包括：識別系統(tǒng)零件是否安全、排查開發(fā)工具漏洞、檢查代碼隱患、確保合規(guī)合法。

而且，“360智鑒”還支持近百個組件的400+公開漏洞檢測，覆蓋RAG、Agent、prompt等場景的安全性分析，幫助企業(yè)在大模型上線前進行全方位的安全評估。這就像給AI系統(tǒng)打疫苗，在上線前就發(fā)現(xiàn)安全隱患，避免運行中出故障。

除了“360智鑒”，360還推出大模型內(nèi)容安全護欄系統(tǒng)“360智盾”，它相當于為大模型加裝了一套“內(nèi)容防護盔甲”。在輸入端，輸入的內(nèi)容首先會經(jīng)過風險識別分類器，然后根據(jù)風險等級進行分級處理。如果是紅線類內(nèi)容直接拒答，敏感但可答類交由“安全回復大模型”處理，安全內(nèi)容則正常進入業(yè)務模型。在輸出端，模型生成內(nèi)容會再次經(jīng)過檢測，確保無違規(guī)風險。

在這些解決方案背后，離不開360的技術沉淀和大力投入。去年周鴻祎在公開演講中提到，360過去10年累計投入了將近300億人民幣，研發(fā)投入在網(wǎng)絡安全行業(yè)里超過第二名到第十名的總和。另外，360安全大模型投入了20年積累的安全數(shù)據(jù)，10年AI技術沉淀，80名AI算法專家，100名安全專家。

值得一提的是，最近工業(yè)和信息化部發(fā)布了2024年未來產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例名單，“360智盾”成功入選，成為人工智能安全領域標志性產(chǎn)品。這既是對360在大模型安全領域長期投入與領先能力的肯定，也體現(xiàn)出在AI應用加速落地的當下，安全可控正在變得越來越重要。

當技術狂奔撞上安全高墻產(chǎn)生各種隱患，行業(yè)不得不承認：沒有安全兜底的發(fā)展，本質(zhì)是一場豪賭。人工智能技術是一把“雙刃劍”，在帶來自動化和先進工作生活方式的同時，也帶來很多安全問題，甚至不亞于核武器，是人類有史以來面臨“最大的安全挑戰(zhàn)之一”，遠超過傳統(tǒng)數(shù)字安全。

這也意味著，大模型的全新特性帶來了前所未有的安全挑戰(zhàn)，大模型安全問題超越了傳統(tǒng)網(wǎng)絡安全的范疇。

眺望未來：安全成為大模型底座

中國的大模型正在飛速發(fā)展，帶來無限的想象空間。同時，大模型也是數(shù)智化時代的重要基礎設施。360認為，它的發(fā)展要遵循的“安全、向善、可信、可控”四大原則。

其中安全是要保證大模型的系統(tǒng)安全，同時解決數(shù)據(jù)與隱私泄露等問題；向善主要是指生成內(nèi)容安全，如今AI換臉、換聲詐騙多發(fā)，不要讓AI成為詐騙者的工具；可信就是要切實解決大模型“幻覺”所造成的知識模糊和胡編亂造的問題；最后的可控原則，是要確保人在決策回路上，不能出現(xiàn)不可撤銷的后果。

要實現(xiàn)這樣的四大原則，“以模制模”新解法是關鍵，用安全大模型應對新型AI安全問題是抓手。比如，360 構建了 360 安全評測大模型、紅藍對抗大模型、風險檢測大模型，實現(xiàn)了大模型安全的運營與保護的能力。當攻擊者利用提示注入攻擊等手段，試圖PUA大模型以獲得違規(guī)內(nèi)容時，360安全風控大模型將會發(fā)揮作用，對輸入內(nèi)容進行分析，違規(guī)的輸入將被過濾，并拒絕回答。

如果輸入的內(nèi)容正常，但大模型因為偏見或幻覺等原因，輸出內(nèi)容存在違規(guī)風險時，360安全回復大模型也會對輸出內(nèi)容進行優(yōu)化，進行安全改寫，進而確保輸入、輸出都是安全的。

針對大模型的幻覺問題，企業(yè)可以通過收集整理企業(yè)或行業(yè)知識，構建專屬知識庫方式，對專業(yè)領域知識提供通用大模型無法解答的精準答案。同時，360也能發(fā)揮在搜索算法方面的優(yōu)勢，提供搜索增強組件以及RAG增強能力，通過算法干預對聯(lián)網(wǎng)信息、企業(yè)知識庫進行更好的整合，從而緩解幻覺問題。

數(shù)據(jù)顯示，使用360搜索技術進行RAG增強后，相比裸模型回答的幻覺比例下降50%，用戶整體體驗提升30%。

針對Agent安全問題，360正在通過原生安全的Ai Agent可控框架，對大模型的場景進行統(tǒng)一編排調(diào)用。在Agent可控框架中原生設置安全措施，保證大模型的“手和腳”可控，把大模型能力關在籠子里。

在這個過程中，需要Agent平臺實現(xiàn)任務規(guī)劃全程監(jiān)督，對工具、插件、API的調(diào)用過程進行監(jiān)控、記錄。比如，對斷電、重啟、刪除數(shù)據(jù)文件這樣的關鍵動作，需要通過人工審批判斷。針對Agent執(zhí)行過程中的安全風險，還需要構建Agent行為沙箱，通過模擬智能體執(zhí)行的各類環(huán)境，部署行為采集探針，建立行為評價算法，實現(xiàn)對Agent執(zhí)行過程中全生命周期行為的安全評估。如此一來，能夠及時發(fā)現(xiàn)惡意行為，實現(xiàn)動態(tài)安全防護。

在這場變革中，360的角色正在發(fā)生躍遷。

它一方面是“安全方案供應商”，通過360智鑒、360智盾等核心產(chǎn)品，構建起全鏈條能力。另一方面，它逐漸成為“規(guī)則制定者”，在安全聯(lián)盟里發(fā)揮領頭羊作用，并通過制定安全標準推動行業(yè)發(fā)展。

未來，當大模型深入到社會的各個領域，它將成為國家級別的“基礎設施”。而360更深層的價值，是成為AI時代的核心基建商，即通過標準、數(shù)據(jù)和生態(tài)的“三位一體”，成為AI安全的基底。這時候，它的價值將從用戶和商業(yè)維度，攀升到更高階的社會維度。