人們本以為GenAI的企業(yè)采用率會(huì)很高,但實(shí)際上比預(yù)期的要慢。Telstra和MIT Review最近的一項(xiàng)調(diào)查顯示,雖然75%的企業(yè)去年測(cè)試了GenAI,但只有9%廣泛部署了它。主要障礙是什么?數(shù)據(jù)隱私和合規(guī)性。
自從ChatGPT公開(kāi)推出以來(lái)還不到18個(gè)月,它在不到兩個(gè)月的時(shí)間里就獲得了1億用戶(hù)。鑒于這種熱潮,人們本以為GenAI的企業(yè)采用率會(huì)很高,但實(shí)際上比預(yù)期的要慢。Telstra和MIT Review最近的一項(xiàng)調(diào)查顯示,雖然75%的企業(yè)去年測(cè)試了GenAI,但只有9%廣泛部署了它。主要障礙是什么?數(shù)據(jù)隱私和合規(guī)性。
這點(diǎn)非常真實(shí),在2024年上半年,我與近100位企業(yè)CISO進(jìn)行了交談,他們的主要關(guān)注點(diǎn)是如何獲得對(duì)員工AI使用的可見(jiàn)性,如何執(zhí)行企業(yè)關(guān)于可接受AI使用的政策,以及如何防止客戶(hù)數(shù)據(jù)、知識(shí)產(chǎn)權(quán)和其他機(jī)密信息的泄露。
大量的努力已經(jīng)投入到保護(hù)模型本身,這確實(shí)是一個(gè)需要解決的問(wèn)題,但保護(hù)用戶(hù)在模型周?chē)涂缒P偷幕顒?dòng)所帶來(lái)的隱私和合規(guī)問(wèn)題可能更大。模型安全性主要關(guān)注防止偏見(jiàn)、模型漂移、污染等問(wèn)題,而保護(hù)模型用戶(hù)活動(dòng)則側(cè)重于可見(jiàn)性和控制,以及數(shù)據(jù)和用戶(hù)保護(hù)。
保護(hù)跨模型的用戶(hù)活動(dòng)
那么,你需要什么才能獲得可見(jiàn)性和控制權(quán)?內(nèi)部模型用戶(hù)活動(dòng)的可見(jiàn)性是一個(gè)可管理的問(wèn)題。如今,大多數(shù)企業(yè)只使用了很少的LLM,并且員工訪問(wèn)這些模型的權(quán)限有限。獲得對(duì)外部托管AI和啟用AI的目的地的可見(jiàn)性則要困難得多。
要完全了解內(nèi)部和外部的用戶(hù)活動(dòng),你必須:
a) 捕獲所有外向訪問(wèn)
b) 理解這些數(shù)據(jù)
例如,這名員工究竟在訪問(wèn)什么,數(shù)據(jù)托管在哪里,數(shù)據(jù)存儲(chǔ)在哪里,使用是否安全?當(dāng)然,這只是識(shí)別目的地,接下來(lái),你需要捕獲并分析所有員工在這些地方的活動(dòng),他們輸入了什么提示,這是否合規(guī)?他們得到了什么回應(yīng),這是否合規(guī)?在最初發(fā)布和達(dá)到1億用戶(hù)之間的兩個(gè)月里,ChatGPT收到了大量企業(yè)員工的訪問(wèn)。源代碼、財(cái)務(wù)計(jì)劃、營(yíng)銷(xiāo)活動(dòng)等大量信息被上傳,因?yàn)閱T工在測(cè)試這項(xiàng)新技術(shù)。很少有CISO有信心完全了解已經(jīng)發(fā)送和仍在發(fā)送的內(nèi)容。
即使有良好的可見(jiàn)性,通過(guò)政策控制員工活動(dòng)也不容易。執(zhí)行機(jī)制在哪里運(yùn)行?是在終端代理上?代理服務(wù)器上?網(wǎng)關(guān)上?云端?
AI可接受使用政策如何表達(dá)?考慮一個(gè)AI數(shù)據(jù)訪問(wèn)政策:某法律或咨詢(xún)公司可能要求來(lái)自客戶(hù)A的LLM數(shù)據(jù)不能用于生成客戶(hù)B的答案。上市公司的總法律顧問(wèn)可能希望制定AI主題訪問(wèn)政策:財(cái)務(wù)部門(mén)以外且職位低于副總裁的員工不能詢(xún)問(wèn)收益信息。首席隱私官可能要求制定AI意圖政策:如果你使用外部GenAI編寫(xiě)合同,在發(fā)送提示之前必須刪除所有PII。
獲得員工AI使用的可見(jiàn)性和控制
經(jīng)過(guò)18個(gè)月使用GenAI的經(jīng)驗(yàn),企業(yè)已經(jīng)開(kāi)始了解獲得用戶(hù)活動(dòng)可見(jiàn)性和控制的必要條件。無(wú)論是構(gòu)建還是購(gòu)買(mǎi)解決方案,都需要執(zhí)行特定功能:
? 建立目標(biāo)數(shù)據(jù)庫(kù):首先,你需要建立和維護(hù)一個(gè)GenAI目標(biāo)數(shù)據(jù)庫(kù)(即包含嵌入AI的域名和應(yīng)用程序)。沒(méi)有這個(gè)數(shù)據(jù)庫(kù),你只能基于DNS進(jìn)行訪問(wèn)的阻止或允許。
? 捕獲目標(biāo)域名:接下來(lái),你需要獲取員工試圖訪問(wèn)的實(shí)際域名。捕獲DNS活動(dòng)有多種選擇:從終端(即代理)、防火墻、代理服務(wù)器、CASB等獲取。
? 記錄實(shí)際活動(dòng):為了獲得可見(jiàn)性,你需要將員工活動(dòng)持續(xù)映射到目標(biāo)數(shù)據(jù)庫(kù),建立員工活動(dòng)目錄——特別是相對(duì)于AI,你的員工去了哪里?基本版本可以在事后提供員工訪問(wèn)的AI模型、聊天機(jī)器人等的可見(jiàn)性。更高級(jí)的版本可能會(huì)增加對(duì)這些目標(biāo)的風(fēng)險(xiǎn)分析。
? 捕獲對(duì)話(huà):當(dāng)然,可見(jiàn)性不僅僅包括目標(biāo),還包括進(jìn)入和離開(kāi)這些AI目標(biāo)的實(shí)際提示、數(shù)據(jù)和響應(yīng)。你需要捕獲這些內(nèi)容并應(yīng)用額外的風(fēng)險(xiǎn)分析。
? 進(jìn)行主動(dòng)執(zhí)行:上述所有可見(jiàn)性功能可以在事后進(jìn)行。如果你想對(duì)外部AI系統(tǒng)應(yīng)用可接受使用政策,你需要一個(gè)在推理時(shí)強(qiáng)制執(zhí)行的政策機(jī)制,它需要攔截提示并應(yīng)用政策,以防止不必要的數(shù)據(jù)丟失、不安全的使用等。
? 全面執(zhí)行政策:確保政策機(jī)制適用于內(nèi)部和外部的LLM訪問(wèn),并跨云、LLM和安全平臺(tái)。由于大多數(shù)企業(yè)使用混合的云和安全產(chǎn)品,如果你的政策引擎不局限于單一平臺(tái)或云,效果會(huì)更好。
當(dāng)前市場(chǎng)狀況
上述步驟可能很復(fù)雜,但一些企業(yè)已經(jīng)取得了進(jìn)展。毫無(wú)疑問(wèn),較大、較先進(jìn)的企業(yè)已經(jīng)建立了一些控制措施來(lái)執(zhí)行上述部分功能。
我與一些企業(yè)交談過(guò),他們從頭開(kāi)始構(gòu)建了大部分AI可見(jiàn)性和控制功能,其他企業(yè)則使用他們的EDR、SIEM、CASB、代理服務(wù)器和防火墻的組合來(lái)捕獲數(shù)據(jù),進(jìn)行一些基本的阻止和事后可見(jiàn)性報(bào)告。當(dāng)然,隨著新的安全問(wèn)題出現(xiàn),也有新的初創(chuàng)公司正在將解決方案推向市場(chǎng),這是一個(gè)企業(yè)安全和隱私領(lǐng)域非常活躍且快速發(fā)展的領(lǐng)域。
最后一點(diǎn):偶爾會(huì)發(fā)生重大IT變革,顯著影響員工(和客戶(hù))使用IT的方式。90年代后期的企業(yè)網(wǎng)絡(luò)部署和2010年代的移動(dòng)應(yīng)用都推動(dòng)了企業(yè)基礎(chǔ)設(shè)施的大規(guī)模演變,這兩次重大計(jì)算變革都帶來(lái)了數(shù)據(jù)丟失和攻擊的新潛在風(fēng)險(xiǎn),并且每次都需要顯著的新技術(shù)解決方案。GenAI無(wú)疑是IT安全演變的下一個(gè)重大原因,大多數(shù)企業(yè)將尋找方法來(lái)看到、控制和保護(hù)他們的用戶(hù)及其數(shù)據(jù),因?yàn)锳I將嵌入到每個(gè)過(guò)程中。