防堵「提示注入」竊取機密,OpenAI為ChatGPT推出最高層級「Lockdown Mode」安全模式

文章重點整理:

近年來,隨着AI聊天機器人越來越聰明且具備連網搜尋與代理能力,一種專門針對AI系統的「提示注入」 (Prompt Injection)攻擊也隨之氾濫。爲了防堵這類潛在的資安威脅,OpenAI稍早宣佈推出一項名爲「Lockdown Mode」 (鎖定模式)的全新進階安全設定。這項功能主要針對處理高度敏感資料的企業機構與特定使用者設計,透過阻斷特定的網路請求與代理功能,建立防止機密資料外泄的最後一道防線。

什麼是「提示注入」?Lockdown Mode如何防禦?

「提示注入」是一種專門針對對話式AI的社交工程攻擊手法,隨着AI系統越來越擅長從網路上擷取資訊,惡意人士開始將「惡意指令」隱藏在網頁或文件中。當使用者的ChatGPT去讀取這些網頁時,AI可能會被這些隱藏指令「催眠」或欺騙,進而在未經使用者同意的情況下,將帳號內的敏感對話資料傳送至攻擊者的伺服器。

OpenAI解釋,Lockdown Mode並不能阻止這些惡意提示出現在ChatGPT處理的內容中,但它的核心作用是防止資料外泄。它會嚴格限制系統的網路請求權限,讓攻擊者即便成功欺騙AI,也無法將你的敏感資料偷偷傳送出去。

啓動後將大幅限制連網與AI代理功能

爲了達到絕對的安全,開啓Lockdown Mode勢必得犧牲ChatGPT的部分便利性與強大功能:

• 禁用代理與深度研究:近期大熱的「Agent Mode」 (代理模式),以及「Deep Research」 (深度研究)功能將會被完全強制停用。

• 限制網路多媒體擷取:使用者雖然仍可手動上傳照片或使用圖像生成功能,但ChatGPT將無法從網路上擷取圖片,也不會在回覆中顯示任何網路圖片。

• 禁止自動下載檔案:聊天機器人將無法主動從網路下載檔案進行分析,但使用者依然可以透過手動上傳文件的方式讓AI判讀。

OpenAI補充說明,Lockdown Mode不會影響ChatGPT的記憶功能、手動檔案上傳、對話分享機制,也不會改變是否允許使用對話訓練模型的隱私設定 (這些可由企業管理員另行配置)。

所有帳號皆可免費啓用,同步推出「連線工作階段管理」

目前,Lockdown Mode已向所有個人帳號開放,甚至包含免費版 (Free tier)的ChatGPT使用者。使用者可進入「設定」→「安全與安全性」→「進階安全」中找到切換開關。若在特定對話中需要臨時解除限制,亦可在對話視窗上方的狀態訊息中點選「針對此對話關閉」。

此外,OpenAI今回也同步釋出全新的「活動連線管理員」 (Active session manager)。使用者現在可以清楚看到有哪些裝置或瀏覽器正登入自己的帳號,並且支援單獨或「一鍵登出所有裝置」。而官方提醒,若選擇一次登出所有裝置,最多可能需要 30 分鐘才能完全生效。

分析觀點:如同蘋果的「封閉模式」,AI發展進入深水區的資安妥協

OpenAI這次推出的「Lockdown Mode」,在命名與核心邏輯上,非常容易讓人聯想到蘋果爲iPhone與Mac推出的同名安全機制——爲了防止國家級駭客的零點擊攻擊,寧可大幅閹割手機的上網與訊息預覽功能。

這個舉動背後透露出一個重要的產業訊號:AI已經正式從「聊天的玩具」變成「處理企業機密與個人隱私的核心大腦」。

尤其當OpenAI、微軟或Google都在大力推動代理AI (Agentic AI)——讓AI主動幫你上網查資料、訂機票、讀取信件時,AI被「提示注入」惡意劫持的風險正呈指數級上升。如果你讓AI幫你總結一份包含隱藏惡意程式碼的網頁,它可能在背景就把你的公司財報傳給了駭客。OpenAI推出Lockdown Mode雖然看似開倒車 (關閉最新銳的Agent與Deep Research功能),但這卻是向企業客戶保證「你的機密絕對不會流出」的必要資安承諾。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

Q1:Lockdown Mode主要是爲了防範什麼樣的攻擊?

Lockdown Mode主要防範的是提示注入攻擊。這類攻擊會把惡意指令藏在網頁或文件中,誘使ChatGPT在不知情下執行,進而嘗試外傳使用者的敏感資料。

Q2:啓用Lockdown Mode後,ChatGPT會有哪些功能被限制?

啓用後,Agent Mode與Deep Research會被強制停用,ChatGPT也無法自動抓取網路圖片或下載檔案。不過手動上傳照片、文件與記憶功能仍可使用。

Q3:哪些使用者可以開啓Lockdown Mode,還有新增什麼管理工具?

Lockdown Mode已向所有個人帳號開放,包含免費版使用者。OpenAI也同步推出活動連線管理員,可查看登入裝置,並支援單獨登出或一鍵登出所有裝置。