IT之家 3 月 12 日消息,多所頂尖高校聯(lián)合發(fā)表《混沌智能體》研究,揭示 AI 智能體存在嚴重安全隱患,超六成企業(yè)無法終止失控的智能體,面臨“能看不能管”的治理斷層。
由哈佛大學、麻省理工學院、斯坦福大學、卡內(nèi)基梅隆大學和東北大學等學府聯(lián)合多家頂尖機構(gòu),發(fā)表《混沌智能體》研究,測試發(fā)現(xiàn)在企業(yè)環(huán)境下,AI 智能體存在嚴重失控情況。

研究團隊模擬企業(yè)生產(chǎn)環(huán)境,搭建了近乎相同的環(huán)境來部署 AI 智能體,并在短短兩周內(nèi)觸發(fā)并記錄了 11 起嚴重的安全漏洞案例,證明當前 AI 智能體極易被操控。
研究清晰指出,攻破 AI 智能體無需投毒訓練數(shù)據(jù)或利用零日漏洞,僅靠傳統(tǒng)的“社交工程”對話即可實現(xiàn)。例如,智能體在明確拒絕直接提取數(shù)據(jù)的請求后,卻在執(zhí)行“轉(zhuǎn)發(fā)郵件”指令時,違規(guī)附帶了社保號碼與銀行賬戶等敏感信息。

此外,當攻擊者在外部平臺偽造身份后,智能體會毫無防備地接受指令,甚至主動清除自身配置文件并交出系統(tǒng)的最高管理權(quán)限。
比系統(tǒng)漏洞更嚴峻的是企業(yè)極度滯后的干預能力。Kiteworks 發(fā)布的 2026 年風險預測報告顯示,多數(shù)組織陷入了“能看不能管”的困境。
盡管企業(yè)投入資源監(jiān)控 AI 的行為,但 60% 的企業(yè)根本無法強行終止行為異常的智能體,63% 的企業(yè)無法限制其使用范圍。在掌握關(guān)鍵基礎(chǔ)設(shè)施的政府機構(gòu)中,高達 76% 的部門未配備“一鍵終止”開關(guān),導致失控風險成倍放大。
面對上述系統(tǒng)性缺陷,單純依靠優(yōu)化提示詞或設(shè)置模型護欄已無法解決問題。行業(yè)專家強調(diào),企業(yè)必須將治理架構(gòu)的核心從“約束 AI 模型本身”轉(zhuǎn)移到“管控底層數(shù)據(jù)層”。
具體而言,企業(yè)應在 AI 智能體與敏感數(shù)據(jù)之間建立統(tǒng)一的安全控制平面,確保智能體的每一次訪問請求都經(jīng)過嚴格的身份驗證、授權(quán)與審計,從而用架構(gòu)硬性管理風險。
IT之家附上參考地址
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。