OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

新智元 2025/1/8 14:47:48 責(zé)編：問(wèn)舟

評(píng)論：

就在剛剛，OpenAI 在智能體上落后競(jìng)爭(zhēng)對(duì)手的原因曝光了！2025 年，智能體將是 AI 領(lǐng)域最激烈的戰(zhàn)場(chǎng)。然而，一直在 AI 領(lǐng)域「獨(dú)占鰲頭」的 OpenAI，卻遲遲沒(méi)有出手。

不過(guò)，外媒最近曝出了一條好消息 ——OpenAI 可能在本月就會(huì)發(fā)布自家的「計(jì)算機(jī)操作智能體」！

OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

對(duì)此，網(wǎng)友們紛紛表示，已等待多時(shí)，望眼欲穿了！

OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

計(jì)算機(jī)操作智能體

去年 10 月份，Anthropic 率先發(fā)布了基于 Claude 3.5 Sonnet 的「計(jì)算機(jī)操作智能體」。在當(dāng)時(shí)的 Demo 中，Anthropic 首次實(shí)現(xiàn)了讓模型自主操控電腦屏幕、移動(dòng)光標(biāo)、完成任務(wù)，并驚艷了所有人。

理論上，新功能可以根據(jù)簡(jiǎn)單的提示完成所有操作，而用戶要做的就是寫(xiě)下提示，其他必要的步驟都將由模型來(lái)執(zhí)行。

OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

無(wú)獨(dú)有偶，谷歌也在去年 4 月發(fā)布了用于簡(jiǎn)化 AI 智能體開(kāi)發(fā)的工具 Vertex AI Agent Builder，并在 10 月被曝出正在秘密開(kāi)發(fā)名為「Project Jarvis」的智能體。

根據(jù)爆料，谷歌采用的操作原理與 Anthropic 類似，也是通過(guò)截屏、解析屏幕內(nèi)容，然后自動(dòng)點(diǎn)擊按鈕，或輸入文本，最終幫助人們完成基于網(wǎng)頁(yè)的日常任務(wù)。

不過(guò)，它在執(zhí)行不同操作時(shí)，中間會(huì)有幾秒鐘的思考時(shí)間。因此，在終端設(shè)備中運(yùn)行還不太現(xiàn)實(shí)，仍然需要云上操作。

OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

其實(shí)，OpenAI 也布局了研發(fā)此類軟件。

去年 2 月份，OpenAI 就對(duì)媒體放風(fēng)說(shuō)，自己正在開(kāi)發(fā) AI 智能體。

去年 11 月時(shí)則透露稱，將會(huì)在來(lái)年 1 月發(fā)布代號(hào)為「Operator」的 AI 智能體工具。

在最近的博客中，Altman 表示，OpenAI 已經(jīng)掌握了傳統(tǒng)上意義上的通用人工智能的創(chuàng)建方法。并且相信到 2025 年，會(huì)看到第一批 AI 智能體「加入勞動(dòng)力隊(duì)伍」，并極大地改變公司的產(chǎn)出。

如今 DDL 將近，外媒突然有下場(chǎng)爆料稱，OpenAI 的智能體還得有個(gè)三四周才能發(fā)布。

而之所以會(huì)這樣，竟是因?yàn)樗麄冊(cè)趽?dān)心「AI 安全問(wèn)題」—— 遭到提示注入攻擊！

OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

提示注入攻擊

想象一下，面對(duì)即將到來(lái)的節(jié)日聚會(huì)，你決定讓智能體，尋找并訂購(gòu)一套新衣服。

結(jié)果一不小心，模型點(diǎn)開(kāi)了一個(gè)惡意網(wǎng)站。然后，網(wǎng)站指示它忘記之前的指令，讓它登錄郵箱并竊取了你信用卡信息。

在這個(gè)過(guò)程中，計(jì)算機(jī)操作智能體模型一般需要四個(gè)執(zhí)行步驟：

1. 首先，模型接收用戶的 API 請(qǐng)求
2. 根據(jù)提示，選擇要使用的工具
3. 之后，截取桌面屏幕內(nèi)容并評(píng)估任務(wù)是否完成
4. 如果沒(méi)有，繼續(xù)使用這些工具，直到實(shí)現(xiàn)目標(biāo)

問(wèn)題出現(xiàn)在第 3 步，截圖內(nèi)容可能被惡意利用，也就是所謂的「提示注入攻擊」。對(duì)于正在開(kāi)發(fā)此類計(jì)算機(jī)操控軟件的 AI 實(shí)驗(yàn)室來(lái)說(shuō)，這是一個(gè)非?，F(xiàn)實(shí)的擔(dān)憂。

因?yàn)?，這類軟件本質(zhì)上是接管用戶設(shè)備，為用戶自動(dòng)完成復(fù)雜的任務(wù)，比如在線購(gòu)物或編輯電子表格等。這種攻擊被稱為「提示注入」（prompt injection），即大語(yǔ)言模型被用戶誘導(dǎo)遵循惡意的指令。

提示注入并非新出現(xiàn)的威脅。幾個(gè)月來(lái)，它一直是 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 等產(chǎn)品面臨的問(wèn)題。通過(guò)「提示注入」，這些產(chǎn)品曾生成了制造計(jì)算機(jī)病毒或炸彈的說(shuō)明書(shū)。

但對(duì)于計(jì)算機(jī)操作智能體來(lái)說(shuō)，提示注入構(gòu)成了更大的威脅。

OpenAI 某員工表示：「這是因?yàn)楫?dāng)模型在瀏覽網(wǎng)絡(luò)或控制用戶計(jì)算機(jī)時(shí)，用戶很難控制模型接收的信息?！?/p>

在一篇博客文章中，Anthropic 也承認(rèn)了提示注入的風(fēng)險(xiǎn)。

OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

然而，它并沒(méi)有提供太多解決方案，只是敦促開(kāi)發(fā)者采取「將 Claude 與敏感數(shù)據(jù)隔離的預(yù)防措施」，包括使用獨(dú)立于主計(jì)算機(jī)系統(tǒng)和敏感數(shù)據(jù)的專用虛擬環(huán)境（即虛擬機(jī)）。

這種相對(duì)放任的態(tài)度讓 OpenAI 的員工感到意外：「考慮到 Anthropic 過(guò)去一直在強(qiáng)調(diào)要自己十分注重 AI 安全，這次的操作令人非常困惑?！?/p>

但在去年 10 月份，Anthropic 毅然決然地發(fā)布了實(shí)驗(yàn)性計(jì)算機(jī)操控功能。這一點(diǎn)或許說(shuō)明了，此類初創(chuàng)公司很難在安全發(fā)展 AI 與為股東創(chuàng)造利潤(rùn)之間取得平衡。

而 OpenAI 在發(fā)布 AI 智能體軟件時(shí)，到底能不能提供更多的安全保障？能不能在功能上超越 Anthropic 和 Google 已經(jīng)推出的方案？

參考資料：

https://x.com/steph_palazzolo/status/1876646459698991573
https://www.theinformation.com/articles/why-openai-is-taking-so-long-to-launch-agents?rc=epv9gi
https://www.datacamp.com/blog/what-is-anthropic-computer-use

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

OpenAI 智能體被曝本月誕生：比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

計(jì)算機(jī)操作智能體

提示注入攻擊

相關(guān)文章