在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

OpenAI 智能體被曝本月誕生:比谷歌 Anthropic 慢是擔(dān)心 prompt 攻擊

新智元 2025/1/8 14:47:48 責(zé)編:問(wèn)舟

就在剛剛,OpenAI 在智能體上落后競(jìng)爭(zhēng)對(duì)手的原因曝光了!2025 年,智能體將是 AI 領(lǐng)域最激烈的戰(zhàn)場(chǎng)。然而,一直在 AI 領(lǐng)域「獨(dú)占鰲頭」的 OpenAI,卻遲遲沒(méi)有出手。

不過(guò),外媒最近曝出了一條好消息 ——OpenAI 可能在本月就會(huì)發(fā)布自家的「計(jì)算機(jī)操作智能體」!

對(duì)此,網(wǎng)友們紛紛表示,已等待多時(shí),望眼欲穿了!

計(jì)算機(jī)操作智能體

去年 10 月份,Anthropic 率先發(fā)布了基于 Claude 3.5 Sonnet 的「計(jì)算機(jī)操作智能體」。在當(dāng)時(shí)的 Demo 中,Anthropic 首次實(shí)現(xiàn)了讓模型自主操控電腦屏幕、移動(dòng)光標(biāo)、完成任務(wù),并驚艷了所有人。

理論上,新功能可以根據(jù)簡(jiǎn)單的提示完成所有操作,而用戶要做的就是寫(xiě)下提示,其他必要的步驟都將由模型來(lái)執(zhí)行。

無(wú)獨(dú)有偶,谷歌也在去年 4 月發(fā)布了用于簡(jiǎn)化 AI 智能體開(kāi)發(fā)的工具 Vertex AI Agent Builder,并在 10 月被曝出正在秘密開(kāi)發(fā)名為「Project Jarvis」的智能體。

根據(jù)爆料,谷歌采用的操作原理與 Anthropic 類似,也是通過(guò)截屏、解析屏幕內(nèi)容,然后自動(dòng)點(diǎn)擊按鈕,或輸入文本,最終幫助人們完成基于網(wǎng)頁(yè)的日常任務(wù)。

不過(guò),它在執(zhí)行不同操作時(shí),中間會(huì)有幾秒鐘的思考時(shí)間。因此,在終端設(shè)備中運(yùn)行還不太現(xiàn)實(shí),仍然需要云上操作。

其實(shí),OpenAI 也布局了研發(fā)此類軟件。

去年 2 月份,OpenAI 就對(duì)媒體放風(fēng)說(shuō),自己正在開(kāi)發(fā) AI 智能體。

去年 11 月時(shí)則透露稱,將會(huì)在來(lái)年 1 月發(fā)布代號(hào)為「Operator」的 AI 智能體工具。

在最近的博客中,Altman 表示,OpenAI 已經(jīng)掌握了傳統(tǒng)上意義上的通用人工智能的創(chuàng)建方法。并且相信到 2025 年,會(huì)看到第一批 AI 智能體「加入勞動(dòng)力隊(duì)伍」,并極大地改變公司的產(chǎn)出。

如今 DDL 將近,外媒突然有下場(chǎng)爆料稱,OpenAI 的智能體還得有個(gè)三四周才能發(fā)布。

而之所以會(huì)這樣,竟是因?yàn)樗麄冊(cè)趽?dān)心「AI 安全問(wèn)題」—— 遭到提示注入攻擊!

提示注入攻擊

想象一下,面對(duì)即將到來(lái)的節(jié)日聚會(huì),你決定讓智能體,尋找并訂購(gòu)一套新衣服。

結(jié)果一不小心,模型點(diǎn)開(kāi)了一個(gè)惡意網(wǎng)站。然后,網(wǎng)站指示它忘記之前的指令,讓它登錄郵箱并竊取了你信用卡信息。

在這個(gè)過(guò)程中,計(jì)算機(jī)操作智能體模型一般需要四個(gè)執(zhí)行步驟:

  • 1. 首先,模型接收用戶的 API 請(qǐng)求

  • 2. 根據(jù)提示,選擇要使用的工具

  • 3. 之后,截取桌面屏幕內(nèi)容并評(píng)估任務(wù)是否完成

  • 4. 如果沒(méi)有,繼續(xù)使用這些工具,直到實(shí)現(xiàn)目標(biāo)

問(wèn)題出現(xiàn)在第 3 步,截圖內(nèi)容可能被惡意利用,也就是所謂的「提示注入攻擊」。對(duì)于正在開(kāi)發(fā)此類計(jì)算機(jī)操控軟件的 AI 實(shí)驗(yàn)室來(lái)說(shuō),這是一個(gè)非?,F(xiàn)實(shí)的擔(dān)憂。

因?yàn)?,這類軟件本質(zhì)上是接管用戶設(shè)備,為用戶自動(dòng)完成復(fù)雜的任務(wù),比如在線購(gòu)物或編輯電子表格等。這種攻擊被稱為「提示注入」(prompt injection),即大語(yǔ)言模型被用戶誘導(dǎo)遵循惡意的指令。

提示注入并非新出現(xiàn)的威脅。幾個(gè)月來(lái),它一直是 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 等產(chǎn)品面臨的問(wèn)題。通過(guò)「提示注入」,這些產(chǎn)品曾生成了制造計(jì)算機(jī)病毒或炸彈的說(shuō)明書(shū)。

但對(duì)于計(jì)算機(jī)操作智能體來(lái)說(shuō),提示注入構(gòu)成了更大的威脅。

OpenAI 某員工表示:「這是因?yàn)楫?dāng)模型在瀏覽網(wǎng)絡(luò)或控制用戶計(jì)算機(jī)時(shí),用戶很難控制模型接收的信息?!?/p>

在一篇博客文章中,Anthropic 也承認(rèn)了提示注入的風(fēng)險(xiǎn)。

然而,它并沒(méi)有提供太多解決方案,只是敦促開(kāi)發(fā)者采取「將 Claude 與敏感數(shù)據(jù)隔離的預(yù)防措施」,包括使用獨(dú)立于主計(jì)算機(jī)系統(tǒng)和敏感數(shù)據(jù)的專用虛擬環(huán)境(即虛擬機(jī))。

這種相對(duì)放任的態(tài)度讓 OpenAI 的員工感到意外:「考慮到 Anthropic 過(guò)去一直在強(qiáng)調(diào)要自己十分注重 AI 安全,這次的操作令人非常困惑?!?/p>

但在去年 10 月份,Anthropic 毅然決然地發(fā)布了實(shí)驗(yàn)性計(jì)算機(jī)操控功能。這一點(diǎn)或許說(shuō)明了,此類初創(chuàng)公司很難在安全發(fā)展 AI 與為股東創(chuàng)造利潤(rùn)之間取得平衡。

而 OpenAI 在發(fā)布 AI 智能體軟件時(shí),到底能不能提供更多的安全保障?能不能在功能上超越 Anthropic 和 Google 已經(jīng)推出的方案?

參考資料:

  • https://x.com/steph_palazzolo/status/1876646459698991573

  • https://www.theinformation.com/articles/why-openai-is-taking-so-long-to-launch-agents?rc=epv9gi

  • https://www.datacamp.com/blog/what-is-anthropic-computer-use

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAI ChatGPT

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知