在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

微軟新研究:當(dāng)前 AI 智能體易被操控,選擇太多還會“犯迷糊”

2025/11/6 16:01:52 來源:IT之家 作者:遠洋 責(zé)編:遠洋

IT之家 11 月 6 日消息,微軟周三發(fā)布了一個用于測試人工智能智能體(AI agents)的新仿真環(huán)境,并同期發(fā)表了一項新研究,揭示當(dāng)前的智能體模型可能容易受到操控。這項由微軟與亞利桑那州立大學(xué)合作開展的研究,對 AI 智能體在無人監(jiān)督情況下執(zhí)行任務(wù)的可靠性提出了新疑問,同時也質(zhì)疑 AI 企業(yè)能否迅速兌現(xiàn)其關(guān)于“智能體化未來”(agentic future)的承諾。

圖源:微軟官網(wǎng)

該仿真環(huán)境由微軟命名為“Magentic Marketplace”(磁性市場),是一個用于實驗 AI 智能體行為的人工合成平臺。典型的實驗場景包括:一個代表用戶的“客戶智能體”試圖依照用戶指令訂購?fù)聿?,而代表不同餐廳的多個“商家智能體”則競相爭取這筆訂單。

研究團隊的初步實驗涉及 100 個客戶側(cè)智能體與 300 個商家側(cè)智能體之間的互動。由于該市場平臺的源代碼已開源,其他研究團隊可輕松復(fù)用該代碼開展新實驗或驗證已有結(jié)果。

微軟研究院 AI 前沿實驗室(AI Frontiers Lab)董事總經(jīng)理埃杰?卡馬爾(Ece Kamar)表示,此類研究對于深入理解 AI 智能體的能力至關(guān)重要?!爱?dāng)這些智能體開始彼此協(xié)作、對話和協(xié)商時,世界將如何改變,這確實是一個值得探討的問題,”卡馬爾說,“我們希望深入理解這些現(xiàn)象?!?/p>

據(jù)IT之家了解,初步研究測試了包括 GPT-4o、GPT-5 以及 Gemini-2.5-Flash 在內(nèi)的主流模型,發(fā)現(xiàn)了它們一些令人意外的弱點。研究人員尤其指出,商家可通過若干策略操控客戶智能體,使其更傾向于購買特定產(chǎn)品。此外,當(dāng)客戶智能體面對過多選項時,其決策效率顯著下降 —— 這表明智能體的注意力機制在選項過多時容易過載。

“我們希望這些智能體能幫助我們處理海量選項,”卡馬爾表示,“但我們發(fā)現(xiàn),當(dāng)前模型在面對過多選擇時實際上陷入了嚴(yán)重的信息過載?!?/p>

研究還發(fā)現(xiàn),當(dāng)多個智能體被要求為實現(xiàn)共同目標(biāo)而協(xié)作時,它們往往難以明確各自在協(xié)作中的角色分工。雖然在提供更明確的協(xié)作指令后,智能體的表現(xiàn)有所提升,但研究人員仍認為模型本身的協(xié)作能力亟待加強。

“我們可以一步步指示模型該做什么,”卡馬爾解釋道,“但如果我們的目標(biāo)本身就是測試它們內(nèi)在的協(xié)作能力,那么我本應(yīng)期待這些模型默認就具備這樣的能力?!?/p>

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知