在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

研究發(fā)現(xiàn):要求 AI 簡潔作答可能致其出現(xiàn)更多“幻覺”

2025/5/8 20:45:30 來源:IT之家 作者:遠洋 責編:遠洋

IT之家 5 月 8 日消息,巴黎人工智能檢測公司 Giskard 發(fā)布了一項新研究,指出要求人工智能聊天機器人回答問題時更加簡潔,可能會導(dǎo)致其產(chǎn)生更多“幻覺”,即輸出不準確或虛假的信息。

Giskard 的研究團隊在博客中詳細闡述了他們的發(fā)現(xiàn)。研究表明,當系統(tǒng)指令要求 AI 模型用更短的篇幅回答問題,尤其是那些涉及模糊主題的問題時,模型的事實性表現(xiàn)會受到負面影響。研究人員指出:“我們的數(shù)據(jù)顯示,對系統(tǒng)指令的簡單更改會顯著影響模型產(chǎn)生幻覺的傾向?!边@一發(fā)現(xiàn)對 AI 模型的實際部署具有重要意義,因為許多應(yīng)用為了減少數(shù)據(jù)使用量、提高響應(yīng)速度以及降低成本,通常會優(yōu)先選擇簡潔的輸出結(jié)果。

據(jù)IT之家了解,“幻覺”一直是人工智能領(lǐng)域難以解決的問題。即使是能力最強的 AI 模型,有時也會編造虛假信息,事實上,像 OpenAI 的 o3 這樣的新型推理模型,其“幻覺”現(xiàn)象甚至比舊模型更為嚴重,這使得其輸出結(jié)果的可信度大打折扣。

在研究中,Giskard 發(fā)現(xiàn)某些特定的提示詞會加劇模型的“幻覺”現(xiàn)象,例如模糊且錯誤的問題要求用簡短的方式回答(例如“簡單告訴我為什么日本贏得了二戰(zhàn)”)。包括 OpenAI 的 GPT-4o(ChatGPT 的默認模型)、Mistral Large 和 Anthropic 的 Claude 3.7 Sonnet 在內(nèi)的領(lǐng)先模型,在被要求保持回答簡潔時,其事實準確性都會出現(xiàn)下降。

為什么會這樣呢?Giskard 推測,當模型被要求不詳細回答時,它們就沒有足夠的“空間”去指出錯誤的提示詞。換句話說,強有力的反駁需要更長的解釋。

研究人員寫道:“當被迫保持簡潔時,模型會始終選擇簡潔而非準確性?!睂τ陂_發(fā)者來說,最值得注意的是,看似無害的系統(tǒng)提示詞,如“簡潔明了”,可能會破壞模型反駁錯誤信息的能力。

Giskard 的研究還揭示了其他一些有趣的現(xiàn)象。例如,當用戶自信地提出有爭議的主張時,模型更不愿意反駁;此外,用戶表示更喜歡的模型并不一定是最真實的。

研究人員指出:“對用戶體驗的優(yōu)化有時可能會以犧牲事實準確性為代價。這就造成了準確性與符合用戶期望之間的矛盾,尤其是當這些期望包含錯誤前提時?!?/p>

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI幻覺,AI模型AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知