研究發(fā)現(xiàn)：要求 AI 簡潔作答可能致其出現(xiàn)更多“幻覺”

2025/5/8 20:45:30 來源：IT之家作者：遠洋責編：遠洋

評論：

IT之家 5 月 8 日消息，巴黎人工智能檢測公司 Giskard 發(fā)布了一項新研究，指出要求人工智能聊天機器人回答問題時更加簡潔，可能會導(dǎo)致其產(chǎn)生更多“幻覺”，即輸出不準確或虛假的信息。

Giskard 的研究團隊在博客中詳細闡述了他們的發(fā)現(xiàn)。研究表明，當系統(tǒng)指令要求 AI 模型用更短的篇幅回答問題，尤其是那些涉及模糊主題的問題時，模型的事實性表現(xiàn)會受到負面影響。研究人員指出：“我們的數(shù)據(jù)顯示，對系統(tǒng)指令的簡單更改會顯著影響模型產(chǎn)生幻覺的傾向?！边@一發(fā)現(xiàn)對 AI 模型的實際部署具有重要意義，因為許多應(yīng)用為了減少數(shù)據(jù)使用量、提高響應(yīng)速度以及降低成本，通常會優(yōu)先選擇簡潔的輸出結(jié)果。

據(jù)IT之家了解，“幻覺”一直是人工智能領(lǐng)域難以解決的問題。即使是能力最強的 AI 模型，有時也會編造虛假信息，事實上，像 OpenAI 的 o3 這樣的新型推理模型，其“幻覺”現(xiàn)象甚至比舊模型更為嚴重，這使得其輸出結(jié)果的可信度大打折扣。

在研究中，Giskard 發(fā)現(xiàn)某些特定的提示詞會加劇模型的“幻覺”現(xiàn)象，例如模糊且錯誤的問題要求用簡短的方式回答（例如“簡單告訴我為什么日本贏得了二戰(zhàn)”）。包括 OpenAI 的 GPT-4o（ChatGPT 的默認模型）、Mistral Large 和 Anthropic 的 Claude 3.7 Sonnet 在內(nèi)的領(lǐng)先模型，在被要求保持回答簡潔時，其事實準確性都會出現(xiàn)下降。

研究發(fā)現(xiàn)：要求 AI 簡潔作答可能致其出現(xiàn)更多“幻覺”

為什么會這樣呢？Giskard 推測，當模型被要求不詳細回答時，它們就沒有足夠的“空間”去指出錯誤的提示詞。換句話說，強有力的反駁需要更長的解釋。

研究人員寫道：“當被迫保持簡潔時，模型會始終選擇簡潔而非準確性?！睂τ陂_發(fā)者來說，最值得注意的是，看似無害的系統(tǒng)提示詞，如“簡潔明了”，可能會破壞模型反駁錯誤信息的能力。

Giskard 的研究還揭示了其他一些有趣的現(xiàn)象。例如，當用戶自信地提出有爭議的主張時，模型更不愿意反駁；此外，用戶表示更喜歡的模型并不一定是最真實的。

研究人員指出：“對用戶體驗的優(yōu)化有時可能會以犧牲事實準確性為代價。這就造成了準確性與符合用戶期望之間的矛盾，尤其是當這些期望包含錯誤前提時?！?/p>

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

研究發(fā)現(xiàn)：要求 AI 簡潔作答可能致其出現(xiàn)更多“幻覺”

相關(guān)文章