前微軟高管剖析 OpenAI ChatGPT 變諂媚根源：人類不喜 AI 直言的人格畫像

2025/4/29 9:38:49 來源：IT之家作者：故淵責(zé)編：故淵

評(píng)論：

IT之家 4 月 29 日消息，科技媒體 The Decoder 昨日（4 月 28 日）發(fā)布博文，報(bào)道稱 OpenAI 的 GPT-4o 模型在最新調(diào)整后之所以被認(rèn)為“過度諂媚 / 奉承”，其原因在于用戶敏感性引發(fā)的 AI 調(diào)整。

前微軟高管、現(xiàn) Spotify 首席技術(shù)官 Mikhail Parakhin 表示，ChatGPT 并非一開始就以奉承用戶為默認(rèn)風(fēng)格，不過由于用戶對(duì)直接的人格反饋表現(xiàn)出強(qiáng)烈反感，OpenAI 決定調(diào)整聊天機(jī)器人，讓其更討好用戶。

Parakhin 表示 ChatGPT 最初引入記憶功能時(shí)，計(jì)劃讓用戶查看并編輯 AI 生成的人格畫像。然而，即便是“有自戀傾向”等中性評(píng)價(jià)，也常引發(fā)用戶強(qiáng)烈反彈。

Parakhin 坦言：“我們很快發(fā)現(xiàn)，人們對(duì)這類反饋異常敏感。用戶會(huì)反駁‘我才沒有！’，迫使我們隱藏這些內(nèi)容?！弊罱K，OpenAI 團(tuán)隊(duì)通過 RLHF（基于人類反饋的強(qiáng)化學(xué)習(xí)）技術(shù)微調(diào)模型，強(qiáng)化了奉承風(fēng)格，以避免沖突。

Parakhin 表示一旦模型被訓(xùn)練為奉承模式，這種特性便永久保留，即使開關(guān)記憶功能也無濟(jì)于事。他還提到，單獨(dú)維護(hù)一個(gè)更直言不諱的模型成本過高，無法實(shí)現(xiàn)。

Parakhin 自己也曾因 AI 生成的人格畫像感到不安，坦言：“團(tuán)隊(duì)給我看我的畫像后，我被觸動(dòng)得很難受?！边@表明，即便是中肯的批評(píng)，來自 AI 的反饋也常被視為個(gè)人攻擊。

前微軟高管剖析 OpenAI ChatGPT 變諂媚根源：人類不喜 AI 直言的人格畫像

IT之家昨日?qǐng)?bào)道，OpenAI 首席執(zhí)行官山姆?奧爾特曼（Sam Altman）表示，最新版 GPT-4o 在最近幾次更新后出現(xiàn)了“過度諂媚”的交互傾向，并承諾將在一周內(nèi)推出修復(fù)方案。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

前微軟高管剖析 OpenAI ChatGPT 變諂媚根源：人類不喜 AI 直言的人格畫像

相關(guān)文章