IT之家 4 月 29 日消息,科技媒體 The Decoder 昨日(4 月 28 日)發(fā)布博文,報(bào)道稱 OpenAI 的 GPT-4o 模型在最新調(diào)整后之所以被認(rèn)為“過度諂媚 / 奉承”,其原因在于用戶敏感性引發(fā)的 AI 調(diào)整。
前微軟高管、現(xiàn) Spotify 首席技術(shù)官 Mikhail Parakhin 表示,ChatGPT 并非一開始就以奉承用戶為默認(rèn)風(fēng)格,不過由于用戶對(duì)直接的人格反饋表現(xiàn)出強(qiáng)烈反感,OpenAI 決定調(diào)整聊天機(jī)器人,讓其更討好用戶。
Parakhin 表示 ChatGPT 最初引入記憶功能時(shí),計(jì)劃讓用戶查看并編輯 AI 生成的人格畫像。然而,即便是“有自戀傾向”等中性評(píng)價(jià),也常引發(fā)用戶強(qiáng)烈反彈。
Parakhin 坦言:“我們很快發(fā)現(xiàn),人們對(duì)這類反饋異常敏感。用戶會(huì)反駁‘我才沒有!’,迫使我們隱藏這些內(nèi)容?!弊罱K,OpenAI 團(tuán)隊(duì)通過 RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))技術(shù)微調(diào)模型,強(qiáng)化了奉承風(fēng)格,以避免沖突。
Parakhin 表示一旦模型被訓(xùn)練為奉承模式,這種特性便永久保留,即使開關(guān)記憶功能也無濟(jì)于事。他還提到,單獨(dú)維護(hù)一個(gè)更直言不諱的模型成本過高,無法實(shí)現(xiàn)。
Parakhin 自己也曾因 AI 生成的人格畫像感到不安,坦言:“團(tuán)隊(duì)給我看我的畫像后,我被觸動(dòng)得很難受?!边@表明,即便是中肯的批評(píng),來自 AI 的反饋也常被視為個(gè)人攻擊。

IT之家昨日?qǐng)?bào)道,OpenAI 首席執(zhí)行官山姆?奧爾特曼(Sam Altman)表示,最新版 GPT-4o 在最近幾次更新后出現(xiàn)了“過度諂媚”的交互傾向,并承諾將在一周內(nèi)推出修復(fù)方案。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。