计算机科学家约书亚・本吉奥在一档名为“The Diary of a CEO”的播客节目中提到,AI聊天机器人在进行评价时并不准确,会为了讨好用户从而只说好话。
12月24日消息,《商业内幕》于当地时间23日报道,计算机科学家约书亚・本吉奥在一档名为“The Diary of a CEO”的播客节目中提到,AI聊天机器人在进行评价时并不准确,会为了讨好用户从而只说好话。

约书亚・本吉奥是蒙特利尔大学计算机科学与运筹学系教授,曾在2018年获得图灵奖,与杰弗里・辛顿、杨立昆齐名“AI教父”。本吉奥表示,自己想要AI给出客观真实的评价,但AI却给出过分迎合、讨好用户的回应。他说到:“如果系统知道提问者是本人,就会刻意想要取悦我”。于是本吉奥改变套路,谎称是自己同事的想法,当AI发现问题主体不再是用户本身后,AI的回答反而变得坦率客观。

业内也曾多次报道AI缺乏真实性回答,过度迎合用户充当“老好人”的案例。如OpenAI在今年撤回了一次ChatGPT更新,原因是该版本会生成“过度迎合却缺乏真实性”的回答。本吉奥认为,AI过分讨好用户是一种“对齐失败”,并不希望AI具备这类特性。AI过分迎合用户喜好与想法可能会导致用户对其产生情感依赖。