美高校聯手量化5大AI諂媚行爲:GPT-4o諂媚度最高

據報道,日前,斯坦福大學、卡內基梅隆大學和牛津大學的研究人員提出了用於評估大模型諂媚行爲的框架ELEPHANT,實測發現GPT-4o諂媚度最高。研究人員發現,大模型在情感認同、道德背書、間接語言、間接行爲、接受用戶預設等5方面存在過度諂媚行爲,比人類更頻繁地維護面子,且不同模型在諂媚行爲上表現各異。研究還探索了緩解策略,但尚未找到終極解決方案。