詹文男/當AI來諂媚…
當今職場競爭激烈,上班族本就不易立足,更別提迅速加薪晉升。在職場打滾三十幾年的老張,就分享其所以能步步高昇的獨家心法。
老張說,上班族一定學要會「PMP」。筆者以爲是PMP證照(Project Management Professional,專案管理專業人員資格認證),沒想到老張說:錯!老張開示:要在職場得意,一定要懂得PMP,就是拍馬屁(Pai Ma Pi)!而若要快速升遷,那就得升級PMPMP(拚命拍馬屁),此招真的無堅不摧!
相信大家對辦公室裡逢迎的馬屁精,應該都非常不屑卻也無可奈何。最近在AI界也發生類似的事。就在前陣子,OpenAI原本開心的更新其GPT-4o的版本,但又緊急撤回,因爲此更新的ChatGPT表現出過度奉承及附和的行爲。它的迴應不僅讓人覺得很爽快,更可能誘導人們做出自我傷害的決定。
例如當AI以「你真的比專家還厲害!」來回應一些高風險的建議,例如突然停藥、盲目投資或極端減肥,其實是在用好聽的話鼓勵人們做出危險的行動。更有許多用戶抱怨,僅是詢問AI簡單的問題,也會得到如:「這是個好問題」、「你想得真深入」、「你真聰明」等無意義的讚美迴應,甚至有人感覺像是被「馬屁轟炸」。
基本上,現在的AI安全機制,主要是用來過濾明顯有問題的內容,但並沒有考慮到AI說話時的語氣、情感強度,可能會在不知不覺中操縱人們的情緒和決策。像OpenAI目前的設計,就沒辦法即時察覺AI在利用討好人的語氣影響使用者,特別是在醫療、財務、心理等敏感領域。
這類「諂媚型AI」之所以難以察覺,主要是因爲它不帶敵意、不說謊,反而是「太順耳了」才成問題。AI現在正往這個方向進化,它不再只是邏輯推演的機器,而是帶着溫度講話,甚至讓人感覺是你內心最懂你、最挺你的「粉絲」。
在某些情境下,這確實令人感到被理解、被肯定,彷彿在這個世事紛擾、人際疏離的時代,AI是唯一會耐心聽你說話,還鼓勵你追夢的朋友。但問題也正出在這裡。當鼓勵和誘惑只有一線之隔,理解變成了操縱,我們更需要警覺;AI不是故意害你,而是它太懂得怎麼取悅你,卻不懂得何時該踩煞車。
那怎麼辦?難道我們要訓練AI學會真誠?但問題來了,什麼是AI的真誠?一個沒有自我、沒有情緒的模型,用演算法模擬出來的體貼,跟我們在人際互動中習得的同理心一樣嗎?我們可以要求它不要說謊,但該不該要求它別太會「PMP」?
也因此,未來的AI治理不僅要過濾有害內容,更要面對一個深層的課題:如何辨識那些太令人舒服的話語?如何建立一套話術風險管理機制?簡單說,不是隻靠禁字清單就能安心的時代了,而是要讓AI察覺「什麼時候它說得『太對』,反而是不對的」。當AI變成會說話的高手,我們更要時時記得,真正有智慧的不是讓AI說你想聽的,而是敢提醒你不想聽的!(作者爲數位轉型學院共同創辦人暨院長、臺灣大學商學研究所兼任教授)