新研究用逆強化學習識別Reddit用戶行爲:部分網友“就是愛擡槓”

IT之家 5 月 12 日消息,如今的線上社羣扮演的角色已經遠不止“聊天室”,它們影響着公衆討論、輿論走向、集體行動,甚至能左右現實中的決策。

不過,要識別出惡意噴子、謠言傳播者等這類破壞氛圍的用戶並不容易。以往的方法多半着眼於用戶說了什麼或和誰互動,但這些方式本身也有盲點。新研究提出了一個更有效的視角:觀察用戶的行爲模式,而不僅僅是他們說的話。

據外媒 Neowin 今日報道,在 ACM Web Conference 上,研究人員介紹了一種新方法:利用逆向強化學習來分析線上行爲。這項技術原本是用於自動駕駛和博弈論的,現在被用來觀察用戶在網絡中的互動方式,而不是簡單看他們發的內容。

這項研究分析了 Reddit 平臺上長達六年的 590 萬條互動數據,歸納出五種不同的行爲用戶,其中一種被稱爲“反對者”的人羣格外突出。他們經常專門尋找爭議話題,不是爲了討論,而是隻發表反對意見後便迅速離開,不等迴應。

研究還關注了“同質性”現象,即人們傾向與持相同看法的人互動,這種行爲容易形成“同溫層”,讓原有觀點不斷被強化。傳統上,研究人員多通過內容或社交關係來衡量這一點,但在以話題爲中心的 Reddit 上,這種方法效果有限。

於是研究人員改用逆向強化學習來衡量用戶的行爲模式,而非話題本身。結果發現,像 r / soccer 和 r / leagueoflegends 這一類討論區,其用戶在行爲方式上卻驚人相似:都極度支持自己喜愛的隊伍、緊盯比賽進程、辯論戰術策略,還愛批評對手。這說明導致分化的不只是話題,更在於互動方式本身。

與傳統內容審查相比,行爲識別更難被規避。用戶可以僞裝措辭,但要改變他們的互動習慣卻不容易。通過行爲模式識別問題用戶,平臺可以更早採取干預措施,避免問題進一步擴大。

這項研究的意義遠不止學術層面。平臺管理者可以利用這些行爲模式,在某些用戶發佈大量有害內容之前,就識別出潛在的問題用戶。與內容審覈不同,行爲分析並不依賴於理解語言。它難以規避,因爲改變一個人的行爲模式比調整語言需要付出更多的努力。