朱自清《荷塘月色》被檢出高AI率引熱議

“熬夜寫的論文,AI檢測直接判了80%!”大四學生曉妍(化名)在社交平臺上的抱怨,引來大量畢業生共鳴。爲了探究檢測工具的實際情況,記者進行了一個實驗:將朱自清的名篇《荷塘月色》與劉慈欣《流浪地球》的片段上傳至某常用論文檢測系統後,結果顯示,這兩篇經典作品AI生成內容總體疑似度竟分別達到了62.88%和52.88%。這樣的檢測結果,也讓學生們普遍多了些“論文被AI誤判”的擔憂。(大河報)

朱自清《荷塘月色》被檢出高AI率,這一結果,其實並不能說明太多問題。我們知道,嚴格說來AI本身並沒有內容原生能力,而是根據既有的語料、素材進行化煉合成。現階段,市面上很多AI檢測系統,恰恰是基於這一大前提,通過判斷文本的原生度,來反推其AI生成的概率。將《荷塘月色》的片段投入此類論文檢測系統,系統很容易檢測出其與公開資料高度重合,由此判定原生度低、AI概率高,從邏輯角度說,這是沒有問題的。

所謂“AI論文反識別”,當然無法判斷《荷塘月色》是不是AI寫的,其能判斷的是,這部分被拿來檢測的《荷塘月色》片段文字,是不是與現有的語料庫、數據庫信息雷同,繼而“若雷同則視作AI生成”。這裡面其實有個已知可證、遞進推理的思維在。而需要說明的是,“雷同文本”鑑別,其實只是最初階的AI檢測模塊,這屬於小兒科的功能,並不能體現水平。用AI生產的論文,去測試AI論文反識別系統,纔有基本的合理性——當然了,其結果也可能並不樂觀。

好的AI論文反識別系統,至少應該有兩個基本的素質,也即準確率高、誤傷率低。從目前來看,市面上的很多AI論文反識別系統,在這兩個指標上的表現都很難令人滿意。比如說,不少學生吐槽,自己辛辛苦苦“手搓”的論文,卻被系統檢測判定含AI率太高,簡直比竇娥還冤。之於此,固然確有一部分論文寫得AI裡AI氣而被錯判的成分,但同樣更應該看到,當下的很多AI論文反識別系統,的確不靠譜。

在AI平臺後臺記錄不公開、不上傳、不聯通的前提下,所謂的AI論文反識別,從本質上說,只是一種基於概率的可能性測算,這並不是實錘、實證。之於此,很多高校心知肚明,其之所以要新設“AI檢測”這道流程,更多隻是一種姿態釋放,爲的是彰顯對學術標準和學術品德的不棄防。AI論文反識別,可能誤傷,而就算通過了其檢測,也可能是錯放。整個過程中,並不可靠的技術權威、基於工具理性的形式判斷,替代了學術人能動的實質判斷、價值評判,這很難說不是本末倒置。