摘要:人工智能生成文本檢測(AIGTD)旨在對候選文本進行分類,判斷其是由人類撰寫還是由人工智能(AI)生成。近年來,AIGTD引起了廣泛關(guān)注,提出了眾多創(chuàng)新方法。然而,現(xiàn)有研究較為零散,缺乏系統(tǒng)性和全面的理解框架。為填補這一空白,本文系統(tǒng)梳理并總結(jié)了最新進展與前沿技術(shù),并提出了一種新的多層次分類框架,以統(tǒng)一現(xiàn)有研究方向,推動領(lǐng)域發(fā)展。具體而言,該框架將現(xiàn)有方法歸納為三大研究方向,即針對分類器訓(xùn)練、內(nèi)在屬性以及信息嵌入的核心挑戰(zhàn)。同時,本文引入了基于可解釋性和透明度的黑盒與白盒模型分類及其計算需求,進一步分析不同方法在檢測與對抗場景中的適用性。此外,為系統(tǒng)評估現(xiàn)有方法的性能,本文整理并收集了常用的基準數(shù)據(jù)集,全面比較和分析現(xiàn)有方法在多個數(shù)據(jù)集上的表現(xiàn)。最后,本文總結(jié)和展望了AIGTD領(lǐng)域未來的潛在研究方向。為支持該領(lǐng)域研究,我們整理并公開相關(guān)資源,Github訪問地址為:AIGTD-Survey
論文信息: Zhiwei Yang, Zhengjie Feng, Rongxin Huo, Huiru Lin, Hanghan Zheng, Ruichi Nie, Hongrui Chen. The Imitation Game revisited: A comprehensive survey on recent advances in AI-generated text detection[J]. Expert Systems with Applications, 2025, 272: 126694.