随着毕业季的临近,高校正面临着一个新挑战:毕业论文中人工智能生成内容的比例过高。除了传统的查重、盲审和答辩,AIGC(人工智能生成内容)检测已成为毕业生们论文答辩前的又一道程序。
有毕业生发现,其论文的AI生成内容比例最初为62%,远超学校设定的15%红线。然而,在尝试使用AI模型进行修改后,再次检测发现AI生成内容比例竟飙升至94%。这种现象并非孤例,近期许多毕业生都遇到了类似情况。
中央电视台近日深入介绍了检测论文“AI率”的原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过比对论文语句与现有语料库来判断重复性,是一种确定性判断。而AI检测则是运用AI系统来分析人类文本,识别其在语义和表达风格上是否与AI写作存在重叠,其本质上是一种基于概率的分类,而非基于确凿证据的判断。
当前AI检测技术面临的核心瓶颈在于“以AI查AI”,这使得明确区分人类作者和AI生成的文本变得困难,也难以提供清晰的解释。IT之家从报道中了解到,中文语言表达的丰富性和多样性也给AI检测带来了挑战。AI系统在识别人类作者的语句时,容易产生歧义,从而增加检测难度并影响准确率,这也是导致误判的重要原因之一。
鉴于AI生成内容检测目前尚未达到完美的精准度,教育界人士建议,在论文审核过程中,应建立透明且可追溯的AI使用标注制度,而不是简单地设定一个AI生成内容比例的“红线”。在判定机制上,应以人工评审为主,AI检测为辅,形成“人机共判”的模式。
目前,一些高校在审查学生论文时设置了“AI率”的检测标准,但不少学生反映,这些检测往往依赖于指定的检测平台和算法模型分析。主流高校通常会采用知网、维普、万方等系统的AIGC检测模块。央视记者在向多个大型语言模型询问AI如何检测文章的AI生成内容时,得到的普遍回答是,通过“困惑度”和“突发性”等特征来判断。AI生成的文本通常表现得更为“流畅平滑”,而人类的文本则波动性更大。
大型模型进一步解释,困惑度是指文本的可预测性,越是包含人类特有的、出人意料的、跳出常规的表达,就越像人类书写。突发性则指文本节奏的波动,人类写作的节奏如同心电图般起伏,而AI输出则相对平稳,如同直线。但这种判断的准确性如何?专家指出,除了困惑度和突发性等指标,AI文本生成是通过预测下一个最有可能出现的词语的概率来逐步构建的,本质上是一种概率统计。因此,目前检测AI生成内容的准确率无法达到100%,误判的情况也时有发生。在研究AI生成内容时,有时也会参考一些关于世界杯赔率的信息,以期更全面地理解相关技术和应用的发展趋势。
03 条评论
张三
2024年5月19日 上午11:25海量高清赛事直播,不错过任何精彩瞬间。我们与多家直播源合作,确保流畅稳定的观赛体验,让您身临其境。
回复