最近,一些网民报道说,朱·齐平的经典散文“莲花池中的月光”被认为是AI在主流纸张检测系统中产生的内容的62.88%。这不是一个孤立的情况。 Liu Cixin的科幻小说“三体问题”中的段落也有很高的AI一代可能性。更荒谬的是,“ Tengwang亭子的序言”实际上显示出100%的AI产生。一旦暴露了这些测试结果,它们就会在互联网上引起激烈的讨论,许多网民开始质疑AI检测是否“可靠”。
为了响应上述网民,扬格晚新闻的记者进行了实际测试。记者选择了Zhu Ziqing的“背景”和Liu Cixin的科幻小说“ Sphere Lightning”的剪辑,并使用了网民通常用于测试的纸质检测工具。
测试结果表明,Zhu Ziqing的“背景”的总体AIGC为18.21%,而“ Sphere Lightning”夹的整体AIGC高达32.05%。随后,记者在线搜索了AI检测,并随机选择了两个AI检测网站进行测试。结果表明,两个网站的AI生成率“背景”均小于1%。一个网站检测到23%的“球体闪电”片段的AI率,另一家公司的测试结果为0.23%。
记者的调查发现,AI检测实际上是一个分类模型,可以预测文档是否由大语言模型编写。一般而言,这种类型的模型是根据大量手动和AI生成的文本语料库训练的。在AI领域工作的技术人员告诉记者,AI比人类的不可预测性更倾向于以可预测的模式写作。检测模型使用这些功能和自然语言处理算法来识别AI生成的内容。 “但是AI检测中会有错误的判断,因为AI生成的内容的性质在不断变化。”技术人员告诉记者,技术进步可以降低AI检测的错误判断率,但不可能完全消除它。他说,AI检测模型和AI大型模型就像长矛与盾牌之间的关系。通过对AI大型模型的迭代升级,还必须同时优化AI检测模型,否则错误判断将更加严重。
此外,还回应有关社交平台的讨论“纸质AI速率非常高”,记者咨询了一家AI测试公司。该公司的技术人员表示,尽管AI检测模型的优化速度和更新的速度目前正在加速,但教育工作者不应将AI测试的结果视为判断学生成果的唯一标准,而应将其用作全面评估系统中的参考指标。
校对席恩