为什么人写的文章，也被判“AI味很重”？

作者：为什么人写的文章，也被判“AI味很重”？

最近因为一份 AI 使用规范，我开始认真研究一个问题：所谓“AIGC率检测”，到底靠不靠谱？结果越查越发现，这个分数可能没有我们想象中那么“铁证如山”。现在常见的检测方法，大概有 4 类：神经网络分类器：简单说，就是拿一堆“人写的文本”和“AI写的文本”训练一个识别器。问题是：它非常依赖训练数据。如果它学的是 GPT-3.5，现实里来了 GPT-4、新模型、或者别的平台模型，准确率就可能明显掉线。零样本检测器：这类方法会看文本的“概率分布”。 AI写作往往更平滑、更规整；人类写作会有跳跃、口语、轻微病句和情绪波动。但问题也在这里：只要让 AI 模仿人类的不稳定感，或者稍微改写一下，检测结果就可能大幅下降。水印法：图片能打水印，文字其实也可以。它不是在文字里塞一个肉眼可见的标记，而是在 token 概率里做微调。人看不出来，检测器能看出来。但文本太容易被改写了，人改一遍、另一个 AI 改一遍，水印就可能被破坏。数据库查重：把 AI 生成文本收进数据库，再拿你的文章去比对。听起来合理，但问题很大：数据库从哪来？会不会收进被洗稿、被二次生成、甚至原本人类写作的内容？所以一个很荒诞的情况是：你亲手写的东西，也可能因为别人拿去喂过 AI，被判出很高的 AIGC 率。这就是最反直觉的地方：不是只有 AI 文本会被检测出 AI 味。人类文本也可能被误伤。旧论文、旧文章、个人文案，都可能因为训练数据、数据库污染、风格相似，被放进“疑似 AI”的区间里。或许现在我们真的无力纠结于内容是否为AI生成，真正值得看的，可能不是一个百分比，而是：这段内容有没有信息量？论证链条是否成立？事实来源是否可靠？作者是否能解释自己的写作过程？它到底有没有解决问题？当 AI 越来越像人，人也越来越会用 AI，“AI率”这个数字本身会越来越尴尬。与其执着于“这是不是 AI 写的”，不如追问一句：这段内容，可靠吗？ #AIGC #AI检测 #AI写作 #人工智能科普 #ChatGPT #内容创作 #AI工具

文章详情

为什么人写的文章，也被判“AI味很重”？

推荐阅读