韩国deepfake新闻评论

作者：韩国deepfake新闻评论

宣传一下我们在AI鉴真领域的系列工作：Veritas & VideoVeritas （滑动可看正文全文）目前“Veritas: Generalizable Deepfake Detection via Pattern-Aware Reasoning”已被录用为ICLR 2026 Oral 代码、数据、模型已开源🔥 📖：https://arxiv.org/pdf/2508.21048 🔗：https://github.com/EricTan7/Veritas 📍 核心贡献一：HydraFake 数据集涵盖四大泛化场景：分布内、跨生成式模型、跨伪造类型以及跨数据域；📉现有小模型在跨模型场景泛化性极好，但应对新型伪造手段和未见数据域时泛化性有限； 📍 核心贡献二：Veritas 大模型为了应对现有大模型在检测领域的不足，Veritas 模拟了人类专家的鉴伪过程： - 基础推理：引入“快速判断”、“取证”和“总结”的推理模式。 - 进阶机制：针对高难度样本，进一步引入“规划”和“反思”过程。 Veritas不仅在OOD伪造样本上展现出卓越的泛化能力，还能提供高度透明、与人类认知对齐的决策过程。 🛠️ 训练策略结合Deepfake领域特点，我们提出两阶段训练策略：将离线混合偏好对齐（MiPO）与在线强化学习（P-GRPO）相结合，有效缓解“背模版”现象，提升伪造分析能力。 📊 实验结果与对比我们对比了10+款主流检测器与闭源大模型，Veritas 在多种泛化场景下均取得了显著优势： ✅对比领域内大模型（如FakeShield、FakeVLM）：Veritas泛化优势显著，并能提供高质量、高度透明的决策过程； ✅对比基础模型（InternVL3-8B）：Veritas 平均准确率提升了 32.4%； ✅对比闭源大模型（GPT-4o、Gemini-2.5-Pro）：Veritas 依然实现了 11.8% 的准确率领先； #大模型 #多模态大模型 #AI安全 #deepfake #科研 #ICLR

文章详情

韩国deepfake新闻评论

推荐阅读