文章详情

专注互联网科技,赋能企业数字化发展

韩国deepfake新闻评论

作者:韩国deepfake新闻评论

宣传一下我们在AI鉴真领域的系列工作:Veritas & VideoVeritas (滑动可看正文全文) 目前“Veritas: Generalizable Deepfake Detection via Pattern-Aware Reasoning”已被录用为ICLR 2026 Oral 代码、数据、模型已开源🔥 📖:https://arxiv.org/pdf/2508.21048 🔗:https://github.com/EricTan7/Veritas 📍 核心贡献一:HydraFake 数据集 涵盖四大泛化场景:分布内、跨生成式模型、跨伪造类型以及跨数据域;📉现有小模型在跨模型场景泛化性极好,但应对新型伪造手段和未见数据域时泛化性有限; 📍 核心贡献二:Veritas 大模型 为了应对现有大模型在检测领域的不足,Veritas 模拟了人类专家的鉴伪过程: - 基础推理:引入“快速判断”、“取证”和“总结”的推理模式。 - 进阶机制:针对高难度样本,进一步引入“规划”和“反思”过程。 Veritas不仅在OOD伪造样本上展现出卓越的泛化能力,还能提供高度透明、与人类认知对齐的决策过程。 🛠️ 训练策略 结合Deepfake领域特点,我们提出两阶段训练策略:将离线混合偏好对齐(MiPO)与在线强化学习(P-GRPO)相结合,有效缓解“背模版”现象,提升伪造分析能力。 📊 实验结果与对比 我们对比了10+款主流检测器与闭源大模型,Veritas 在多种泛化场景下均取得了显著优势: ✅对比领域内大模型(如FakeShield、FakeVLM):Veritas泛化优势显著,并能提供高质量、高度透明的决策过程; ✅对比基础模型(InternVL3-8B):Veritas 平均准确率提升了 32.4%; ✅对比闭源大模型(GPT-4o、Gemini-2.5-Pro):Veritas 依然实现了 11.8% 的准确率领先; #大模型 #多模态大模型 #AI安全 #deepfake #科研 #ICLR

返回新闻列表