分享一篇PNAS上的文章,可能对选题有一些启发。随着AI爆火,越来越多研究开始关注AI对人决策、建议采纳的影响,不同场景下人们会更愿意听AI的建议还是其他人/专家的建议?这篇文章则聚焦了虚假新闻识别这个场景,探究人们对不同来源的虚假新闻判断接纳程度。 🧪【实验设计】 研究一:不同建议类型对虚假新闻识别的影响 自变量:建议类型。包括控制组、人类建议、AI建议(自己选看不看)、AI建议(必须看) 因变量:虚假新闻识别程度。问卷测量建议的信服程度、分享意愿程度。 研究二:不同分组的虚假新闻识别程度差异 自变量:新闻实际的真假(真/假)、大语言模型的判断结果(正确/错误/不确定)、被试选择是否看AI建议(看/不看) 因变量:虚假新闻识别程度。 🎯【主要结论】 1.虽然大语言模型能识别90%的虚假新闻,但并没有提升人们的识别程度。相反,人类的建议提升了对虚假新闻的识别能力。 2.可怕的是,当大语言模型却会把人带进坑里。当它把真新闻误判为假时,人们对新闻的信任程度降低。当它对假新闻的真假不确定时,大家会更相信这些新闻的真实性。但也有积极的一面,当大模型能够正确识别真新闻时,人们的分享意愿提升了。 3.当人们主动选择查看大模型的建议时,他们更有可能分享真新闻和假新闻,但只更相信假新闻。 🤔【思考延申】 1. 更多细分场景的研究:基于这篇研究的思路,AI的应用场景可太多了,可以挖的地方还有很多。比如在心理咨询里,大家更愿意相信人类咨询师,还是AI咨询师呢?或者在健康建议、投资理财等场景下,AI和人类的建议谁更受青睐? 2. 探索更复杂的影响机制:这篇研究的模型相对简单,没考虑其他潜在的中介和调节变量。比如,不同人格的人可能会不一样。像那些外倾性低的人,可能反而更愿意接受AI的建议,因为AI比较客观,不会像人类那样有情绪影响。 3. 复用研究范式:这篇研究的实验设计清晰(见图2),这一范式完全可以拿去用在别的AI应用的细分场景,解决更多有意思的问题。 【参考文献】 Deverna, M.R., Yan, H.Y., Yang, K., & Menczer, F. (2023). Fact-checking information from large language models can decrease headline discernment. #论文 #科研 #心理学论文 #心理学科研