【丹尼尔卡尼曼噪声图片】这一挑战引起了诸多研究人员的兴趣,报名的参赛者来自各个国家。最终的报告选取了160个高质量研究团队的结果。入选的参赛者大

  • A+
所属分类:精英日记
       

本文选自 丹尼尔·卡尼曼新作《噪声》,扫上面码免费领电子书

这一挑战引起了诸多研究人员的兴趣,报名的参赛者来自各个国
家。最终的报告选取了160个高质量研究团队的结果。入选的参赛者大
多自称数据科学家,并且在预测时使用了机器学习算法。

在比赛的第一阶段,参赛团队可以使用一半样本对应的所有数
据,其中也包括6种结果。他们会用这一“训练数据”训练预测算法
然后将算法应用于另一半样本数据。研究人员使用均方误差来衡量预
测准确性,即每个案例的预测误差是实际结果与算法预测结果之差的
平方

最终获胜的模型准确度如何呢? 基于海量数据集训练得到的复杂
机器学习算法确实比简单线性模型的预测好,并且超过人类的判断。
但是人工智能模型不比非常简单的模型好多少,预测的准确性仍然很
低。在预测“流离失所”这一事件的概率时,最佳模型的相关系数仅
为0.22 〈PC=57%) ,对其他事件的预测也获得了类似的结果。比如,
对抚养人是否失业或是否接受工作培训的预测,以及对孩子在“名
力”这一维度上自我评分的预测,与实际结果的相关系数为0. 17一
0. 24 (PC为55%一58%) 。

在这6种结果变量中,2个是整合变量,它们的可预测性会更高一
些: 对儿童的GPA进行预测,其相关系数为0. 44〈PC=65%) ,对儿童近
12个月的物质贫困指数进行预测,其相关系数为0. 48 〈PC=66%) 。后
一个指标是由11个问题的答案整合而来,包括“你曾经挨过饿吗 ”
“你家的电话停机了吗 ”等。众所周知,整合指标一般比单一指标更
具预测力,也更具可预测性。该项挑战的主要结论是 海量预测信息
不足以预测人们生活中可能发生的单一事件,即使是整合变量,其预
测力也非常有限。

这项研究中所报告的结果非常典型, 社会刊这家报告的大半分机

关系数也都在这个范围内。 面和由
100多年来的25 000项研究, 涉及800万名被试, 该研究得出的结论

涵盖是: “社会心理学效应所产生的相关系数〈 7值) 通常等于0.21。”
在人体测量中常会出现更高的相关系数,比如我们之前提到的,成人
身高与脚的尺码之间的相关系数为0.6,这种高相关性在社会科学领域
很少见 项回顾性研究发现

如果你经常阅读那些“统计上显著”或“高度显著”的研究报
告,那么如此低的相关系数可能会让你大吃一惊。统计学术语通常会
误导读者,“显著”则是最具误导性的说法之一。当一项发现被描述
为“显著”时,我们不应该下结论说这一结果的效应很强,它仅仅说
明这项发现不大可能只是随机的结果 。 当样本量足够大时, 相关性可
能非常“显著”,但仍微不足道。

在关于这项挑战赛的研究中,对单一结果进行预测的有限性传达
出一条令人不安的信息,那就是理解和预测之间存在差别。脆弱家庭
的研究资料被认为是社会科学的宝库,确实如此,我们已经看到这些
数据被广泛地应用于科学研究中,进行这些研究的学者们坚信,他们
的工作将促进人们对用弱家庭生活的理解。然而,这种促进与详尽地
预测个人生活中可能发生的事件的能力无法相提并论。“脆弱家庭
汪汪生计的鸭下这生从让全汪 的全仆合流和人 人必他天

客观无知,理解和预测的上限

我们需要再次阑明这一斐观结论背后的逻辑。当“脆弱家庭”挑
战赛的研究者们将“理解”等同于“预测”,或是将“预测的缺失”
等同于“理解的缺失”时,他们所谓的理解就是具有特定含义的。然
而,这个词还有其他的含义,当你说你理解某一数学概念或理解“爱
是什么”时,你想说的可能不是你有预测能力这件事。

关于噪声 卡尼曼相关推荐:

噪声卡尼曼,心理学家卡尼曼,噪声控制技术电子书

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: