【噪声 书籍】因素〈年龄和先前被定罪的次数)与保释模型中使用的两个因素密切相关,面大量证据表明与犯罪行为也是紧密相关的。

  • A+
所属分类:精英日记
       

本文选自 丹尼尔·卡尼曼新作《噪声》,扫上面码免费领电子书

因素〈年龄和先前被定罪的次数) 与保释模型中使用的两个因素密切

相关,面大量证据表明 与犯罪行为也是紧密相关的。

简约模型的吸引力在于其透明性和易用性,而且相比于其他复杂
模型,它只需略微牺牲一点准确性就能获得这些优势。

更复杂: 机器学习

在旅程的第二部分,让我们在复杂性频谱上朝相反的方向前进。
如果我们可以使用更多预测因素,收集更多数据,发现前人未发现的
关系模式,并对这些模式进行建模以实现更好的预测效果,那会如何
呢? 从本质上讲,这就是人工智能的目的。

海量数据集对复杂分析至关重要。而获得此类数据集越来越容
易,是近年来人工智能快速发展的主要原因之一。例如,大型数据集
可以机械地处理“断腿的例外” (broken-leg exceptions) 这种情
况。这个有点神秘的短语可以追溯到前文中梅尔假想的一个示例,设
想有这样一个模型,它可以预测人们今晚去看电影的可能性,无论你
对该模型有多大信心,如果你碰巧知道某人刚摔断了腿,你都可能会
比模型更准确地预测他今晚是否会去看电影。

在使用简单模型时,“上断腿原则 ”给决策者提供了重要启示: 它
告诉人们何时需推翻模型,何时则不需要这样做。如果你掌握了模型
未考虑的如“断腿”这样的决定性信息,你就应该推翻模型的建议。
此外,即使你缺少此类信息,有时你也不会同意模型的建议。在这种
情况下,你试图推翻模型的行为,反映了你对相同预测因素做出反应
的个人模式。这种个人模式很可能是无效的,你的干预可能会降低预
测的准确性,因此你应该避免推翻模型。

机器学习模型之所以能够在预测方面表现出色,其中一个原因
就是,它们能够发现人类所无法想象的各种“断腿”情况。在具有大量案例、海量数据的条件下,追踪观影行为的模型真的会学习,例如
在固定观影日去了医院的人当晚不太可能去看电影。可以说,以这种
方式改进对不常见事件的预测,可减少对人工监督的需求。

人工智能不是魔法,也不需要理解什么,它仅仅是在识别模式。
虽然我们必须佩服机器学习的力量,但我们也要明白 ,人工智能可能
要花很长时间才能理解为什么断腿之人会错过电影之夜 。

更明智的保释决策

在前面提到的研究团队将简单规则应用于保释决策问题的同时
由塞德希尔。稳来纳森 〈Sendhil Mullainathan) 领导的另一个团
队训练了复杂的人工智能模型来执行相同的任务。研究团队获得了更
大的数据集一一包含758 027个保释裁定的案例库。对于每种情况,研
究团队可以获得和法官一样的信息: 被告的罪行、犯罪记录、未按时
出庭受审的次数等。除年龄外,参与训练的算法没有其他任何人口 统
计学信息适合使用。对于每一起案件,研究人员还知道关于被告是否
被释放,以及他如果被释放,之后是否会按时出庭或被重新逮捕〈被
告中有74的人获得保释,其中15%的人在那之后没有按时出庭,26%的
人则被重新逮捕) 的信息。 这一才 训多 学
习算法,并评估了该算法的表现。该模型是通过机器学习构建的,因
此并不限于线性组合。如果它在数据中检测到更复杂的规律,它就会
使用此模式来改进预测。

该模型用于预测嫌疑人在保释期逃脱的风险,因此将风险量化为
数字,而非只产生是否准予保释的决定。这种方法确定了最大可接受
风险的阔值,即如果风险高于该阔值,就应该拒绝保释 。然而,研究
人员发现,无论如何设置风险阔值,使用该模型的预测得分都高于法
官的预测。称来纳森的团队计算得出,如果将风险阔值设置为一个
值,使模型预测的拒绝保释人数与法官判决的拒绝保释人数相同,则

关于快与慢的哲学思考相关推荐:

卡尼曼的预期理论,振动噪声书籍,卡尼曼认知资源理论例子

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: