【给科学家的科学思维电子版在线阅读】人工智能这些新的能力

  • A+
所属分类:书评读后感
       

选自《给科学家的科学思维内容》王大顺著

风格的文摘? 人工智能这些新的能力将帮助研究人员扩展他们获得知
识的深度和质量,并帮助他们发现新的研究可能性。

对于科学领域的决策者而言,人工智能能够提供更为全面的“天

际线扫描”4301能力,提出战略投资的领域,识别出有可能带来科学
变革的想法,甚至组建变革性的科研团队。出版商也可以使用深度学
习找到论文的审稿人,或者自动识别论文中的错误和矛盾,从而减少
人工评审的负担。

其中的一些应用看上去遥不可及,特别是如果我们想要达到科学
家和决策者所期望的精度和可靠性的话。但是,真实情况是,尽管技
术已经在过去20年极大地重塑了人类社会,但可以促进科学过程的技
术却未有实质性进展。如果你对此表示怀疑的话,你可以看看“美国
国家自然科学基金会”的项目提交页面,或者是Scholar0ne论文投审
归全 它们看上去还像是当初互联网发展初期的那些早已过时的网

求解科学问题

人工智能有一天能和否帮助我们提出和求解基本的科学问题? 通过
以单个科学家根本无法实现的方式整合各种信息,人工智能系统能否
帮助科学家更快地得到更具创造性的、更好的解答? 它是否也能提出
新的假设,甚至新的研究领域?

我们已经在这方面看到了一些令人鼓舞的早期进展。例如,研究
人员已经把深度学习用于医学诊断,开发出各种视网膜病变的分类算

法,其精度已经与人类专家相当388。另一个例子是,一个经过训练的
人工智能算法对良性和恶性皮肤病的分类精度,已经达到经专业认证
的皮肤病医生的水准389。在急诊室里,深度学习现在可以帮助我们判
定一个病人的CT扫描是否显示他有中风的迹象330。新的人工智能算法

不仅使识别这些信号的精度可以媲美医学专家,更为重要的是,它的
速度是人类的150倍!

当然,还有让CASP与会人员充满若是的AlphaFold深度学习系统。
在CASP竞赛中,每个参赛队伍拿到的是90个蛋白质的氨基酸的线性序列,这些蛋白质的3D形状已知但是没有公开发表。参赛队伍要计算出
蛋白质是如何折叠的。通过簿选过去已知的蛋白质折生模式
AlphaFo1d的平均预测精度超过了所有其他97支参赛队伍 。

这些人工智能技术的成功运用都具备了深度学习的两个基本要
素, 大量的训练数据和清晰的分类方式。例如,为了检测皮肤癌,研
究人员给算法输入数百万的皮肤病变的图像,并告知算法每一幅图像
对应的是良性还是恶性病变。由于算法与皮肤病专家所受的训练是不
一样的,算法也许看不到皮肤病专家所看到的一些模式,但这也意味
着,人工智能系统也可能看到一些皮肤病专家所看不到的模式。

哪些科学领域能从这些进展中收益最多呢? 我们还是再看看深度
学习的两个基本要素: 大量的数据以及可用于标记数据的清晰边界。
这意味着那些最能从人工智能技术直接受益的科学领域需要足够的
窗,从而能够有清晰的数据标记策略。这些领域还要足够的深,使得

最为重要的是,尽管机器正在快速改进精度和效率,但科学最为

略伙伴关系。

人工智能与人类智能

我们再来看一人AlphaFold。通过采用新技术,科学家在没有专门
知识和专业领域训练的情况下,就能够超越该领域基于传统技术的所
有专家。这个例子提出了一个重要的问题, 如果把最新的技术与研究
人员的专业技能结合起来会如何?

未来科学学研究的一个关键领域就涉及人工智能的集成,从而使
得机器和人脑能够协同工作。我们期队人工智能能够以一种人类合作
和 帮科生放从各 区的全全本全全全
响。

我们想到了一个近期的例子。为了应对科学目前所面对的“可重
复性危机”的挑战,研究人员使用深度学习来揭示科学论文表述中,
表征强科学发现和弱科学发现的模式。2015年,“可重复性项目,心理学” (RPP) 分析了项尖心理学期刊上的100篇论文,使用与论文原
始研究一样的方法人工检测了其可重复性,结果发现其中有61篇未能

通过可重复性检测328。此后,在心理学、经济学、金融学和医学等领
域的研究也得到了类似的结果391-394。

为此,研究人员把人工智能与人类智能相结合以估算可重复性

395。研究人员使用经过严格的人工可重复性检测的96项研究,用它们
来训练神经网络去估测一篇论文的可重复性的概率,并使用249项其他
研究来检测训练后的模型的泛化能力。结果是激动人心的该模型的
平均曲线下面积 (AUC ) 达到0. 72,表明其预测精度显著高于完全随机
的推断。为了把这一结果与专业评审 人所提供的预测信息进行比较,
研究人员用同样的数据和训练过程来训练一个新的人工智能模型,但
是只使用评审 人的评价指标,发现这一基于评审人指标的模型的AUC只
有0. 66,表明其预测精度显著低于基于内容表述的模型。这些研究表
明人工智能依赖于专业评审 人未掌握的特征信息 。事实上,尽管人们
通常基于论文中的统计报告评价其价值,人工智能则更为精确地表
明,论文中的表述文本事实上具有更多人们以前没有挖掘的解释能
力。极为重要的是,把从表述模型和评审 人指标模型所得到的信息相
结合,也就是说,把机器和人类见解相结合,就可以得到具有最高精
度的新的人工智能模型 (AUC=0. 74) 。

对模型预测能力背后的机制进行分析,我们发现那些显而易见的
因素,诸如单词或短语的出现频率、写作风格、学科、期刊、作者身
份或主题等,并不能解释结果。而人工智能系统是基于复杂的语义关
系网络来预测可重复性的。尽管科学论文中的文字要比其汇报的统计
信息多出几个数量级,论文的文本在科学学研究中至今还几乎没有被
发掘。算法现在可以利用论文的全文来检测人类专家可能忽视的一些
新模式以及证据不那么强的科学发现。

这个例子凸显了一种新型的,并且也许是可怕的人机伙伴关系。
尽管机器比人更善于阅读并消化更多的信息 ,当前的人工智能应用还
是属于“弱人工智能”,它们只能处理特定的问题。从这点来看,目
前的人工智能系统很像洗衣机。它们可以洗涤你扔进去的任何衣服,
却完全不知如何清洗碗碟。你需要用洗碗机完成后一任务。类似的,
我们能够建造特别擅长预测蛋白质折登的人工智能系统,但该系统却

关于科学家善于思考的例子50字的图片

【给科学家的科学思维电子版在线阅读】人工智能这些新的能力

关于科学家善于思考的例子50字的相关词

创新思维训练与方法性考二答案 都市之天才科学家系统免费阅读
六年级下册科学思维导图第一单元 物理思维有哪些
人类的大脑是怎么产生思维的 小学科学培养思维能力

《给科学家的科学思维内容》下载

回到顶部

《给科学家的科学思维内容》信息

书名:给科学家的科学思维内容
作者:瑞·达利欧
出版社:天津科学技术出版社
出版时间:2021-12
ISBN:9787557696856
页数: 408

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: