【给科学家的科学思维读后感在线阅读】的生物的高度遵循肥尾

  • A+
所属分类:书评读后感
       

选自《给科学家的科学思维内容》王大顺著

远不会看到被如此大量引用的论文。确实,假设有一颗行星,它上面
的生物的高度遵循肥尾分布。那么,这颗星球上大多数的生物将会很
矮,不到30厘米,但偶尔也能磺到3 000多米高的怪物在街上走动。这
个想象中的星球的怪异性,强调了引用量所遵循的肥尾分布和我们平
时经常看到的钟形曲线之间的巨大差别。

思 外

图16-2 正态分布、宕律分布和对数正态分布
〈a) 宕律函数、对数正态函数与正态分布在线性坐标图上的对比。

《b ) 在双对数曲线图上显示同样的对比,有助于我们观察在高被引区间正态分布和肥尾分布的根本差别。
宕律函数在双对数图里呈一条直线,斜率为宕指数 y。对数正态和畦律分布在双对数图里看起来相似,有
时很难将它们区分开来。

科学的真相

The Science of Science

二八定律
守律分布现象在收入和财富分配中十分常见。19世纪的经济学家维尔弗雷多。帕
雷托 (Vilfredo Pareto) ,注意到意大利少数富豪拥有大部分财富,而绝大多数人

只能挣到少量的钱 进一步观察,他得出结论,收入遵循窦律函 数264。他的发
现也被称作“二八 : 20%的人获得了80%左右的财富。

二八定律的不同版本适用于许多具有肥尾分布的量68, 265, 266。例如,在商业
界,20%的销售人员通常产生80%的销售总额,在互联网中,80%的链接指向15%的网页

委5,在医院,20%的病人贡献了80%的医疗支出。

引用分布的普适性

引用在不同学科之间也存在巨大的差异。例如,生物学论文常常
收获数百甚至数干次引用,而一篇高影响力的数学论文则可能至多得
到一二十次引用。图16-3描绘了发表于1999年的几个学科的论文引用
分布,充分展示了这种差异。相比于一篇发育生物学论文,一篇航天
工程论文获得100次引用的概率约为前者的1/100。这种系统性的差异
表明,仅仅比较不同学科两篇论文所获得的引用量是没有意义的。引
用量少的航天工程论文,报告的可能是该领域的决定性发现;, 而引用
量多的生物学论文,可能报告的仅是学科内渐进性的进展。Po)
CoPto)

{b)

图16-3 “引用分布的普适性

(Ca ) 发表于1999年的论文的引用分布,按学科分类。图16-3显示,在多个学科中,一篇论文获得c次引
用的概率P〈c) 表明,在有些领域,如发育生物学,高被引论文比在工程学更为普遍。

Cb ) 缩放后的引用分布,说明 (a) 显示的所有曲线按相同领域、相同年代的平均引用量 c>进行缩放
后,都遵循相同的分布。虚线表示数据的对数正态拟合〈公式16-2) 生。

要更清楚地了解一篇特定论文的影响力有多大,我们可以将它与
其学科内的普通文章做个比较。用一篇论文的引用量除以相同领域、
相同年代发表的论文的平均引用量,是一种对相对影响力更好的测量
手段。当原始引用量以这种方式标准化以后,我们发现每个领域的分
布都整齐地遵循一个单一的通用函数 [见图16-3 (b) ] 。在图16-
3 〈a) 中看起来如此不同的多条曲线,现在却收缩为一条曲线,这一
发现反映了两个重要信息 。

“。 引用模式具有惊人的普适性。无论你发表的论文属于数
学、社会科学,还是生物学领域,相对于自己本学科产生的影
响力而言,你的论文究竟是稍差、普通,还是卓越的概率,与

3 (b) ] 。

普适性曲线很接近下面这个对数正态函数,J (16-2)

科学的真相

The Science of Science

能描述引用分布的不同函数

像对数正态〔公式16-2 ) 或守律函数(公式16-1) 这样的肥尾分布在函数曲线 上
看起来极为相似〔见图16-2 ) 。但我们怎么知道哪一种函 数是最佳拟合呢? 许多研究
证明,各种不同的函数都能描述引用分布,从守律函数285-268到平移守律函数269,

再到对数正太函数熏, 268, 270-275,及至其他更为复杂的形式276-280。这些分布与
数据拟合得多好,往往取决于研究所基于的论文数据库、发表年代、期刊、学者、他
、学校以及原籍国等众多因素。支配不同形式Po)出现的机制,是一个热门
的研究课题,我们将在下面章节进行讨论。

引用分布的普适性,为比较不同学科的科学影响力提供了一种简
便方法。让我们关注两篇假想的论文,论文A是发表于1978年的计算几
何学论文,迄今为止被引用了32次;论文B是2002年发表的生物医学论
文,被引用了100次。尽管并不是同一领域的论文,但相对引用函数却
能帮助我们比较这两篇论文的影响力。为此,我们要首先收集1978年
发表的所有计算几何学的论文,算出它们的平均引用量,同样也将
2002年发表的所有生物医学论文集中起来,计算对应的平均数。将论
文A和B的原始引用量与它们各自领域和年代的平均引用量进行比较,
间作 攻生人交全全生生 全各们作作靖帮全 人,全全

号入。

在附录2的表25-1中,我们计算了2004年所有学科类别的论文截至
2012年的平均引用量。正如表中所示,某一特定学科领域的论文越
多,每篇论文能够获得的平均引用量也越多,这可能是因为它在该领
域被引用的机会要多一些。例如,平均引用量最高的论文大多属于生
物学,基本都在20次以上,而引用量最低的大多对应工程和数学学
科。即使同一学科也存在很大差异。例如,生物材料学作为材料科学
的热门 领域,其平均引用量为23.2。而材料科学的另一个分支领域,
材料表征和检测,其平均引用量仅为4. 59。有趣的是,这两个领域的
论文数量差别并不太大 (2 082比1 239) ,表明生物材料学论文往往
被其他学科专业所引用。

科学的真相

关于中国杰出科学家名单的图片

【给科学家的科学思维读后感在线阅读】的生物的高度遵循肥尾

关于中国杰出科学家名单的相关词

像律师一样思考詹青云资源 思维体系是怎样形成的
院士就是科学家吗 为科学而牺牲的科学家有哪些
想象力对科学进步的作用 改变世界的100个科学家

《给科学家的科学思维内容》下载

回到顶部

《给科学家的科学思维内容》信息

书名:给科学家的科学思维内容
作者:瑞·达利欧
出版社:天津科学技术出版社
出版时间:2021-12
ISBN:9787557696856
页数: 408

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: