做出什么样的发现部分取决于谁在做这个发现以及他们接受的是什么样的科学家训练(10)。科学家生产力队伍的这些特点是受一小部分颇有声望的研究机构的博士项目驱动的,这是由用来训练大多数职业研究者的数据揭示出的。(11)作为这一优势的结果,研究议程以及少量项目的博士生人口统计学趋于驱动着科研偏好和整个生态系统的生产力构成。除了这一稳健的模式——85% 的新教员是来自博士项目到不同层次声望的研究机构——之外,到目前为止,教员安置显然是难以预测的。利用了职业生涯早期生产力、博士后训练情况、地理位置、性别方面等更多方面数据的模型几乎很难改善有关最终职位安置的结果,跟了解这个人的学术血统后的预测效果差不多(12)。这一背景下的准确预测或许需要不同的、更少接触到的数据,或者安置结果根本就是难以预测的,因为这取决于潜在不可测量的因素。 通过测量科研生产力以及发表作品被引用情况,研究人员也已经调查过了科学家个人在职业生涯中的表现和成就的可预测性。一般常识认为生产力——粗糙得说就是发论文的数量——会在职业生涯早期趋于高峰,接下来是一条长长的、逐渐下降的曲线(13),或许日益增加的教学和服务任务影响了科研作品的数量,降低了创造力等。不过,近期的一项对四十多年的生产力数据分析(针对 2300 名计算机科学教育人员)表明,个体生产力存在巨大差异性(14)。通常,最富生产力的时间集中在成为首席研究人员的最初 8 年中(图 2),生产力高峰通常出现在首次升职之前。同时,近一半研究人员生产力最高峰的一年会出现得晚一点,有些研究人员的生产力最高峰出现在职业生涯晚期。
对于绝大多数研究人员来说,生产力高峰很早就出现了。 (左)热图表明 2300 名计算机科学教员职业生涯中,生产力最高峰年份出现的时间(以发表作品数量为准),从第一份教职开始,从左到右依次列开。(右)直方图对热图的横向进行了总结,表明,对于绝大多数 研究人员来说,他们生产力达到最高峰的一年通常出现在创立自己实验室的 8 年内。 过去的作品也意味着,职业生涯的早中期更有可能做出科学家个人最佳科学发现,比如,被引用最多的作品(15,16)。这一模式意味着主要发现的出现时间多少是可以预测的。不过,针对 10,000 名科学家发表作品历史的分析表明,实际上,一项发现的影响力和它在职业生涯中出现的时机,并无相关性。也就是说,当这位科学家论文按照从第一篇到最后一篇的顺序进行安排时,他们引用率最高的发现就是第一篇论文的可能性大致等于可能是第二篇、第十篇甚至最后一篇的可能性(图 3)。年轻科学家倾向于成为绝大多数最主要发现的发起人——这一发现因此也是他们通常更富生产力这一事实自然而然的结果,并不必然是职业早期能力提升的一个特征。仅凭简单的机会本身,个人的最佳发挥更有可能出现在这位科学家职业生涯更富创造力的阶段。
图 3. 在一位科学家作品序列上任意一点的主要发现。 这幅栅格图展示了随机挑选的 150 位 物理学家(17)所有作品的顺序,从第一篇到最后一篇,每一行圆圈代表了一为科学家发表作品的顺序。一行当中,蓝色圆点标记的是最高影响力的作品。蓝色圆点在表格里的不一致分布以及对应 10,000 调查者(顶部)柱状图的平坦表明,主要科学发现什么时候出现,并无规律可循。 虽然每位科学家影响最显著的论文的相对时间可能无法预测,但预测论文会被引用的次数和它是两码事(17,18)。具体来讲,援引已发表论文会以系统、持续性的方式因科学家而异,这与科学家工作主体的可见性相关,但与研究领域无关。这种模式使我们能够预测一个科学家最优论文的被引用量。关于科学家个人巅峰时期和幅度的两个结果表明,个别科学家成就的某些方面极难预测,而在其他方面更容易些. (责任编辑:本港台直播) |