最终,在政治暴力这个问题上,希望大数据通过某种无理论的「蛮力」产生某种有效的预测是错误的想法。自动的数据提取算法,atv直播,比如基于社交媒体的网页抓取和信号探测,可能会加剧政治紧张局势,但这并不意味着这些算法能以较高的时空精度预测低概率冲突事件。只有研究人员考虑到数据质量和代表性的局限性,大型自动编码的数据集才能发挥用处。这样一来,团队工作的人类「超级预测员」仍然能在一般政治事件预测上击败的不仅是更专业的专家,还包括预测市场和其他自动化的方法就不足为奇。 总体上看,我们坚决相信冲突预测非常有用,也值得投入研究。但是,未来的预测研究需要识别由人类系统的大量历史复杂性与偶然性导致的内在局限。如冷战的结果和更多的最近历史事件表面,像「英国退欧」和「特朗普大选胜利」这样的历史性「事件」经常会讽刺脱离语境的样本外的推算(out-of-sample extrapolation)。讨论经济发展长期预测的难度时,Milanovic 提醒我们「可以也确实会改变的变量数量,历史中(『自由意志』)人物的角色」,以及战争和自然灾害的影响是如此之大,以至于即使是一代人中最优秀的头脑所作出的大趋势预测也很少正确。 然而,同时,时空范围更有限的预测——例如预测的一个给定的处于内战的城市的短期暴力轨迹——是完全可能的,因为它们不太可能受到这些发展的影响。因此,该领域的挑战是,要在社会和政治世界固有的复杂性与我们准确预测政治暴力的能力的相关局限之间找到一个平衡点。最近收集冲突事件的非总体和空间直观(spatially explicit)的数据加快了,结果表明,在有限的时空半径内,政策相关的预测是可行的,同时潜在用处也非常大。然而,超出这些限制,大量的理论和经验的不确定性往往压倒了预测的尝试。在这样的情况下,在生成可能的情景这个任务上,预测建模作为一种启发式工具,而不是作为具体政策建议的生产工具,或许会更有用。 二、科学学领域中基于数据的预测研究 摘要:想要预测发现的愿望——提前知道将由谁在何时何处发现什么,几乎渗透了现代科学的所有方面:从个人科学家到出版商,从资助机构到招聘委员会。本文调查了「科学的科学(science of science,科学学)」的新兴和跨学科领域,以及使我们得知科学发现的可预测性的因素。而后我们将讨论改进源自科学的科学的未来机遇及科学社区中积极和消极的潜在影响。 想要预测发现的愿望——提前知道将由谁在何时何处发现什么,几乎渗透了现代科学的所有方面:从个人科学家到出版商,从资助机构到招聘委员会。本文调查了「科学的科学(science of science,科学学)」的新兴和跨学科领域,以及使我们得知科学发现的可预测性的因素。而后我们将讨论改进源自科学的科学的未来机遇及科学社区中积极和消极的潜在影响。 目前,对预测发现——对何人何时何地发现何物提前有些想法——的渴望几乎遍及现代科学的所有方面。个人科学家通常预测哪些研究问题或课题会是有趣的、有影响力的,并且可获得资金支持。出版商和资助机构评估手稿或项目意见书时,部分是通过预测其未来的影响力进行的。员工招聘委员会也会预测哪些候选人员会在其职业生涯中作出重要的科学贡献。对于通过税费资助大部分科学研究的社会大众来说,预测也是重要的。我们能使科学发现过程更有可预测性,就能将资源更高效地用于推动有价值的技术、生物医学和科学方面的进步。 尽管存在这种普遍的需求,我们对如何发现的理解仍然是局限的,并且个人、出版商、资助机构或招聘委员会做出的预测中相对来说极少是通过科学方式做出的。那么,我们如何能知晓哪些是可以预测的,哪些是无法预测的?尽管将发现与发现者相分离会存在困难,但该论文的首要关注点是科学的科学:为科学性地理解导致科学发现的社会过程(social processes)而进行一种跨学科工作。(是为了对科学哲学的现时思考及科学家如何在个别科学挑战方面取得进展,请看(1) 这种预测发现的兴趣可以向前追溯近 150 年,一直追溯到哲学家 Boleslaw Prus (1847–1912) 和经验主义学派的社会学家 Florian Znaniecki (1882–1958) 的作品。特别是 Znaniecki,在其倡议下,设立了对科学社会进程的数据导向研究。在 20 世纪的大部分时间里,该目标进展缓慢,部分是由于好数据难获取,且大部分人满足于专家评判。 (责任编辑:本港台直播) |