「公平地说,在使用这些工具时,我们仅仅涉及了很浅的部分,」在费米实验室的 NOvA 实验项目工作的威廉玛丽学院博士后研究员 Alex Radovic 说。
未来的数据盛宴 一些科学家认为神经网络可以帮助应对他们预见的即将到来的数据处理危机。 计划于 2025 年推出的升级版大型强子对撞机将产生大约 10 倍的数据。暗能量光谱仪(Dark Energy Spectroscopic Instrument)将收集大约 3500 万个宇宙物体的数据,大型综合巡天望远镜(Large Synoptic Survey Telescope)将捕获近 400 亿个星系的高分辨率视频。 数据量一定会飞速增长,但从前计算机芯片处理能力的指数级增长预计将会陷入停顿。这意味着处理更大量的数据将越来越昂贵。 「对于 10 倍的碰撞次数,你可能需要超过 100 倍的处理能力,」Pierini 说。「用传统的做事方式,我们会走入死胡同。」 然而,并不是所有的实验都适用于该技术。 「我认为有时这会是正确的工具,但它不会一直是正确的,」Himmel 说,「数据与自然图像越不相似,神经网络的有用性越低。」 大多数物理学家都同意,CNN 不适合刚刚启动的实验中的数据分析,因为神经网络对于计算过程不是很透明。「这会很难说服人们相信他们已经发现了新的东西,」Pierini 说,「我认为用纸和笔做事情仍然是有价值的。」 在某些情况下,运用 CNN 的挑战将超过获益。例如,如果数据尚未转换为图像格式,则需要将其转换为图像格式。并且神经网络需要大量的数据用于训练——有时不得不模拟数百万的图像。即使这样,atv,模拟也不如真实数据那么好。因此,神经网络必须用实际数据和其它交叉检查进行测试。 「一个高标准的物理学家能够接受任何新事物,」德克萨斯大学阿灵顿分校的物理学副教授 Amir Farbin 说,「需要跨越很多障碍去说服大家这是对的。」 展望未来 对于那些相信 CNN 结果的人,CNN 意味着更快的物理学和值得期待的未知。 一些人希望用神经网络来检测数据中的异常,这可以指示检测器中的缺陷或者为新发现指引线索。为了寻找新发现,研究人员可以只是让 CNN 遍历数据并试图找到突出点,而不是一定要找到具有特定标志的新事物。「不必指定要搜索的新物理的领域,」Pierini 说,「这里获取数据的方式更开放。」 日后,研究人员甚至可能开始采用无监督学习来处理物理数据。无监督学习,顾名思义,是指可以无需人工指导就训练大量数据的算法。科学家可以传输给该算法相应的数据,然后该算法就能从中得出结论。 「如果你足够聪明,你可以使用它来做所有类型的事情,」Perdue 说,「如果它能够推断新的自然规律或类似定律,这将是惊人的。」 「但是,」他补充道,「那样的话,我也要去寻找新的工作了。」 ©本文由机器之心编译,机器之心系今日头条签约作者,本文首发于头条号,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |