差异检测器和专用模型都有助于这个结果。我们执行了一个因素分析:首先我们仅使用 YOLOv2,然后向该级联分别加入这两种快速模型。两者都用了必需的最大性能: NoScope 系统的因素分析 为了总结 NoScope 的级联策略,其优化器首先在一段给定视频流上运行了缓慢的参考模型(YOLOv2、Faster R-CNN 等)以获得基准标签。根据这些标签,NoScope 训练了一组专用模型和差异检测器,并使用了一个 holdout set 来选择使用哪个专用模型和差异检测器。最后,NoScope 将这些训练后的模型级联在一起,并且在不确定的时候还可以调用原来的慢模型。 总结 总体来说,视频数据的内容是非常丰富的,但要使用现代神经网络来查询却非常慢。在 NoScope 中,我们将差异检测和专用 CNN 结合到了一个特定于视频的流程中,利用时间局部性将 CNN 查询提速了超过 1000 倍。结果得到的处理流程每秒能够处理 8000 帧视频。我们将继续改进 NoScope,使之支持多类别分类、无固定角度摄像机和更复杂的查询。 原文链接: 本文为机器之心编译,转载请联系本公众号获得授权。 ✄------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |