我们介绍了一个新的大型视频URL数据集——YouTube边界框(YT-BB),内含密集采样的、带对象边界框的注释。该数据集由大约38万个19秒左右的视频片段组成,能够自动选择突出在自然背景中,没有经过编辑或后期处理的对象,记录质量与普通手机摄像机的记录质量类似。这些对象代表了MS COCO标签集的一个子集。所有视频片段都由人工标注,带有高精度分类标签和每秒 1帧的边界框。大量连续使用精确度越来越高的人类注释,确保了每个类和边界框(每个都紧密贴合对象边界)的标签精度高于95%。最后,我们训练和评估了著名的深层网络架构,并在文中汇报了每帧分类和本地化的基准数据,j2直播,为未来工作提供一个比较点。我们还演示了如何利用视频的时间连续性改进这种推论。数据集可以在这个网址找到https://research.google.com/youtubebb/。我们希望为研究人员和开发者提供这样大型的有序语料库,能够激发视频对象检测和跟踪的新进展。 【进入新智元公众号,在对话框输入“170207”下载论文】 谷歌开源 TensorFlow 模型性能调优工具 tfprof 谷歌今天还开源了 tfprof,tfprof 是模型性能调优工具(Profiling Tool for TensorFlow Models)的缩写,使用 tfprof 可以查看模型的参数量和张量形状(tensor shape),了解运算的运行时间、内存大小和设备位置。现在,tfprof 已经支持Python API、交互式命令行工具和单步脚本使用(One-shot )。 根据作者 Xin Pan 在 Github 的介绍,tfprof 的主要功能包括 测量模型参数、浮点运算、张量形状 测量操作执行时间,请求的内存大小和器件布局(device placement) 检查检查点张量(checkpoint tensors)的形状和值 基于名称范围或图结构浏览模型 对运算进行选择性分组、过滤、建立账户(account)和排序 Github 文档还简单介绍了 Python API 的使用方法,比如, 要检查所有可训练变量的形状和大小时,
要检查浮点操作的数量时,
tfprof 是 TensorFlow 核心的一部分。使用 import tensorflow as tf 就行了。 编译来源: https://research.googleblog.com/2017/02/advancing-research-on-video.html https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/tfprof 【寻找AI独角兽】新智元联手10大资本 启动2017创业大赛 AI 创业大赛由新智元与10 家主流 AI 创投机构:蓝驰创投、红杉资本中国基金、高瓴智成人工智能基金、蓝湖资本、蓝象资本、IDG资本、高榕资本、中信建投证券、明势资本、松禾远望基金携手发起,由新智元主办,北京市中关村科技园区管理委员会、中关村科技园区海淀园管理委员会支持,是一场聚合了 AI 技术领袖和投资领袖的盛会。新智元向满怀雄心的未来AI独角兽提供强大的创投资源对接机会,顶级风投 TS 等你来拿。
点击文章下方阅读原文,atv,在线填写报名申请报名表。该报名表为参与评选必填资料。 如有更多介绍资料(例如BP等),可发送至 [email protected],邮件标题请注明公司名称。如有任何咨询问题,也欢迎向该邮箱发信联系。 大赛咨询,请添加新智元微信号: (责任编辑:本港台直播) |