新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 【新智元导读】在日前接受新智元专访时,计算机视觉领域大牛李飞飞曾表示,在计算机视觉领域还有很多的没有解决的问题,其中就包括视频处理。现在处理视频基本上是平的,图片怎么处理就怎么处理视频,把视频分为 N 张图片串起来。但实际上,视频是很深奥的,涉及对运动、行为、因果关系、动态、预期、代理这些因素的理解。本文中,微软亚洲研究院首席研究员、网络媒体组和媒体计算组负责人曾文军,回顾视频数据分析理解的发展历程和应用场景,梳理了技术难点并对未来技术发展进行展望。 【作者简介】曾文军,微软亚洲研究院首席研究员,网络媒体组和媒体计算组负责人,IEEE Fellow,密苏里大学,西安交大,天津大学等多所学校博士导师。1990年毕业于清华大学,1993年和1997年分别获圣母大学和普林斯顿大学硕士和博士学位。先后在松下技术, 贝尔实验室, 夏普实验室,PacketVideo等公司工作。2003-2016任密苏里大学终身教授。他对国际标准(ISO MPEG、 JPEG2000和OMA)发展作出重大贡献。他目前负责微软亚洲研究院视频分析和理解的研发,为微软认知服务和 Azure 媒体分析服务提供技术。他是多个IEEE期刊和杂志的副主编。担任多个IEEE会议(例如,ICME’2018, ICIP’2017, ChinaSIP’2015,WIFS’2013,ICME'2009)大会共同主席或技术程序委员会主席。 看过电影《速度与激情7》(Fast & Furious 7) 的人都会对里面展示的天眼系统留下深刻的印象。通过一个全球联网的智能监控摄像头系统,天眼可以随时随地了解任何一个人或物体的行踪。这既是一个对目前如日中天的人工智能系统的理想展现,也极大地突出了智能视频系统在人工智能应用中的特殊地位。
是的, 人工智能离不开感知,而视觉是我们最主要的感知。据研究估计,人的感知、学习、认知和活动有80-85%是通过视觉介导的。如果不能获取并处理视觉信息, 就没法研究真实世界的人工智能,可见计算机视觉对人工智能发展的重要性。 现在,视频数据已占 Internet 在线流量的70%多,可谓大数据时代最大的数据。随着各种摄像头的普及,视频数据正记载着物理世界发生的一切,让机器帮助分析理解视频大数据就成了我们观察了解物理世界的一条捷径。但视频数据不但量大,还包含千变万化的内容,分析理解并不是件易事。下面我们就来探讨一下视频数据分析理解的应用场景和技术要求、技术发展现状和瓶颈,以及对未来技术发展的展望。 广阔的应用空间 视频数据已渗透到人类日常生活的方方面面,视频分析的应用也因此是多方面的, 包括居家、企业、零售、公共安全、交通、医疗、制造等。下面讨论几个目前主要的市场,感受一下它的重要性。 1. 家居安防。预计到 2020年,全球家居安防解决方案市场将以8.7%的复合年增长率增长到475 亿美元[1]。 这迅速增长背后的主要原因可能是令人震惊的全球犯罪率的不断增长和社会各界对安全措施的关注和担忧。这个市场和视觉系统相关的技术要求包括运动检测、人的检测与识别、动作行为识别、视频摘要、 物体标注等。一般要求实时处理。 2. 零售分析。预计到 2020年,零售分析市场规模将以18.9%的复合年增长率增长到 51 亿美元[2]。零售分析解决方案帮助零售行业在全球各地通过创建个性化的购物体验,提高顾客的忠诚度。这方面和视觉系统相关的技术要求包括人的检测、计数与识别、人的属性(年龄,性别,表情,注意力)和行为检测、物体的检测与跟踪等。有些功能要求实时处理,有些功能可以离线处理。 (责任编辑:本港台直播) |