SenseFace视频监控中的大规模人脸识别技术,可在光照、角度、表情、遮挡、年龄变化等情况下保持超高的识别准确率,在千万级人员库中300ms内获得比对结果,让城市安防领域建设迅速取得突破 在SenseFace的一旁,则是能够实现人、非机动车和机动车检测和跟踪的SenseVideo。借助来自于大数据的支持,它可以检测出行人的性别、年龄、衣服款式、颜色,是否背包、带帽、戴口罩等等;针对车辆则可以辨别颜色、车型、车牌,开奖,甚至车款。它不需要人工记录,便能够逐一记录街道上过往的行人车辆,因而打造数字化智能分析系统,这毫无疑问代表了未来智慧交通的发展方向。 SenseVideo视频结构化系统是智慧城市建设的关键,其拥有行人检测、车辆检测、车辆分类等多种技术,为路面状况动态分析、车流密集地段识别、街面安全时段分析提供强大助力 AI技术正在一点一滴地渗透我们的生活,AI实践者通过对我们生活细节的感知和把握,用AI突破传统,并将AI融入其中。AI引领的智慧未来,对我们个人、周围环境的影响,将逐渐从有形进化到无形。技术的最佳存在形式,就是感受不到技术的存在。 演讲:商汤科技AI的“未来视野” 商汤科技的展台,揭示了我们所能看到的AI应用方向,但对于真正的AI实践者而言,这还远远不够。徐立博士在2017 GPU技术大会上的演讲,虽然仍然围绕SenseVideo、SensePose等具体技术和产品展开,但仔细思考,就能感受到专家们对AI技术应用方式的理解。 商汤科技联合创始人、CEO徐立博士演讲的核心观点之一:AI正在重构世界 首先是SenseVideo,尽管机器可以看懂行人和车辆的属性,但想要进行检索,只能输入特定的语义标签。我们无法和机器像人一样用“语言”进行沟通。这就使得SenseVideo和自然语言处理(NLP)技术的结合,显得意义十足。 “他穿着黑色的人字拖,带有白色条纹的黑色短裤,短袖圆领衬衫,还背着一个黑色的背包”。这句话听起来,更像是警察对犯罪嫌疑人的描述,但很快,警察们就不需要再靠自己查找,他们直接将这句话输入到计算机,通过NLP提取目标信息,然后由机器视觉技术,在海量的视频中进行匹配,从而锁定嫌疑人的踪迹。 视频结构化系统未来可以和自然语言处理技术相结合,以更加直观的语义描述,更便捷地找出符合特征的目标人物 至于SensePose,徐立博士的举例,不禁让人感到强烈的“发散性”思维,你会惊呼AI技术还能这样混搭运用。 当我们想要观察两个人的关系时,可以从他们之间的动作和表情入手。两个人相拥时,可以描述为“Warm(温暖)”,两人手舞足蹈争吵时,可以描述为“Competitive(竞争)”。而将动作估计和人脸关系预测技术相结合,就可以实现这种关系特征的预测。那么这样的技术,该如何应用呢? 动作估计技术未来可与人脸预测技术相结合,用于描述视频中人物关系或人物状态,实现视频内容的理解和分析,机器将懂得人类情感 徐立博士给出的答案是——视频分析。他现场演示了一段日常生活场景中两人对话的视频。关系特征预测系统可以根据画面内容,实时分析两人是“Friendly(友好)”还是“Competitive(竞争)”,并形成描绘关系可能性的变化曲线。 一旦这项技术大规模应用于影视行业,将实现自动化的全影片内容属性分析。比如在《泰坦尼克号》中,分析romance(浪漫)的部分和dystopia(反乌托邦)的部分,就可以建立针对每一部电影影片的内容类型库。试想,当这项技术再结合语音识别和NLP后,用户就真的可以对着电视说“给我放最浪漫的那段”了。 很难让人想到,人工智能让人类情感中最难以描述的“浪漫”也能用数据表达出来 (责任编辑:本港台直播) |