【AI创新者】是CSDN人工智能频道精心打造的专栏,本期主人公是小蚁科技首席架构师,张骏峰。 记者:王艺 更多【AI创新者】征集中,采写AI领域杰出学者、资深专家、技术缔造者、顶尖团队。寻求报道请邮件[email protected],或扫描文末二维码加我微信。 张骏峰,小蚁科技首席架构师,负责小蚁AI图像相关算法架构。主要包括:小蚁智能摄像机的智能报警服务、小蚁智能行车记录仪的辅助驾驶ADAS服务、小蚁运动相机App的图像风格迁移技术以及小蚁微单App的图像视频编辑技术。其团队包括移动开发、前端、后台、算法,成员分布在北京及以色列。张骏峰于2015年加入小蚁,此前,张就职于微软长达14年,参与过Windows, .Net Framework, MSN, Office, Lync, Skype等产品的研发工作。 小蚁科技成立于2013年,是一家年轻的互联网硬件企业。小蚁专注探索智能、可穿戴、移动化的新型视频类智能电子产品的开发,产品包括小蚁智能摄像机系列、小蚁行车记录仪系列、小蚁运动相机系列、小蚁微单相机等智能硬件产品,以及和谷歌合作的YI Jump 360°3D VR拍摄设备。同时,小蚁还有一系列的移动应用和服务,帮助用户更好地使用小蚁设备。 CSDN:骏峰您好,小蚁的产品主打视觉。那么首先请您向大家介绍一下,在小蚁智能摄像机上,与AI相关的技术有哪些? 张骏峰:我们在小蚁智能摄像机上提供了多种智能服务。 智能报警 大部分的智能摄像机都提供移动侦测服务。当摄像机检测到画面有大幅变动的时候,服务器会向用户推送一条报警消息。 小蚁智能摄像机提供了同样的服务,同时,在报警的时候,向服务器上传了一张图片,和一段6秒钟的视频。这样即使有人把摄像机拿走了,用户还是可以看到发生了什么事。 传统的移动侦测方案,灵敏度是一个很难解决的问题。如果灵敏度太高,用户会收到过多的无效报警,可能会错过重要信息。如果灵敏度太低,会有重要事件发现而用户收不到报警的情况。我们提供了一个拉杆,用户可以在高,中,低灵敏度选择。 我们还提供了一种人形检测的升级方案。当用户把这个升级方案的开关打开后,如果检测到画面有大幅改动,摄像机会继续对画面进行进一步检测,只有在摄像机认为画面中有人,才会通知服务器给用户推送报警信息。这样可以大大减少误报的情况。 小蚁智能摄像机还提供了宝宝哭声检测。如果摄像机检测到持续的宝宝哭声,也会向用户推送报警。 手势识别 小蚁智能摄像机还提供了手势识别功能。当用户在摄像机面前做出“摊开手掌-然后握拳”的组合动作时,摄像机会自动录制10秒视频,推送给手机App用户。我家小孩特别喜欢这个功能,有事没事他就会试一下这个功能,然后给我表演一段僵尸舞。 选择“摊开手掌-然后握拳”这样一个组合,是为了减少误触发。 我们还在研究其他AI技术,比如人脸检测,人脸识别,物体识别,如何经济实惠地让这些新技术给用户带来价值。 CSDN:除智能摄像机之外,小蚁也发售行车记录仪。那么在小蚁行车记录仪上,与AI相关的技术有哪些? 张骏峰:我们在小蚁行车记录仪上为用户提供ADAS智能安全提醒系统,有效提供安全提醒并实时纠正驾驶行为。主要是两个功能:车道偏移预警,前车距离监测 车道偏移预警 当车辆在高速上行驶时,如果行车记录仪检测到车辆偏移道路时,会提醒用户车辆已经偏移道路。 前车距离监测 行车时,如果行车记录仪检测到离前车距离越来越近,超过一定阈值时,会提醒用户注意保持车辆距离。 CSDN:在上述两种产品的模型训练过程中,训练集与测试集从何而来,采用何种网络及框架,在系统调优方面有何技巧? 张骏峰:开源的数据集和开源代码提供了基础的训练集和测试集。 但是这样的数据集训练出来的模型,放在小蚁的产品上,出来的效果不是很满意。 我们是有一批内测摄像头,免费送给用户。用户看到有意思的情况,分享给我们。内测用户很多是小蚁员工。我们根据用户提供的数据,调整模型,更新算法。 在实际产品上,我们采用的是一种“端+云”的混合方式。端上先做一部分筛选,云上再做进一步的处理。 限于硬件的计算能力,端上目前是用传统方法处理。 云上,我们现在使用的是YOLO模型,基于我们自己的情况,做了一些优化。 CSDN:您认为图像分割、物体识别、目标跟踪这一系列技术的难点在哪里? 张骏峰:我们遇到的困难主要有两点:1.数据,2.优化。 数据 (责任编辑:本港台直播) |