手势识别和语音识别都是人工智能的前沿技术在人机交互领域的应用。两者也各有特点:手是天生用以使用工具的,用户在使用过程中更习惯使用手下达指令,在驾驶环境中,手势操控具有安全、易学、有趣的特点;语音识别更适合在驾驶场景下的文字信息输入,例如“我要去天安门”,或是“我要去加油站”等,手势识别解决方案中,手势识别与语音识别不再是竞争的关系,两者相辅相成,形成更加贴近自然的人机交互方式。 我近期接触的天津“锋时互动科技”是一家手势识别产品供应商和解决方案服务商,提供手势识别单目、双目板卡系列产品。2011年,锋时互动推出双目嵌入式手势识别产品微动Vidoo,2014年先后成立了北京、深圳研发中心,技术服务和研发团队先后完成了无屏触控技术、人脸手势识别板卡一体化等多个重点项目和客户定制化项目,产品覆盖Windows、Android、Linux、Win CE、Qnx等多种操作系统,涵盖智能家居、智能终端、车载电子等领域,2015年,锋时互动成立HMI设计部门,HMI设计方向涵盖手势识别、动作设计、视觉反馈、音效反馈、UI设计、智能语音控制等。至2017年初,团队先后完成了数十个HMI设计项目,覆盖虚拟现实、增强现实、智能终端、车载电子等多个行业。 在上海车展期间,锋时互动科技又推出了“微动Vdrive”车载手势识别解决方案,是基于既有的微动Vidoo手势识别系列产品在汽车领域做出的新尝试。 算法层面:通过机器学习、深度学习等技术,j2直播,针对驾驶场景和车机娱乐系统的基础功能进行了优化; 硬件方面:满足车规级别的需要; 视觉方面:结合手势的动作设计,订制对应的车机界面,加强交互反馈,提高手势操控体验。 据“微动Vdrive”介绍,其车载手势识别解决方案实现了传感器定制到UI人机交互界面设计闭环。从功能需求出发,进行算法优化裁剪,生成定制化方案;制定硬件通信接口与通信协议;进行了标准化动作指令设计、UI设计、操作反馈设计。 具体来说,微动 Vdrive 车载手势识别解决方案中,采用120Hz高频双目深度传感器,配有SOC架构FPGA芯片。全部图形图像、人工智能算法均在Vdrive内部完成,与上位车机进行指令级通信。支持I?2;C、Uart、USB等物理接口;为WinCE、Linux、Qnx、Android等多种嵌入式操作系统提供BSP支持包。这种设计在保持了Vdrive的低耦合度的同时,降低了手势识别算法对于车机整体性能的要求。采用近红外LED光源补光,不受外界光环境影响,可夜间使用。
微动Vdrive具体功能一览 当前“微动Vdrive”车载手势识别解决方案已基本涵盖传统车机的高频次交互功能。
在解决方案方面,其采用了基于视觉的多角度成像深度技术(Multi-camera Depth Tech),atv,其原理是将不同角度的固定摄像头得到的图像或视频流进行比对,根据摄像头的角度偏差和图像之间的差值,计算出目标物体到摄像头中心的距离。微动Vidoo通过内置在产品当中的两个定制光路摄像头采集手部图像信息,通过上述算法可以判断出手部的不同姿态信息(Hand Posture)和不同手指的三维位置信息(3D Position)及其运动轨迹( Motion Trail),再将之对应到相应的控制命令之上。用户不需要使用者穿戴任何辅助设备即可完成手势操控。
在手势识别的种类及精度方面,共有以下几个标准: 底层识别精度 ≤1mm 微动Vidoo通过底层算法可以对手部五指指尖、手掌中心进行精确的定位,从而得到手部的位置、朝向和速度信息。这些基础信息都将作为动作指令判断的依据;亦可通过这些基础数据将动作指令划分为更细分的状态,从而实现更高的操作准确率,以及实时的状态反馈。 手部姿态指令识别 ≥95% 微动Vidoo可以通过手部形状判断当前手型。下图列举了可加以辨认的16种常用手势姿态:
手部动作指令识别 ≥98% 可以通过记录手部一段时间的动作,辨别动态手势。目前支持的手势包括:开合open 、指戳 poke、敲击 tap、拍打 pat 、划动 swipe、挥动 wave、绕圈 circle、悬停 hold等。
防止误触 通过HMI的动作设计环节以及底层的基础数据分析,可以明确区分用户是有意进行手势操作指令的下达还是不经意的无意识动作。 (责任编辑:本港台直播) |