智东西(公众号:zhidxcom) 文 | 四月 漠影 智东西11月23日消息,国内人工智能领域公司科大讯飞推出了多款基于语音技术的人工智能产品,也晒了不少数据和成绩单。 其中,科大讯飞的服务机器人晓曼将于明年3月份量产推出。可以看到,科大讯飞除了将语音技术在输入法、音频等基本场景的应用,还延伸到了教育、汽车、电视等细分的行业领域,每个领域都有针对性的产品。 随着人工智能的兴起,科大讯飞在语音基础技术方面的优势开始体现,科大讯飞轮值总裁胡郁详细解读了7个方向的技术和产品,智东西随后对胡郁和科大讯飞高级副总裁江涛进行了对话,对科大讯飞在人工智能背后的布局和想法有了更深入的认知。 现场,科大讯飞董事长刘庆峰公布的数据显示,科大讯飞的语音云平台用户数据在近一年内实现了较大增幅,每天使用人数达到30亿次。在全球范围内的多次智能语音测试项目中获得不少奖项,英语、汉语的语音识别技术已经处于全球领先水平。 一、秀肌肉:多语言同声速记 回顾近一年的发展,科大讯飞轮值总裁胡郁拿出了飞语音输入法、讯飞超脑、讯飞云平台、AIUI等现有产品的延伸和进化,并推出飞鱼助理、晓曼机器人、配音阁等新应用和产品。 1、明星产品:讯飞语音输入法 此前,罗永浩在锤子M1的发布会上的一轮推广,让讯飞的语音输入法深入人心。具体成绩包括:每分钟可输入400个字,成功率97%,超过4亿用户。 虽然已达4亿用户,但科大讯飞并没有止于手机移动端。通过与电视等智能家居设备的结合,并引入离线手写语音引擎,科大讯飞利用语音输入在家庭场景得到延伸。 活动现场,科大讯飞的产品经理翟积薄在一块电视面板前,演示了手势悬空操控,手写扫描字体,并通过用语音实现文字修改,汉转英翻译,加书名号标点等命令操作。在语音输入的基础上,加入手写功能,能够让机器对某些确定性命令进行更准确的识别。 2、惊艳现场:同屏速记和翻译 发布会全程,位于前台两块显示屏同步显示了台上嘉宾的发言内容,十分亮眼。除了由语音到汉字的速记功能,还包括英语、维语的同步翻译。据胡郁介绍,语音同步速记功能自去年底发布后,主要实现了三大进展: 1)准确率和反应速度进一步提升。 2)推出更加安全的离线系统,在线版的准确率97%,离线单机版的准确率达到95%。主要针对涉及到隐私和安全的语音内容,上传到网上云端处理可能存在安全隐患。 3)在细分行业领域的落地,包括在医疗、司法机构等。在庭审场景,案件处理效率可提升30%。 此外,科大讯飞还推出了专业的工控机、针对速记的笔记本电脑等硬件设备。据介绍,产品已经在国务院办公厅,中央宣传部等部门使用。 3、翻译场景:自动化的“同传设备” 这是一款同手机大小的产品,可实现中、英、维语三种语音的即时互译,类似一款自动化的同传设备。活动现场,中、外两位嘉宾进行了跨语种的对话,双方各手持一台翻译机,实现了中外两种语音的的实时互译和交流。胡郁介绍,该产品可推广到出国旅行等场景。安徽省的援疆干部现在已经用于和维族同胞交流。 二、语音AI如何穿透四大行业 除去围绕语音技术常见的场景应用,科大讯飞针对智能家居、车载、银行、教育等细分领域进行了技术延伸和产品落地。 1、AIUI系统在智能家居的落地:电视 针对大多数智能家居产品大且闲置率较高的情况,科大讯飞在去年推出的AIUI系统主要针对客厅入口电视进行了落地,出货量和受众群更广。在遥控器中植入第三代语音芯片,提供语音交互和按键的双控制解决方案。 (责任编辑:本港台直播) |