本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围(2)

时间:2017-04-08 21:35来源:118图库 作者:118开奖 点击:
据介绍,百度基于真实用户图像检索场景的图像检索数据,构建了覆盖了多种真实的图像扰动大规模图像匹配训练集合。利用神经网络训练进行监督训练得

  据介绍,百度基于真实用户图像检索场景的图像检索数据,构建了覆盖了多种真实的图像扰动大规模图像匹配训练集合。利用神经网络训练进行监督训练得到图像局部特征表示模型,该模型可以提取鲁棒的低维图像特征表示。 基于该模型,百度实现了百亿规模的互联网图像的快速检索。

  挑战二:找“女儿”(隔代识别)技术原理

  

报码:【j2开奖】林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围

  嘉宾在40张父母合照中随机挑选一张,选手和小度同时观察该照片,在40位造型一致,身材接近的女生中,找到该父母的亲生女儿,找出的女儿手中全家福照片与父母合照背面的全家福完全一致,则挑战成功。

  人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术。

  这项挑战所涉及的“隔代识别”仍属于图像识别分类中的人脸识别,只是难度更大。隔代识别技术原理与人脸识别相同:形成灰度图,分别提取父母面部的特征点和孩子的特征点进行比对。

  这项挑战的难点有几个:

  首先,计算机需要从图像中识别出人脸。计算机需要识别并去除脸部周围的多余像素,如用椭圆遮罩,只显示内部的人脸区域而不是头发或图片背景,因为头发或背景的变化往往多于脸部区域。

  其次,外在因素影响孩子的容貌,曾加识别难度。先天的脸型随着后天的生活状态、社会环境、个人经历的不同,也会发生较大的变化,甚至有整形的可能。也就是说,孩子离开父母很久的话,可能会朝着一个完全未知的方向去变化。

  最后,遗传的不确定性。父母长相和孩子长相的相似性是不确定的,隔代人的面部特征有很大的差别,例如父母都是大眼睛,孩子却很有可能是小眼睛。给机器的干扰项要比有效信息项多。虽然可以通过机器学习和算法优化解决,但让机器排除干扰完成这个任务,仍然面临很大的挑战。

  据百度方面介绍,在参加完前三期的《最强大脑》之后,百度大脑跨年龄人脸识别的能力飞速升级,现在已经成为一项可以稳定运用、服务社会的新技术。

  挑战三:永不消逝的电波(声纹识别)技术原理

  

报码:【j2开奖】林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围

  上面的图是比赛的实例解析,下面则是比赛原理还原(都来自林元庆演讲PPT)。

  

报码:【j2开奖】林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围

  本次比赛对机器来说考的是声纹识别。

  声纹识别和语音识别一样,都是通过对采集到的语音信号进行分析和处理,提取相应的特征或建立相应的模型,然后据此做出判断。两者不同的地方在于,语音识别是让机器听懂我们说的是什么,而声纹识别则是判断给定的一句话到底是谁说的。

  声纹识别的理论基础是“每个人的说话特性都具有其独特的特征”,这主要是由生理构造(比如咽喉、鼻腔、口腔以及胸腔的形状、尺寸和位置),以及发声的操作方式决定的。正常说话时的声纹状态还是相对稳定的。但是,声纹特性仍然具有易变性,容易受身体状况、年龄、情绪等情况的干扰。

  

报码:【j2开奖】林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围

  声纹识别从任务上来说,主要分为声纹确认技术(1:1)和声纹识别技术(1:N)两类。声纹确认技术回答的是两句话到底是不是一个人说的问题,而声纹识别技术回答的则是”给定的一句话属于样本库中谁说的”问题。

  在本次挑战中,小度需要识别出一段笑声是谁发出的。技术上主要难点包括:

  1. 泛化能力衡量一个机器学习算法好坏的一个重要指标,就是机器能够处理学习时没有遇见过的样本的能力,也即”泛化能力”。传统声纹识别任务,注册和测试是非常匹配的,即注册采用正常说话,测试也是正常说话。而在本次比赛中,注册的语音则变成了唱歌,测试的才是正常说话。因此,模型必须能够学到同一个人在唱歌和说话时的差异。这对声纹识别算法的泛化能力提出了更高的要求。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容