本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】iSee:深度学习“摘眼镜”,用集成数据训练神经网络识别抽象物体

时间:2016-11-27 05:34来源:118论坛 作者:118开奖 点击:
:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j [email protected] HR 微信: 13552313024 新智元为COO和执行总编提供

  :COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。

  简历投递:j[email protected]

  HR 微信:13552313024

  新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和金。

  加盟新智元,与人工智能业界领袖携手改变世界。

  【新智元导读】Saleforce Einstein 的机器学习工程师 Melissa Runfeldt 开发了一款可以摘除眼镜的深度学习应用方法——iSee,效果非常自然。深度学习的应用非常广泛,这个有趣的应用证明集成数据可以用于训练神经网络,识别并去除图像中的抽象物体。

  2016 夏季硅谷数据科学大会上,就职于 Saleforce Einstein 的机器学习工程师 Melissa Runfeldt 展出了自己的研究成果,她开发了一款可以摘除眼镜的深度学习应用方法——iSee。

  戴眼镜的朋友们应该都不陌生,到眼镜店挑眼镜要花多少时间。10分钟甚至30分钟,都很正常,不着急的话,甚至挑上一个小时也是有可能的。过程无非是,戴上一个之后,侧头、微笑、左看看右看看,再拿下一副试试。挑上一副好眼镜非常重要,有科学研究表明,带什么样的眼镜会影响别人对自己的看法,包括一个人的学识、事业、魅力。

  

报码:【j2开奖】iSee:深度学习“摘眼镜”,用集成数据训练神经网络识别抽象物体

  2016年是创新的一年,急需一种技术去解决挑选眼镜这样的问题。DITTO开发的虚拟镜像(virtual mirror),让用户在家里就可以完成挑选眼镜的繁琐过程,将人脸对准方框,左看右看,选择出最适合自己风格和性格的眼镜。当然,这个技术还有一个小问题,使用产品时需要将眼镜取下,而对于近视的人来说,取下眼镜之后可能根本看不清这个方框。

  如果有一种软件可以帮我们自动试眼镜,那该多好!可以想象,到一个眼镜店里用虚拟镜像实时换试眼镜是多么棒的一种体验。

  技术背景

  其实目前市场上实现去除人脸图像眼镜并不是一个新鲜的话题。大量科学文献记载了各种图像处理算法的研究,这些研究的目的通常是改进人脸识别技术。这些技术一般都采用严格的数学方法,如对照、切边、叠合等(contrast, edges, and congruency)进行图像处理,简单地说,识别并分散眼镜图像的像素,再对模糊了的部分进行光滑处理,修复人脸图像。这种算法虽然还不错,但在眼镜识别和人脸修复的方面还有待改善。还需要增加适应不同肤色的应用,提高阴影修复、放大修复、和镜框镜片反光修复功能。

  最近,算法、开源代和开源工具、GPU计算方面的突破发展,给深度学习在更多领域的应用打开了大门。深度学习的强大之处在于,不需要基于你的任务的重要特性对算法进行设计和优化,只需提供样本,神经网络就能识别相关特征并加权。也就是说,不需要设计一个算法来识别眼镜,再设计一个来将眼镜摘除,还要设计一个来进行面部修复。只需简单地训练一个神经网络,让它来完成上述所有过程。

  iSee——镜中镜 ( the mirror within the mirror

  深度学习最重要的就是需要大量的准确数据,以及可以处理这些数据的硬件设备。我们使用Nvidia Tesla K40显卡的计算机。在数据方面,DITTO 提供了一个非常独特的数据集:上千张戴眼镜的人的照片(需要指出的是,这些照片都是 DITTO 雇员的,而非他们的用户)。通过接入 DITTO 的 API,以及他们 20000 多用户的 ID,我使用它们的技术将眼镜投影到每个人的脸上,atv直播,建成了一个非常大的标记数据集。接下来只需训练一个神经网络来摘除这些眼镜。

  

报码:【j2开奖】iSee:深度学习“摘眼镜”,用集成数据训练神经网络识别抽象物体

  虽然我知道卷积神经网络是识别诸如眼镜之类的抽象物体的最佳选择,而且卷积神经网络对空间变化较为鲁棒。但我不清楚它对摘除眼镜,尤其是修复面容的效果。我的灵感来源于使用卷积神经网络作为自动编器的概念。

  自动编码器是训练来重构输入的网络,在我们的情况下即是重构图像,j2直播,网络将输入的相关特征压缩到较低维的空间(下图标示的“z”)。用于反向传播的代价函数(cost function)是输入图像和输出的重建图像之间的均方误差(MSE)。该方法的图示如下:

  

报码:【j2开奖】iSee:深度学习“摘眼镜”,用集成数据训练神经网络识别抽象物体

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容