编译:刘小芹 张易 零夏 新智元启动 2017 最新一轮大招聘:。 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元,与人工智能业界领袖携手改变世界。 简历投递:j[email protected] HR 微信:13552313024 【新智元导读】 谷歌研究院的官方博客最新介绍了一种基于神经网络的自拍卡通头像生成技术,可直接在谷歌的应用程序Allo上使用,目前只支持安卓。 自拍、欣赏自拍和分享自拍,已经成了许多人的日常习惯——在车上自拍,穿衣自拍,旅行自拍,起床也自拍。除了社交功能,给自我一个肖像长期以来一直是人类探索自我身份的重要手段。对于一些人来说,这是要弄清楚自己是谁的问题。对于另一些人来说,则是要如何塑造自我形象的问题。当然,直播,有时二者兼而有之。 自拍是非常直接的表达形式。它附带了一套由现实界定的规则。另一方面,它有助于人们界定自己——它比现实更温暖更无忧无虑。 今天,谷歌正在推出 Allo 的一项新功能,它结合了神经网络和艺术家的作品,可以将你的自拍转化成个性化的头像。你只需自拍一张照片,它就会即时自动生成头像的卡通版本,并带有自定义选项,可帮助你进一步个性化头像。
传统的将自拍像艺术化的计算机视觉方法是分析图像的像素,并通过查看像素值来凭借算法确定属性值,以决定颜色、形状或纹理。 然而,今天的人们无时无刻不在自拍,在各种照明条件下,摆着各种各样的姿势。虽然人类可以在各种照明条件下轻松地挑选和识别定性特征,比如眼睛颜色等等,但这对计算机来说是一项非常复杂的任务。 当人们看到眼睛的颜色时,它并不仅反映了蓝色或绿色的像素值,还要考虑周围的视觉环境。 为了解决这个问题,我们探索了如何使算法能够以类似于人类的方法那样挑选出定性特征,而不用传统的手工编码的方式来解释照明条件等等。虽然我们可以从头开始训练一个大规模的卷积神经网络来尝试做这件事,但是我们想知道是否有更有效的方法来获得结果,因为我们预计,学习将面部阐释为图像将是一个非常迭代的进程。 这让我们在Google现有的更通用的计算机视觉神经网络上进行了类似DeepDream的一些实验。我们发现,在这些网络数百万的神经元中,有几个非常容易专注于没有明确训练用来观察的东西,这些似乎对创造个性化贴纸有所帮助的东西。此外,由于是大型通用神经网络,他们已经弄清楚如何抽象出他们不需要的东西。所有要做的就是提供一个更少数量的人类标签的例子训练分类器来隔离神经网络已经知道的图像内容。 为了创造出一个有吸引力有识别度的图,我们与艺术团队一起创作了各种各样特色的插图。艺术家最初设计了一套发型,例如,他们认为是有代表性的,在人类的评价者的帮助下,我们使用这些发型来训练网络,将正确的图与正确的自拍相匹配。然后,我们让人类评估者根据输入图像判断贴纸输出,看看它的效果如何。在某些情况下,他们认为某些风格没有很好的表现出来,那么艺术家们创造了出更多的神经网络可以学会识别的图。
避免诡异之谷 在美学研究中有一个著名的问题叫“诡异之谷”(Uncanny Valley,或译“恐怖谷理论”),是说假如人类的复制品与真实的人类非常相似,但又不是完全一样,会令人反感。在机器学习中,假如计算机重现的你,和你自己以为的你对比起来,也会出现不相称的感觉。 我们的目的不是精确地复制一个人的外表,而是使用更低的分辨率的模式,例如表情符号或贴纸,这样返回的是一个不那么重现真实外表的形象,更多是打破表现规则的。
图:该团队与艺术家Lamar Abrams合作,设计出利用了超过563万亿种组合的表情头像。 将像素转变成艺术插图 (责任编辑:本港台直播) |