提供足够的训练数据,自动编码器最终能学习重建原始图像。我需要这个网络完成的任务是,将戴着眼镜的图像作为输入,然后输出摘除了眼镜的图像。我使用了 TensorFlow 里一个卷积神经网络自动编码器的代码,作者是 Parag K. Mital,并且重新定义了期望输出(摘除眼镜的图像)和重构图像之间的差异的代价函数,但仍然将戴着眼镜的图像作为输入,训练该网络以执行这些计算。这样做意味着这个网络已经不再是自动编码器,而只是一个具有对称拓扑结构和线性层的卷积神经网络。
利用这种方法,我们做出了“iSee”应用,效果很好,当然,这是在对超参数进行仔细的调整后的效果。下图展示了该模型对三位 DITTO 员工的照片进行摘除眼镜测试的效果,这些照片没有包含在训练集中。可以看到,网络在摘除他们的眼镜后,能够修复他们脸上原本被眼镜遮盖的区域。网络也能去除在图像上的大小、位置等不同的眼镜。与前人研究的方法相比,iSee 的方法可以用于不同脸部结构、不同肤色的人脸,只要训练数据中提供有相似的面孔即可。
iSee 摘除眼镜测试,超参数优化后的效果 预处理和超参数优化
超参数优化前的效果 最初处理后的图像并不是很清晰,这是由于参数和权重的限制造成的,需要对图像进行预处理和超参数优化,对卷积层和滤波器的要求也相应提高。超参数优化是一个相当耗时的过程,将卷积滤波器从2*2提高到3*3就可以极大地提高眼镜摘除效果。这里 Runfeldt 采用的方法是,降低取样、减少批处理量、手动调节参数。采用仅识别眼镜部分图像的方法进行图像预处理,这就避免了对整个图像和背景处理的繁琐程序。 结论 iSee 在会上展出时,在场的专家都非常震惊,一个业界新手竟能将深度学习应用到如此境地。我们知道深度学习其实是一门应用科学,iSee 的发明就证明了这一点,也是受了相应的启发:集成数据可以用于训练神经网络,识别并去除图像中的抽象物体。深度学习的应用还很广泛,我们期待 iSee 可以应用到更多的应用中。科技的大门是敞开的,而工具就在那里,等着未来的数据科学家、工程师们去创造更多的奇迹。 编译来源:https://blog.insightdatascience.com/isee-removing-eyeglasses-from-faces-using-deep-learning-d4e7d935376f#.yj2qlzo5k 新智元招聘 职位 运营总监 职位年薪:36- 50万(工资+奖金) 工作地点:北京-海淀区 所属部门:运营部 汇报对象:COO 下属人数:2人 年龄要求:25 岁 至 35 岁 性别要求:不限 工作年限:3 年以上 语 言:英语6级(海外留学背景优先) 职位描述 负责大型会展赞助商及参展商拓展、挖掘潜在客户等工作,人工智能及机器人产业方向 擅长开拓市场,并与潜在客户建立良好的人际关系 深度了解人工智能及机器人产业及相关市场状况,随时掌握市场动态 主动协调部门之间项目合作,组织好跨部门间的合作,具备良好的影响力 带领团队完成营业额目标,并监控管理项目状况 负责公司平台运营方面的战略计划、合作计划的制定与实施 岗位要求 大学本科以上学历,硕士优先,要求有较高英语沟通能力 3年以上商务拓展经验,有团队管理经验,熟悉商务部门整体管理工作 对传统全案公关、传统整合传播整体方案、策略性整体方案有深邃见解 具有敏锐的市场洞察力和精确的客户分析能力、较强的团队统筹管理能力 (责任编辑:本港台直播) |