为了有效控制字符切分和识别后处理的错误传播效应,实现端到端文字识别的可训练性,我们采用如下图所示的序列学习框架。框架整体分为三层:卷积层,递归层和翻译层。其中卷积层提特征,递归层既学习特征序列中字符特征的先后关系,又学习字符的先后关系,翻译层实现对时间序列分类结果的解码。 由于序列学习框架对训练样本的数量和分布要求较高,我们采用了真实样本+合成样本的方式。真实样本以美团点评业务来源(例如菜单、身份证、营业执照)为主,合成样本则考虑了字体、形变、模糊、噪声、背景等因素。基于上述序列学习框架和训练数据,在多种场景的文字识别上都有较大幅度的性能提升,如下图所示。 写在最后 本文主要以深度学习在自然语言处理、图像处理两个领域的应用为例进行了介绍,但深度学习在美团点评可能发挥的价值远远不限于此。未来,我们将继续在各个场景深入挖掘,比如在智能交互、配送调度、智能运营等,在美团点评产品的智能化道路上贡献一份力量。 作者简介 文竹,美团点评美团平台与酒旅事业群智能技术中心负责人,2010年从清华硕士毕业后,加入百度,先后从事机器翻译的研发及多个技术团队的管理工作。2015年4月加入美团,负责智能技术中心的管理工作,致力于推动自然语言处理、图像处理、机器学习、用户画像等技术在公司业务上的落地。 李彪,美团点评美团平台及酒旅事业群NLP技术负责人,曾就职搜狗、百度。2015年加入美团点评,致力于NLP技术积累和业务的落地,负责的工作包括深度学习平台和模型,文本分析在搜索、广告、推荐等业务上应用,智能客服和交互。 晓明,美团点评平台及酒旅事业群图像技术负责人,曾就职于三星研究院。2015年加入美团点评,主要致力于图像识别技术的积累和业务落地,作为技术负责人主导了图像机审、首图优选和OCR等项目的上线,推进了美团产品的智能化体验和人力成本的节省。 华南地区技术大事件 Facebook工程总监 :Facebook如何进行大型软件开发? 腾讯运维总监:腾讯十年运维积累的四大创新技术如何落地? 阿里巴巴安全部首席架构师:如何从多个维度剖析对抗架构设计的复杂性? …… 100+前沿技术案例将汇聚深圳,架构师应该把握哪些技术趋势?ArchSummit全球架构师峰会7月开启,点击 「 阅读原文 」了解更多大会内容,即刻报名华南地区的技术大事件,尽享8折优惠。 (责任编辑:本港台直播) |