由于长期“哑巴英语”式的语言教育, 大部分以英语为第二语言的中国人一直都有着一个问题, 那就是擅长读写,却在不擅长口语。 但由于资源有限, 不是每一个有英语口语提升需求的人都能得到外教的一对一辅导。 针对这个问题,英语流利说的解决方法是 利用人工智能技术来帮助中国人提升自己的口语水平。
由于长期“哑巴英语”式的语言教育,大部分以英语为第二语言的中国人一直都有着一个问题,那就是擅长读写,却在不擅长口语。但由于资源有限,不是每一个有英语口语提升需求的人都能得到外教的一对一辅导。针对这个问题,英语流利说的解决方法是利用人工智能技术来帮助中国人提升自己的口语水平。 流利说成立于2012年,到目前这款产品已经获得了约3600万用户。流利说的主要功能是提供文本并让用户跟读,然后系统会根据用户的发音准确度给出评分和建议。流利说App上提供的素材涵盖了从日常对话到留学、面试等诸多场景,因此受到了大量英语学习者的追捧。
但这项根据指定文本跟读的产品并不是这么简单,它背后其实暗藏着流利说想要用机器学习技术帮助中国人整体提升英语水平的野心。 在接受PingWest品玩采访时,流利说首席科学家林晖表示,早在2012年公司刚刚成立时,这家公司就决定要在语言学习中利用机器学习技术。但由于创业公司在数据上的匮乏,而机器学习又需要大量的数据才能被训练得很智能,因此流利说决定先推出以上的跟读功能,收集中国人的口语语音数据。 经过了4年时间以及累计3600万用户的使用,现在流利说已经掌握了大量不同口语水平的中国人说英语的语音数据。而且由于这些语音是跟拟定文本结合在一起的,所以它们是一种带标签的数据,对机器学习系统来说更加宝贵。 根据流利说和新浪教育共同发布的《中国英语口语白皮书》,流利说目前已经收集了广泛的用户学习行为记录和长达2.75亿分钟、31.9亿句之多的庞大录音数据库。 到现在,流利说已经根据这些数据推出了两款服务型产品,分别是懂你英语和雅思流利说。其中懂你英语通过递归神经网络的深度学习模型,让流利说的自适应学习系统产生了自学习能力,让学生不断接触到相关性越来越高的学习内容。 另外,流利说刚刚上线的雅思流利说同样利用了被以上语音数据训练过的人工智能系统,帮助雅思备考生完成成绩评估和备考方案。由于雅思考试口语阶段评判上的主观性,雅思流利说能够准确地理解被测者的语义,从而给出一个相对客观的评分。 在上周PingWest 举办的 HAY!16 大会上,PingWest采访了流利说联合创始人兼首席科学家林晖,他向我们详细解释了流利说这款产品4年间的产品脉络:用工具积累数据,用社区沉淀用户,再用数据打造人工智能的口语学习服务,并实现商业化。
流利说主要团队成员,左一为林晖 林晖博士毕业于华盛顿大学西雅图分校,曾任 Google 美国总部研究科学家。他也是语音识别、自然语言处理、深度学习及大数据挖掘算法专家,曾在相关领域发表三十余篇国际论文,拥有多项中国及美国专利。 以下是采访实录: PW:能简单聊一下你的个人经历吗? 林晖:我2006年在华盛顿大学西雅图分校读了一个博士,研究的方向主要是机器学习,理论方面的一些研究,当时做了一些自然语言处理方面的应用。整体来说我从事这个领域大概十几年吧。在那之前我在清华做的也是技术方面的,当时我在电子系。那个时候MSRA也就是现在微软亚洲研究院刚刚建立,当时我还没有想好说是去工作还是出国,所以读了硕士,并且读硕期间正好有个机会在微软亚洲研究院实习了半年。 (责任编辑:本港台直播) |