于是,我们得到三个可能的转录:“hello”,“Hullo”和“Aullo”。如果你大声读出来,这几个声音都和“hello”相似。因为神经网络一次预测一个字符,atv,因此会得出这些试探性的转录。例如,如果你说“He would not go”,它可能转录为“He wud net go”。 解决办法是根据文本(书籍、新闻报道等)数据库,对这些基于发音的预测进行打分。初步输出的转录可能与音频的真实语义相差很远,但经过处理后能得到最接近的转录文本。 在神经网络得出的可能的转录“Hello”,“Hullo”和“Aullo”中,显然“Hello”出现在文本数据库中的频率更高(更不用说在原始的音频训练数据中的频率),因此“Hello”更可能是正确的。所以我们选择将“Hello”作为最后的转录结果。 你可能会想“但是,如果有人真的说了‘hullo’呢?这是一个有效的词,但机器转录成‘hello’是错误的!”
当然可能有人说“hullo”,而不是“hello”。语音识别系统(用美式英语数据训练)基本上永远不会产生“hullo”的转录。只是这是可能性很低的情况,不管你说“hullo”时多么强调‘U’的发音,系统总是会认为你在说“hello”。 这就是为什么这些语音识别模型总是需要用更多的数据进行大量的训练,以更好的处理这些极端情况。 原文:https://medium.com/@ageitgey/machine-learning-is-fun-part-6-how-to-do-speech-recognition-with-deep-learning-28293c162f7a#.p0lln4o9d 新智元招聘 职位 运营总监 职位年薪:36- 50万(工资+奖金) 工作地点:北京-海淀区 所属部门:运营部 汇报对象:COO 下属人数:2人 年龄要求:25 岁 至 35 岁 性别要求:不限 工作年限:3 年以上 语 言:英语6级(海外留学背景优先) 职位描述 负责大型会展赞助商及参展商拓展、挖掘潜在客户等工作,人工智能及机器人产业方向 擅长开拓市场,并与潜在客户建立良好的人际关系 深度了解人工智能及机器人产业及相关市场状况,随时掌握市场动态 主动协调部门之间项目合作,组织好跨部门间的合作,具备良好的影响力 带领团队完成营业额目标,并监控管理项目状况 负责公司平台运营方面的战略计划、合作计划的制定与实施 岗位要求 大学本科以上学历,硕士优先,要求有较高英语沟通能力 3年以上商务拓展经验,有团队管理经验,熟悉商务部门整体管理工作 对传统全案公关、传统整合传播整体方案、策略性整体方案有深邃见解 具有敏锐的市场洞察力和精确的客户分析能力、较强的团队统筹管理能力 (责任编辑:本港台直播) |