7月5日,一场全球开发者的狂欢 “Baidu Create 2017” 将于北京国家会议中心启幕,atv,届时预计将有近5000名开发者和生态合作伙伴参与此次大会。而作为本次大会的主办者,百度当然也为大家提供了与自家AI科学家切磋交流的大好机会。 先来剧透一下: 远场语音识别与唤醒:李先刚 为了解决当代人类生活第一大痛点:懒 :) ,许多阅读类App都希望可以解放用户的手和眼,让用户可以利用碎片化时间,像听音乐一样的去听书。但最常见的就是听起来不太像“人话”……在与机器进行语音交谈时,人们都更倾向于希望机器的声音有一定的语调和情感,这样比起那些机械、一字一顿的机器声更受欢迎。主要还是因为让人感觉「我在跟一个人说话」。 今年3 月,百度首次向外界推出了Deep Voice(深度语音系统),该系统是一个完全由深度神经网络构建的语音转文本(TTS,Text-to-Speech)系统,最大的亮点在于能实时合成人工语音。 Deep Voice 2 更可以实时合成上百种口音的音频。机器完成每个口音模仿的学习仅需半小时的时间,而在这个语音合成的过程中不需要任何的人工调整。 在本次百度AI开发者大会的“技术公开课”环节,百度语音技术部识别技术负责人李先刚博士将会出席,并就“百度远场语音识别与唤醒”这一主题同大家进行现场交流。 理解与交互技术平台UNIT:孙珂 相同的词组成的短语或句子,直播,不同的语序可表达不同的语义,例如「深度学习」和「学习深度」。更进一步,还存在句法结构问题,例如「从北京到上海高铁」和「从上海到北京高铁「虽然含有的词语完全相同,但其语义完全不同。而「北京队打败了广东队」和「广东队被北京队打败了」又语义完全相同。 理解这些状况对于人类而言尚且有些难度,为了让机器掌握语义理解技能,AI科学家做了许多探索。 自然语音处理技术是百度积累最多的AI技术之一。百度NLP设计研发的有监督的神经网络语义匹配模型 SimNet,可以大幅度提升语义匹配计算的效果。 SimNet 在语义表示上沿袭了隐式连续向量表示的方式,但对语义匹配问题在深度学习框架下进行了 End-to-End 的建模,将词语的 Embedding 表示与句篇的语义表示、语义的向量表示与匹配度计算、文本对的匹配度计算与 pair-wise 的有监督学习全部统一在一个整体框架内。 ▲ SimNet框架 在本次百度AI开发者大会的“技术公开课”上,百度知心项目自然语言技术负责人、资深研发工程师、孙珂博士将就“理解与交互技术平台UNIT”这一主题与大家共同探讨。 更多AI科学家,都在现场! 细粒度菜品识别:丁二锐 前段时间,一则“吃烤鱼发现身世之谜”的段子在网上热传,#被烤鱼征服找到亲生父母#这一话题也急剧升温。而事实上,在这个看似欢脱又离奇的故事背后,主人公得以成功找到亲生父母,借助的是百度的人脸识别技术。《被烤鱼征服的背后,是什么在真正帮助被拐27年的他回家?》点击可查看详情。 (责任编辑:本港台直播) |