在音频本身,除了转录,还有很多未解决的问题,如口音、不同的环境、说话人识别、更情感的文本到语音的输出。现在Google助手或Siri所发出的每个声音仍然是一个机械式的女声,在“串联语音合成”的过程中切断和重新组装。然而,深层次和强化学习似乎正在取得长足进步,最近Google DeepMind的WaveNet发出的音频是基于原始波形建模的。 三、未知UX领域 因为我们的技术还不成熟,所以我们需要用好的设计来打磨缺陷。 语音交互的设计仍处于早期阶段,对于平面接口有无限的输入。对于用户可以说的自然限制,并且危险地,他们自然地将人类特性归因于语音系统。在接下来的几年中,语音系统将无法正确地对许多查询做出反应。即使没有解决NLU问题,我们可以提高可用性,我们将看到扩大对语音接口设计的兴趣。 支持用户控制和自由,提高灵活性和效率,防止和处理错误,甚至使用可共享设计都将有所帮助。我们的语音助手会更好,当我们可以教他们特定的快捷命令,名称,默认和热门词,当公共设备支持独特的用户配置文件。 屏幕具有大量的相对信息密度,多模式语音+屏幕体验将是许多问题的正确短期解决方案(参见有关屏幕的回声的传言)。 用于语音原型设计和分析(如Sayspring和VoiceLabs)的必要支持工具已经开始出现。 四、计算功率和电池 Siri最常见的投诉是,它很慢,无法连接到Apple服务器场,并且无法离线工作。实际上,目前主要的语音助理(亚马逊,苹果,谷歌)都没有在本地工作 - 他们的大脑都在他们各自的父母的云后端,这不太可能改变很快。响应语音查询需要复杂的基于机器学习的模型推理,一个强烈的计算量大的任务。 始终在线监听和连接是强大的功能。因此,我们看到大多数语音控制的无线产品需要一个按钮敲击,开奖,而不是一个热门词汇:便携式Echo Tap,以及使用分离的专用处理器,例如DMBD4 和 Apple W1。 五、隐私,安全和身份验证 最后,为了让我们通过语音接口访问许多重要的服务,我们必须能够对其进行身份验证。 Alexa从相关的亚马逊账户购买默认启用,导致电子商务能力的孩子,办公室恶作剧和一个新闻广播员偶然命令他的观众玩具屋。更重要的是,如果我想通过虚拟助理访问我的美国银行帐户,她怎么知道我是我? 传统凭证在基于语音的设备上看起来像是一个比移动设备上更差的解决方案。一些人认为语音生物识别认证是更可能的下注。不幸的是,语音生物识别解决方案作为独奏解决方案感觉不可持续。正如照片处理软件意味着看到不再相信(不知何故,今天的社交媒体上的每十五岁比我在那个年龄时看起来更好看),音频操纵和综合技术表明很快听到不再相信。虽然今天有关于语音记录同意的各种州级规则,远场麦克风使执行更困难。 这些接口又一次推动了当今有缺陷的认证方法向行为,语境,基于风险的身份系统考虑了许多不同的信号。 综上,技术支撑上的挑战以及消费者较高的期待,让语音和对话服务处于一种十分尴尬的境地。更奇怪的是,“开始”一项对话服务的成本变得非常之低。许多开发者都对于入门对话服务开发的容易程度感到很兴奋,比如,只需要创造一个Facebook主页,下载BotKit,创造一个API、AI 或者Twilio账户等,但是,他们很快就会发现,创造一个良好的用户体验有多困难。 话说回来,技术触发是移动软件发生这种转变的可能原因。但只是可能的原因,并不意味着它是唯一的原因——经济、文化,特别是生态系统的触发(虽然较少得到人们的关注),实际上更重要。 移动生态系统的现状也是对话经济的驱动因素之一,与技术、经济和文化因素并列。 有一点是清楚的——这是新的技术战场,因为大企业间已经发起了硝烟。 编译来源:
https://news.greylock.com/the-conversational-economy-whats-causing-the-bot-craze-4dd8f1b44ba1#.jb2zfb5v9 https://news.greylock.com/https-news-greylock-com-the-conversational-economy-voice-and-the-new-era-of-multi-modal-computing-96f535c058f6#.gf1d8rd1m 新智元招聘
职位 执行总编、主编 职位年薪:50万(工资+奖金)-100万元(工资+奖金+期权) 工作地点:北京-海淀区 所属部门:编辑部 汇报对象:CEO 下属人数:20人 年龄要求:25 岁至 40 岁 语 言:专业英语八级以上或海外留学从业背景 职位背景:在IT媒体领域有专业团队管理经验与主流话语权 学历要求:硕士及以上 职位描述: 热爱人工智能和媒体事业; 具有3年以上媒体采编经验,在业内有一定影响力及人脉; 具有原创+编译团队管理经验,善于部门间协作沟通; 对TMT领域有深入理解,对行业趋势有独到的洞察; 英文阅读写作及沟通能力优异; 较强的抗压能力和自驱力,能在竞争激烈的环境下激励团队; 具有创业精神及团队精神,有恒心肯吃苦; 理工科背景优先,有知名企业或知名媒体机构工作经验者优先。 职责 (责任编辑:本港台直播) |