微软实时语音翻译Skype Translator、必应搜索、微软小娜(Cortana)人工智能虚拟助手,这些大家耳熟能详的应用背后潜藏的对话翻译技术、知识编纂和语义理解等技术,无一例外都来自于机器学习的神奇能力。而眼下,这种智能正越来越广泛的进入更多第三方应用,成为人们日常生活中必不可少的环节。 在推进人工智能普及化的进程中,微软认知服务扮演了重要角色。它由25款工具集合而成,让毫无机器学习专业背景的开发人员也可在其应用中轻松添加诸如情绪识别、图像识别和语音识别以及语言理解等智能的功能。 “微软认知服务集微软所有机器学习和人工智能之大成,通过易于使用的API将它们提供给开发人员,免去他们从无到有的自创技术之苦,”微软雷德蒙研究院语音及对话组首席研究员Mike Seltzer说。“在大多数情况下,建立一个先进的机器学习模型需要巨大的时间、数据、计算投入和过硬的专业背景,”他解释道。 以语音识别工具为例,Seltzer和同事们花了十多年时间来研究算法,才使得微软语音识别技术能够在嘈杂环境中依然可以正常使用,并能应对特定用户群体和情形下的术语、方言和口音。 近日,微软发布了这项认知服务工具的公开预览版。第三方应用程序开发人员已可通过自定义语音服务(Custom Speech Service)使用这项灵活的技术。 微软表示,另外两项认知服务工具——“内容审阅”(Content Moderator)和“必应语音API”(Bing Speech API)将在下个月正式上线。“内容审阅”允许用户隔离和审查图片、文字或视频等数据,开奖,以筛除不需要的资料(如可能令人不悦的语言或图片等)。“必应语音API”则可将音频转换为文本,理解内容意图,并再将文本转换回语音。 微软认知服务功能十分强大,它可帮助开发人员将智能技术应用于图片和视频等视觉数据的处理上,企业及机构用户则可以用它来强化各自的服务。例如,商务智能企业Prism Skylabs在其Prism Vision应用中加入了计算机视觉API(Computer Vision API),以帮助组织机构搜索闭路电视和安防摄像头所拍摄的内容,从而寻找特定的事件、物品和人员。 微软人工智能及微软研究事业部全球资深副总裁Andrew Shuman指出,整套认知服务工具集发端于微软普及人工智能的愿景,旨在将微软在人工智能和机器学习领域的专业知识广泛地提供给开发社区,为最终用户创造更加愉悦和强大的体验。
Andrew Shuman 微软人工智能及微软研究事业部全球资深副总裁 “如今,软件能够观察人类、聆听、应答并了解周边的物理世界,这堪称一次重大突破,因为它使界面变得更加人性化、更自然、更易于理解,因此在很多不同场景中更具冲击力,”Andrew说。“即将到来的这个时代会从真正意义上以更有趣的方式强化和丰富计算机的能力,开奖,并惠及更广泛的人群。” 新体验、新故事 微软认知服务都能给人们带来哪些新体验,激发哪些新创意呢? 以Alexander Mejia为例,在成长的过程中,他总是抢着尝试有最先进图形及技术创新的最新游戏,追逐音响和视觉效果更佳的时髦玩意儿以及将剧烈的身体动作转化为屏幕上角色行动的新交互方式。 近年来,在担任游戏行业创意总监的工作中,Mejia意识到来自新体验的劲道正在减退——计算能力的成倍提升并未带来游戏兴致的倍增。“接下来会怎样?”他问道。“能够带来全新体验、让游戏玩家们尖叫的技术飞跃又是什么?” 这个问题催生了一次新一代虚拟现实技术的演示。他戴上头盔,开启了一次狂野的过山车之旅。肾上腺素奔涌的体验又回来了!他说,这种体验让人震撼。
“在虚拟世界中,你会相信那些东西就是真的,”他说。“如果我们把一个人物放在你面前,你会做什么?你会试着与他交谈吗?” 这个想法后来发展成为一项商业计划。Mejia成立了自己的公司——Human Interact,并着手研发虚拟现实中的讲故事体验和技巧。该公司的成名作《星舰指挥官(Starship Commander)》可让玩家在以超光速穿越时空的同时控制故事情节,并在每个回合中与各色虚拟人物交谈。 (责任编辑:本港台直播) |