现在,想象一下,这样的洞见如果扩展到整个医疗领域,大量的视觉诊断类的工作将会很快被自动化,以帮助医生,减少医生的过劳,然后,将服务扩展到更多没有条件接受治疗的人群。机器也能帮助记录医生访问,管理疾病,atv直播,带来更多可信赖的、快速的服务。 关于AI 和机器学习能带来的机会,我希望你们和我一样兴奋,但是,对于一些人来说,这些依然是存在高门槛的,它要求大量的专业知识,只有少数大公司可以提供这样资源,这也是为什么,云会是一个理想的平台,这也是为什么,我们会在云AI/ML上投入大笔投资,它会在接下来的几年内,提供强大的、易用的工具,给每一个云的用户进入这一领域的机会。
换句话说,谷歌云正在在将AI民主化,这包含了四步: 计算的民主化 数据民主化 算法民主化 人才和专业知识的民主化 首先也是最重要的——计算。AI 要求大量的计算,今天,深度学习算法能轻易地实现数十亿的连接,训练和使用这些模型,这要求计算资源。当然,这也是云要提供的主要功能。去年,我们提供了beta版的云AI/ML引擎,今天,我在此宣布,我们增加了通用性,这是一个平台,能利用计算的能力。然后透明地提供给大家。 简单来说,如果你在开发机器学习模型,不过你喜欢使用你自己所在环境熟悉的工具,比如TensorFlow。ML引擎让你可以专注于自己的解决方案,而将基础设施问题交给我们解决。在训练这些模型的时候,就可以同步将它们上传到云端。ML引擎可以更快、更大规模地处理。最后,只需要将结果从你自己的设备部署到移动设备,在那里训练的成果就可以用于解决现实世界的问题了。 但是,就算有了这么大的计算力,AI 仍旧是计算机科学当中最复杂的问题。对于很多企业和创业者来说,应用 AI 最简便的方式就是使用谷歌提供的 API,并借此使用谷歌已经完全训练好的机器学习模型,去解决常见的问题。这些 API 就像开关一样,能够立即打开任何应用中的智能,使其理解语音、照片,或者翻译文本,理解自然语言。 但是,谷歌的 AI 技术无论是从宽度还是广度上都远远不止于此。在谷歌,我们有无数的 AI 团队,在这些团队里有大量的 AI 研究在进行,覆盖了 AI 的很多领域,包括机器学习。我们研究团队里面,有很多都是在顶尖 AI 期刊和会议上发表了大量 AI 科研论文的作者。我们的团队经常性地在国际比赛中获得最佳论文奖。而且,这些科研的结果很快就会被转化为产品,交付给消费者。在此,我十分高兴地向大家介绍我们最新的一些产品。 Vision API 已经持续稳定地开发了一段时间,这次它有了一些重大的性能提升。 第一个是元数据(meta-data)的扩充,它能够从谷歌知识图谱上百万千万的实体中识别网上的图像。我们也在使用这些元数据,增强整个谷歌图像搜索的能力。第二个提升是光学字符识别(OCR)能力,能够识别图像或含有大量文本的文件(比如法律文件或其他复杂的文书)。 但是,像素的世界远远不止于此。实际上,视频中含有大量的数据,单单是 YouTube,每分钟就会有好几百乃至上千小时的视频上传。要理解视频中这些丰富的内容,是计算机视觉中一个重要的、但一直以来都没有得到很好解决的问题。实际上,很多计算机视觉研究者,包括我在内,都将视频视为数字宇宙的“暗物质”。 今天,我非常高兴地向大家宣布一个由机器智能驱动的全新的 API:视频智能 API。
下面,我们就请我的同事 Sara Robinson 向大家展示这个 API 的细节。 【Sara Robinson 展示】以超级碗谷歌家居的视频为例,仅使用这一个 API,就能告诉我们两个层面的东西:在一个相对高的层面,这个 API 告诉我们视频内容是什么;在一个更粒度(granular)的层面,它能识别出在视频的第几分钟出现了一只狗,不仅如此,它还能告诉我们这只狗的种类是什么。 (责任编辑:本港台直播) |