2016 年 8 月,英特尔为了加强其人工智能领域的能力,以 4 亿美元的天价收购了机器学习初创公司 Nervana 。该初创公司成立仅仅两年,却被公认为是机器学习技术开发的领导者。近日,Nervana 的联合创始人兼首席执行官 Naveen Rao 博士在 StrataHadoop 上和大家深入探讨了深度学习的话题,通过其PPT,我们也能了解Nervana价值所在。
Naveen 探索了许多方面,包括深度学习相对于其他机器学习技术的好处、该领域的最新进展、深入学习工作流程、开发和部署深度学习解决方案的挑战、用于构建和扩展深度学习解决方案的标准化的工具等等。
不同于大家以往的认知,深度学习究竟是什么呢?这是一种模仿人脑机制分析数据的机器学习方法,从多层抽象中抓取特征。我们认为真正重要的是从数据中提取有用的信息,并通过统计信息作出判断。我们拥有数据科学领域内的权威专家,通过庞大的数据量提高学习性能,最终获得高度具象化的能力。 这种能力是非常强大的,类似于过去二十到二十五年间计算机对于人类的意义。在短短的两年内,深度学习这种新方法就被广泛地应用于工业中了,包括通信、语音处理、图像识别以及视频处理等等,其中大量的数据都可以被人们利用,所以我认为未来的前景是非常光明的。
深度学习的模型有很多,但基本结构都各不相同,可能会导致这些模型具有不同的特性。这里我很快和大家一起回顾一下这些常见的深度模型。 左上角的模型是目前最常用的卷积神经网络(CNN)模型,非常适用于视觉系统和图像分析。右上角的模型是复发性神经网络(RNN)则适用于各种基于时间或序列的建模。金融系统和语言模型通常使用 RNN。其他非主流的方法还有很多,比如下方的这三种:堆叠自动编码器,多层感知器(MLP)和深信度网络(DBN)。未来五年的很多创新将来自堆叠自动编码器领域,但目前我们还不知道要如何开始选取目标。
这里我们可以看到一些真实的实验结果,这个系统通过抽象化实体,提取出丰富的代表性特征,这才是我们真正的力量来源,并且其抗干扰能力很好,无法被轻易改变。
这个的意义在于,可以自动处理以往需要人工完成的任务。我们也做了一些测试,让大家可以看到其性能。目前,训练有素的人类通常错误率为 5%,而深度学习在图像和语音任务中的错误率仅为 3%。因此,我们相信几年后,开奖,深度学习在这两方面的能力甚至会远远超越人类。
这是一个深度信用网络,我们看下是如何利用它来解决数据问题。这个系统有两种使用方式:第一种是我们可以输入一些数字对应的手写样式,系统可以利用这些数据样本判断出是哪个对应数字;第二种是我们给定某个数字,系统可以模拟出其对应的各种可能的手写样式。 比如这里,系统根据一系列“5”的手写体判断出这是数字“5”。
再比如这里,当我们输入数字“0”,系统经过一系列手写体样式处理,会实时地显示各种形态各异的“0”,但毫无疑问,从视觉上大家还是可以判断出这是数字“0”。 这是非常有趣的一件事,这意味着我们可以输入一系列实例,从中抽象出具体的共同特征。
这个深度学习平台实现了针对行为探测的 3D 卷积模型,基于 100 种类别、1 万 3 千多个视频的公共数据集,使训练速度比竞争对手的框架快了大约 3 倍。同时,该平台也能扩展到其他场景、对象的识别,行为相似度平行对比,视频检索和异常检测。 其潜在应用包括:在机场或地铁站等乘客密集的场所实施安全监控、交通管制及车辆管理、航空管制侦测、基于面部识别和图像处理的安全系统检索功能、自动驾驶的感知和防撞系统、公共场所的行李检测等等。 (责任编辑:本港台直播) |