Zeiler 向机器之心介绍道,在 Clarifai 建立伊始,他们的系统就已经可以识别物品以外的其他元素了,这也是众多开发者和大公司偏爱他们的应用的原因。计算机目前可以理解的抽象概念包括像「幸福」这样的感情,或者描述性语言,例如「风景优美」和「悠闲的」。在 Clarifai 的通用模型中,有超过 11,000 种此类概念可以被识别出来,最近上线的自定义模型就可以让人们自定义 Clarifai 的平台,识别任何东西。 现在的 Clarifai 提供人脸识别,NSFW 内容等多种专有模型。「现在我们有七种专有模型,相比其他公司的通用模型,我们能够识别出更多的信息。」Zeiler 说道,「我们的食物模型可以识别上千种食物的成分。」 Clarifai 的一个应用场景在纽约市公共图书馆。图书馆公开的历史图片和文件一般会有人工分类的小标签,但是由于名目繁多,人工分类会出现疏漏。Clarifai 在图书馆公开的数据集上使用了自己的系统之后发现,人工智能系统不仅在很多已有条目上和人工分类表现相当,还把很多当年错误的分类给找了出来(例如一些被遗漏有绿色标记的水粉画)。Zeiler 认为在这项应用中的 AI 系统已经超出了人类的表现。 纽约市公共图书馆应用场景 另一个更有趣的例子来自于公司里的一名员工。这个员工最近生了个大胖小子,他就在婴儿房里安装相机对着摇篮监控。通过训练图像识别系统,他让计算机可以识别宝宝爬出摇床、宝宝坐卧站立、以及不同的姿势睡觉的情形。在无人监管的情况下,摄像头可以自动进行动作判断,j2直播,这种应用为监控设备的发展指引了方向。
识别婴儿车内宝宝的演示:宝宝不见了
宝宝在站着
宝宝睡着了 基于以上思路,Clarifai 主动向合作者提供系统核心,与其他公司的开发者们合作,联合所有人探索图像识别的各种可能性,已经获得了不少成果。其中有个让人眼前一亮的应用,是通过社交网络上棒球迷接到棒球的自拍照片(注:棒球比赛当出现本垒打或出界的情况时,球可能会落入观众席,于是便会出现能接到球的观众;很多人抓到球之后做的第一件事就是自拍一张,发到社交网络),以及这些照片下的 GPS 坐标来训练和统计棒球场上到底哪些地方(称为最佳座位)最有可能接到球,成为幸运观众。这样用户就知道去看棒球要抢什么样的座位了。 每当业内研究出现新的进展,Clarifai 的团队都会快速跟进,让他们的产品更快更高效。Zeiler 认为,目前人类只发挥了深度学习的一小部分潜力,但他深信,当他们把人工智能平台送到每个人手中以后,深度学习将会突破所有限制,让人工智能发展到新的阶段。 训练模型的艺术 在此前接受《连线》的访谈中,Zeiler 曾提到训练模型相比科学更像是艺术,在未知中探索需要创造和努力。多年来,科学家们为了搞清楚神经网络的运行机制,进行了无数次实验。但关于神经网络的内在运行方式,目前还没有系统性的理论,没有具体的路线可以指引你获得更好的性能。简单地下载开源工具包直接使用并不能跑出很棒的结果。 进行模型训练的人需要收集高质量标记好的数据,维持高效的数据结构,搭建合理的神经网络架构。当出现错误时,只有经验可以帮你调整参数、修改数据、修改网络结构等。人工智能系统需要多年的不断改进才能变得高效。「利用 Clarifai,开发者们可以跳过这一步骤,atv直播,直接将最先进的人工智能应用到你的产品中去。」Zeiler 说道。 但仅有先进的技术是不够的,人工智能的初创企业似乎也长期面临着缺乏数据的窘境,但 Zeiler 认为,大量的数据当然很有必要,但对于 Clarifai 而言数据的质量更为重要。 (责任编辑:本港台直播) |