当然,从应用角度来说,基于深度学习的判别模型更容易上手,但生成模型有更强的解释性,大部分变量都有实际的意义,更容易调试(debug),在通往建立通用人工智能(AGI)的道路会更有竞争力。 此外,人脑的工作模式更有层次感,比如人眼观察东西,先是从形状出发,接下来可能是看颜色,在往下可能是材料和材质。深度学习则往往无法不能很好的把问题分解(factorization),而Vicarious的模型能够很好的把问题分解,更接近于人类的思考方式。 Vicarious此次公开的三篇论文和生成模型有关,另外两篇是《Hierarchical compositional feature learning》和《A backward pass through a CNN using a generative model of its activations》(微信回复“论文”获得三篇论文的下载链接)。 Vicarious的技术特点二:基于神经科学和脑科学的成果 Vicarious约有20%的神经科学家和脑科学家,来研究人脑的工作机制和人的行为特点,这是Vicarious的一大特点。剩下50%约为机器学习背景的研究者,来基于神经科学和脑科学模型来建模,还有一部分是计算机视觉的研究者。 Vicarious认为认知(Perception)依旧是人工智能的最大难点之一,所以Vicarious目前研究的重点是视觉(Computer Vision),主要出发点是在现实世界中,视觉是非常重要的输入来源,而针对视觉的脑科学研究也有些突破。 而基于脑科学的一些研究,能够为建立模型带来很多启发,比如Vicarious发表在NIPS上的论文,里面就利用了脑科学上非常成熟的成果:人类的神经系统系统普遍存在的侧向抑制的现象,这引导Vicarious在他们在模型上实现了侧向约束(Lateral Constraints)。 在字母验证码识别这个具体问题上,Vicarious基于生成型形状模型的系统能够只用1406张图片作为训练集,就超越了利用深度学习的800万图片达到的效果。 Vicarious的顾问团队包括计算机视觉领域的斯坦福教授Fei-fei Li,神经科学领域的UC Berkeley教授Bruno Olshausen 和UCLA教授Alan Yuille。 (Fei-fei Li) Vicarious目前没有自然语言处理和语音等方向的研究项目。 Vicarious如何赚钱? Vicarious目前的商业化主要集中于仓储机器人领域,希望通过提供高智能、高效率的机器人来支持现代商业中至关重要的产业,例如仓储物流和工业生产线。另一方面,Vicarious的投资方对这个方向也表现出浓厚的兴趣,例如ABB和亚马逊等。 ABB是全球最大的工业机器人公司,而Vicarious正努力将他们的研究成果把机器人变得更智能。而亚马逊的仓储机器人也有潜在的应用场景。 由于目前深度学习的局限性,深度学习很难达到通用人工智能。Vicarious目前的研究,是深度学习的有益补充。 无论是在学术界还是工业界,研究方向和产品的多样性都有利于推进人工智能的进步。 本文为硅谷密探旗下《AI严肃说》专栏文章
作者:严肃 “硅谷密探主笔,麻省大学人工智能方向研究生毕业,与通用汽车合作过为期两年的无人驾驶科研项目,在国际人工智能联合会议(IJCAI)等学术会议上发表过多篇论文,在写一系列AI的文章” 往期文章: 专访Google X创始人、无人车之父特龙 人工智能创业需要跨过的5个坑 谷歌为什么吹响人工智能优先的号角? (责任编辑:本港台直播) |