他同时认为,常识就是有填补空白的能力,由此,机器必须有「预测」的能力,这也就是他所提出的预测学习(predictive learning)的概念,也就是从提供的任何信息预测过去、现在以及未来的任何一部分。或者,你也可以称其为「无监督学习(unsupervised learning)」。
他同时用了一个例子为我们对比了「强化学习」、「监督学习」以及「无监督学习」之间的区别,我们可以看到他们在需要收集的信息量上有着很大的差距,但同时导致的学习结果也就不太相同。
经典基于模型的最优化控制过程(Classical model-based optimal control) 之后,Yann LeCun 介绍了经典基于模型的最优化控制过程(Classical model-based optimal control)。即利用初始控制序列对世界进行仿真,调整控制序列利用梯度下降法对目标进行最优化,再进行反向传播。
随后,他又为我们介绍了人工智能系统的架构。他给出了一个公式:预测+规划=推理。他表示,「智能」的本质就是要有预测的能力,我们需要提前计划,去模拟这个世界,然后采取行动以最小化预测的损失。
最终得出结论:我们需要的是基于模型的强化学习(Model-based Reinforcement Learning)。
机器去学习能够预测世界的模型 下面这一部分是关于机器如何学习能够预测世界的模型。
实体神经网络(RNN) 然后,他也介绍了「根据文本推断世界的状态:实体 RNN」
下面这部分谈到了对具有记忆模块的增强神经网络(Augmenting Neural Nets)的使用
这部分谈到了实体循环神经网络(Entity Recurrent Neural Net)的作用:
维持一个对于当前世界状态的估计 每一个网络都是一个带有一个记忆的循环网络 每一个输入事件都会导致记忆单元获得一些更新
这里提到了塑造能量函数(Energy Function)的 7 种策略 对抗训练(Adversarial Training) (责任编辑:本港台直播) |