我们在 MNIST 数据集上训练了这个模型,其目标是将数据生成分布与πθ相匹配,研究人员倾向于使用简单迁跃算符来匹配复杂分布。研究人员考虑了三种迁跃算符架构 Tθ(·|x)。每个都有一个对称的编码器-解码器结构,高斯噪声被加入了隐代码中,解码器架构分别为: DCGAN(Radford 等人,2015)所用的生成网络架构,其中包含两个全连接层,随后是两个转置卷积。该模型强大到足以在一个步长中生成清晰图像。 弱化的 DCGAN,一个全连接层和一个转置卷积层(conv)。 两个全连接层组成的 MLP,它是最弱的模型(mlp)。 本文为机器之心编译,转载请联系本公众号获得授权。 ✄------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |