网络中的第二个通道。左边:R[1] 被当成网络的输入。中间:一个更高质量的图像 P[2]。一个新的残差 R[2] (右),通过从原始图像中减去P[2] 得以生成。 在每一个深入的循环中,网络获得了更多的关于压缩过程误差的信息(通过残差捕捉)。如果它能用这些信息来预测哪怕稍微一点残差,就会带来更好的重构结构。我们的模型能够使用利用额外的字节,指导一个极值。我们看到了收益的递减,并且在某些点上,网络的代表能力会被耗尽。 为了展示文件大小和质量的差别,我们拍了一张日本犬Vash的照片,并生成了两张压缩图像,一张是JPEG格式,另一张则是残差 GRU。两张图片的目标都是从感知上相似度要达到0.9MS-SSIM,这是一个评估感知质量的值,最高为1.0。我们的学习模式生成的结果比JPEG小20%。
开奖,压缩图片比传统方法提升25%(附论文)" src="http://www.wzatv.cc/atv/uploads/allimg/161001/234334UL_0.jpeg" /> 左: 原始图像(1419 KB PNG) at ~1.0 MS-SSIM. 中: JPEG (33 KB) at ~0.9 MS-SSIM. 右: Residual GRU (24 KB) at ~0.9 MS-SSIM. 看一下狗的鼻子和嘴,可以看到,我们的模型并没有JPEG的图片中间部位所见到的红色色块和噪点。这是因为JPEG压缩时产生了方块伪影,但是我们的压缩网络是在整张图片一次性完成的。但是,我们的模型也有缺陷:胡须中的细节和纹理丢失了。不过,整个系统在减少伪影上有巨大潜力。
左边:原始入选。 中:JPEG 右:残差GRU 虽然今天常用的方法已经很好,但是我们的研究显示,使用神经网络来压缩图像可以获得更高的质量和更低小的文件大小。未来,谷歌的研究将着眼于更好的压缩质量和更高速的模型。请保持关注。 下载论文了解更多。在新智元公众号回复0930下载论文。
豪华嘉宾阵容,共飨 AI 盛宴
7 大院长齐聚新智元智库院长圆桌论坛 2016世界人工智能大会技术论坛特设“新智元智库院长圆桌会议”,重量级研究院院长7剑下天山,带来最前沿的AI研究动态、剖析技术发展趋势。 七位人工智能界“高手”现场过招,思想的激烈碰撞会给目前的人工智能发展带来哪些洞见?七位院长对行业的发展会有哪些前瞻揭秘?10月18日下午,2016 世界人工智能大会技术论坛,答案将逐层揭晓。 新智元智库院长圆桌汇集了中国人工智能产学研三界最豪华院长阵容:美团技术学院院长刘江担任主持人,微软亚洲研究院常务副院长芮勇、360人工智能研究院院长颜水成、北京理工大学计算机学院副院长黄华、联想集团副总裁黄莹、Intel 中国研究院院长宋继强、新华网融媒体未来研究院院长杨溟联袂出席。 2016世界人工智能大会技术论坛议程
扫描二维码购票: 购票链接: ,直播 (责任编辑:本港台直播) |