翻译:胡祥杰 张易 【倒计时 8 天,点击“阅读原文”抢票】中国 AI 2017 开年盛典启幕在即,三大亮点不容错过:① 两会 聚齐 BAT 人工智能技术领袖,洞察中国 AI 军团布局;② 引爆 AI 原力, 现场参与 AI 技术论坛顶牛对撞;③人工智能创业家巨星璀璨,看投资领袖预测 谁将成为中国 AI 独角兽。 【新智元导读】 谷歌最近开源了一个JPEG图像压缩编码器,比同类方法压缩要小35%。 在互联网上,速度意味着一切。一个通用的规则是:文件越小,载入的速度会越快。为了在这方面获得提升,谷歌最近开发了一个开源的JPEG 编码器,atv,据称能在不损害图像质量的前提下有效地缩小文件大小,进而让网页的加载变得更快。 新的编码器名为Guetzli,也就是瑞士德语中的“缓存”(cookie)的意思。根据谷歌官方博客的说法,这一新的工具能够创造“高质量的JPEG图像,比当下可用的其他方案压缩的图像小35%”。使用Guetzli 的一个好处是,其压缩后的图片依然是常规的JPEG 文件,进而能支持现有几乎所有的浏览器和应用程序。 谷歌此前也曾有过多个项目,用户缩减网页上的图片大小,j2直播,包括Zopfli 编码器(它能在损害格式的前提下创造更小的PNG 图像),还有Webp(一种新的图片格式,支持无损和有损压缩,以改进文件大小)。 此前,谷歌还发布过一种基于RNN 的图像压缩方法,名为RAISR。RAISR 生成图像的质量比当前超分辨率技术更好、时间最高快 100 倍,能够实时在移动设备上运行,还能消除低分辨率图像中的混叠伪影(aliasing artifacts)。 JPEG的图像视觉质量和其多级压缩处理(颜色空间变换、离散余弦变换及量化)直接相关。Guetzli专门以量化阶段作为目标。这一阶段中图像视觉质量损失所大,得到的文件越小。Guetzli在最小损失和文件大小之间找到了一个平衡。它采用了一种搜索算法,来尽量克服JPEG格式的心理视觉建模与Guetzli的心理视觉模型之间的差异,后者在模拟色彩感知和视觉掩模方面比用简单的颜色变换和离散余弦变换来得更全面和详细。然而,虽然Guetzli创建的图像较小,但代价是这些搜索算法创建压缩图像的时间比当前其他方法要长得多。 虽然Guetzli可以在不牺牲图像质量的前提下产生更小的图像,我们也发现,在实验中,尽管压缩图像文件大小保持不变,比起libjpeg图像,人类评价者却始终更喜欢Guetzli生成的图像,即使libjpeg文件大小相同甚至略大。 我们认为这使花较长时间进行压缩变成了值得使用的折衷方案。
上图的例子中,左边是原图,最右边是Guetzli压缩后的结果。中间是libjpeg的压缩。 根据谷歌的说法,Guetzli 在压缩图片的时间上确实会比其他方法长一些,但是,这些时间都会在加载的过程中补回来,因为加载的时间表短了。另外,谷歌发布的一篇论文发现,用户使用Guetzli 压缩的图片格式的质量比其他类似方法要好很多,甚至比其他一些更大的JPEG文件都要好。 更多的细节,可查看谷歌博客:https://research.googleblog.com/2017/03/announcing-guetzli-new-open-source-jpeg.html?m=1 论文:https://arxiv.org/abs/1703.04421 新智元“3·27”AI 技术峰会购票二维码: (责任编辑:本港台直播) |