在 2016 年上半年,一部名为《至爱梵高》的动画?片在戛纳影展获得点赞无数。这部动画电影堪称史上第一部全手绘油画?片,其制作团队在全球招募优秀的油画家经过为期三周梵高艺术?格的培训,最终由一百人的团队用 56800 幅油画制成了这部电影。不过,如此大的工作量为什么不让计算机批量绘制印象画风格的效果图,而人类只需要去拍下风景照就好呢?AI 是否会创造奇迹,作出更惊人的作品呢? 蔡天懿就是抱有这个想法的其中一员,他开创的 Versa是一个基于人工智能的短视频与照片编辑器。毫无艺术天赋的你轻轻一点,就能把普通的风景肖像照全都艺术化,就像画家画出来的那样。这听起来是不是很像去年修图界的当红辣子鸡 Prisma 及同类 App 的滤镜风格迁移功能呢? 一样也不一样!
一组原图与效果呈现的对比图 蔡天懿告诉动点科技:“Prisma 其实完全是沿用的谷歌实验室李飞飞在斯坦福大学发表的一篇公开论文,因为它是开源的所以那套卷积算法的演变只能停留在发表当时的学术阶段。看似整体非常美好的效果其实细看很多地方是经不起推敲的,这项技术真正的壁垒在于深度学习模型对绘画创作概念的提取上。Versa 应用了 CTO 赵维杰(原 HUAWEI 海思芯片算法科技学)提出的全新 Deep Learning 理论框架,能够自主学习‘画画’的概念,将细节的生成效果提升了几个等级,做到了人类肉眼可以识别的差距。并且大幅降低了现有 AI 算法对数据的依赖,将原本数万张图片的训练数据需求量降低到了 100 张图片以下。”
这种学习效率还包括在生成速度上的体验——像是 Prisma 需要 3、5 秒以至更久的渲染过程,但在体验 Versa 时非常快,蔡天懿认为“是不可能在世界上会有比我们更快的”,j2直播,现在可感知到所有的耗时全取决于上传和下载的速度,在 Versa 服务器上渲染控制在两百毫秒以内。 蔡天懿认为,Prisma 还差在一点。它并不理解这个图像的内容,所以它不会知道哪里是人脸哪里是后景前景,就像是小孩在拿着一个大画笔到处涂刷上色,但要效果逼真只有是在全局和具体空间上进行融合和迁移才能水到渠成,“就像是一个真正的画家,知道眼睛的画法应该细致描绘,头发那里又应该怎么落笔。”在一个风格下掌握更多形似到神似的细节技巧是 Versa 的特色之处。
此外,笔者在体验中还发现 Versa 还在生成的界面上增添几个人为选项——例如焦点和倍数渲染功能,那么追求一键效果自动化的产品又为何要“画蛇添足”呢? 蔡天懿和我们解释了他长久来在格瓦拉担任产品经理形成的体会——设计一方面是希望让用户感受画家的乐趣,该具体的地方具体处理,该抽象的地方抽象处理。在跟很多摄影师去合作的时候,他们认为全自动的体验会丧失某种创作的乐趣,开奖,实际上每一个人都应该像设计师可以选择刻画具象的情景,最后出来的作品也有更多惊喜。“AI 作为一个画画的人,应该能跟它去做一个多轮对话机制,这才是有价值的 AI 产品。”蔡强调说。“这样的交流对于算法也是一个学习,它会更加知道哪里是人脸然后分配强化比重。“ 至于能不能火,消费市场的兴趣度会不会早已被透支? (责任编辑:本港台直播) |