AI影像真假难辨

2020-06-06| | 查看: 175| 评论:44

AI影像真假難辨

人工智慧的新技术已能製作唯妙唯肖的假照片。

假照片和摄影技术的历史差不多同样久远,花仙子和尼斯湖水怪的照片就是着名例子。Photoshop软体把影像处理带进了数位时代,现在人工智慧(AI)让影像变造技术更上一层楼。人工神经网路可分析数百万张真人和景物影像,并以此做出几可乱真的伪造影像。

受到人类大脑构造所启发,人工神经网路是由许多人工神经元互相连接所构成。多年来,谷歌,脸书等公司都使用人工神经网路协助其软体辨识出影像中的人。有种新方法称为「生成对抗网路 」 (GAN),其中包含产生影像的生成(generator)网路和评估影像真实程度的鉴别(discriminator)网路。总部位在美国西雅图的艾伦人工智慧研究所执行长伊兹奥尼(Oren Etzioni)说:「人工神经网路需要用几百万张範例影像来学习,GAN这种新方法则可自动产出这类範例。」

GAN也可以快速产生逼真的假影像。生成 网路经由机器学习去研究大量影像,可製作出唯妙唯肖的虚构影像,接着把这些影像送往鉴别网路。鉴别网路能够辨识出影像中的人,并可评估生成网路产出影像的真实程度。经过一段时间,生成网路变得更擅长製作假影像,鉴别网路也更擅长判定,这种网路因而称为「对抗网路」。

GAN之所以能称为AI的重大突破,在于它经过初步训练后就可继续学习,不需要人类监督。现任职于谷歌大脑(该公司的AI计画)的研究科学家古德费洛(Ian Goodfellow)在2014年的论文里介绍此方法,他是第一作者。此后,全世界许多研究人员尝试把GAN用于机器人控制或语言翻译等方面。

开发这类无人监督的系统是一大挑战.GAN有时不会随着时间而精进,如果生成网路无法产出越来越真实的影像,鉴别网路也无法持续进步。

晶片厂商辉达(Nvidia)已开发出训练GAN的方法,有助于避免GAN学习受阻这种方法的要点是同时渐进训练生成网路和鉴别网路:先输入低解析度影像,再随训练进程逐步加入新的像素层,添加高解析度细节。辉达的研究人员于今年4月的国际AI研讨会上发表论文指出,这种渐进式的机器学习策略可缩减一半的训练时间。研究团队展示这项技术的方法是,以20多万张名人影像的资料库来训练GAN,GAN产出完全虚构但栩栩如生的高解析度脸部影像。

GAN并不知道製作的照片是否逼真。参与此计画的辉达研究人员雷提农(Jaakko Lehtinen)说:「我们选择脸孔当成主要範例,原因是人类可以轻易判断AI生成模型的成效。我们天生具有辨识脸孔的神经机制,生活中又不断训练及学习辨识脸孔。」这项挑战在于如何让甘模仿人类的直觉。

脸书公司认为鉴别网路可依据使 者的过往行为,协助脸书更準确预测使用者想看的内容,终极目标是创造具备常识的AI。该公司AI研究院院长杨立昆(Yann LeCun)和研究工程师钦塔拉(Soumith Chintala)表示,他们理想中的系统「不仅要能辨识文字和影像,还要具有推论,预测和计画等较高阶的功能,足以比拟人类的思考和行为。」杨立昆和钦塔拉测试该公司生成网路的预测功能时,输入影片前四帧(frame)画面,由生成网路产生接续两帧,最后合成出连续动作的影片,例如人在行走或摆头的动作。

对需要低成本内容的製片人和游戏创作者而言,栩栩如生的AI生成影像和影片极具价值。AI研究公司OpenAI研究人员拉德福(Alec Radford)评论道,即使GAN能产出「貌似真实」的影像,但要做到毫无瑕疵仍需努力。拉德福于2016年在国际AI研讨会上发表的论文正是脸书目前工作的基础,他是该文的第 一作者。他补充道,要製作出高品质AI生成影片,还早得很。

人们是否会把AI产生的影像或影片用在线上恶搞等不当行径上,还待观察。此刻,大众越来越怀疑线上内容的真实性,这类技术的问世恐怕只会雪上加霜。

延伸阅读:真伪莫辨的人像产生器


相关阅读