18天1000万次迭代，AI生成的照片你能分辨真假吗？

admin · 发表于 2022-1-2 21:11:48

18天1000万次迭代，AI生成的照片你能分辨真假吗？

（原标题：How an A.I. ‘Cat-and-Mouse Game’ Generates Believable Fake Photos）

在形成最终的图像以前，英伟达的系统在18天内生成了1000万个修订版本

网易科技讯 1月5日消息，纽约时报近日撰文详述了英伟达的AI“猫捉老鼠游戏”如何生成逼真的虚假图像。通过分析大量的名人照片和检测其中的通用模式，该芯片厂商打造的系统自行生成了看似真实存在的人肖像。该项目意在打造可自动生成令人信服图像的技术，最终显著加快和改进计算机界面、游戏、电影和其它媒体的制作速度。

以下是文章主要内容：

照片中的女人看起来很眼熟。

她看似饰演《老友记》瑞秋的詹妮弗·安妮斯顿（Jennifer Aniston），也像从童星变身流行乐歌手的塞雷娜·戈麦斯（Selena Gomez）。但也不算十分像。

她看起来像是电影首映式或者颁奖典礼中摆拍的美女艺人。但是，你说不出她的名字。

那是因为她并非真实存在，她是由机器创造出来的。

该图像是英伟达开发的软件所生成的其中一张虚假名人照片。这家大名鼎鼎的计算机芯片厂商正在大举投资研究人工智能。

在芬兰的一个实验室里，英伟达的一个小型研究团队最近开发了能够分析数千张（真实的）名人照片、识别共同模式并形成看似一样的新图像的系统——不过那些新图像还是略有不同。该系统还能够生成马、公共汽车、自行车、植物和众多其它的常见物品的逼真图像。

英伟达想要开发出能够自动生成令人信服的图像（或者说以同样令人信服的方式改动原有图像）的技术。他们希望，这种技术能够大大加速和改进计算机界面、游戏、电影和其它媒体的制作速度，最终让软件能够瞬间制造出逼真的图像，而不是像现在的人工开发者需要耗费数个小时甚至数天完成此类工作。

神经网络技术

近年来，得益于各种能够通过分析大量数据来学习任务的算法，谷歌、Facebook等公司相继开发了识别人脸和常见物体的系统，这些系统的准确度与人眼相当。如今，这些公司以及众多全球顶尖的学术AI实验室，都在利用类似的方法来开发识别和创造方面的应用。

英伟达生成的图像在分辨率方面无法跟一流相机拍出的照片相提并论，但即使是在超大屏智能手机上，它们看起来都清晰精细，基本上都很有说服力。

例如，看看下面的两张照片，你觉得哪张是真实的呢？

跟其它有名的AI研究者一样，英伟达的团队相信驱动该项目的技术在未来的几个月和几年里将会继续改进，生成尺寸和复杂程度均大幅提升的图像。

“我们认为，我们能够进一步推动这种技术的发展，不仅仅生成照片，还生成能够运用于电脑游戏和电影的3D图像。”该项目背后的其中一位研究人员亚科·莱赫蒂宁（Jaakko Lehtinen）指出。

如今，很多的系统都利用一种名为“神经网络”的复杂算法来生成图像和声音。这是一种通过分析海量数据来识别模式的方式。例如，通过识别数千张汽车照片的共同模式，神经网络能够学会鉴别汽车。但它还能够往另外一个方向发展：它能够利用那些模式来自行生成汽车照片。

在开发生成新名人面孔的系统期间，英伟达的团队更进了一步，以便大大提升它们的可信性。它建立了两个神经网络——一个用于生成图像，另一个则试图判断那些照片的真假。这些神经网络被称作“生成式对抗网络”（GAN）。本质上，一个系统尽其所能去欺骗另一个系统，另一个系统则尽其所能地避免被蒙骗。

这个图像系列显示了英伟达的系统18天处理过程中的产品。借助名为渐进生成式对抗网络的技术，研究人员开发系统先生成低分辨率图像，然后逐步生成分辨率更高的图像。这让训练过程变得更加快速，同时也让它变得更加可控，更加稳定。成果是：清晰精细且很令人信服的1024x1024像素图像

英伟达的另一个研究团队最近也开发了一个系统，该系统能够自动地改动夏天拍的街景照片，使得它看起来像是冬季街景照片。加州大学伯克利分校研究人员设计了另一种系统，用它来将马变成斑马，将莫奈的画作变成梵高的画作。谷歌旗下的伦敦AI实验室DeepMind正在探索自行生成视频的技术。Adobe也在打造类似的机器学习技术，着眼于将它们应用于它广为流行的图像设计工具Photoshop等产品。

训练有素的设计师和工程师长期以来都使用像Photoshop这样的技术和其它的应用程序来从头制作逼真的图像。这是电影特效公司一直在做的事情。不过，特斯拉CEO伊隆·马斯克（Elon Musk）等人联合创立的人工智能实验室OpenAI的研究人员杜克·金马（Durk Kingma）表示，对于机器来说，学习如何自行生成这种图像正变得越来越简单。OpenAI专注于这类机器学习技术。

金马提到英伟达在芬兰的研究项目，“我们现在有个模型能够生成比人工编程更加多样化、更加逼真的面孔。”

新隐忧

然而，这种图像制作技术的出现也伴随着新的隐忧。

如今假新闻问题备受关注，不久以后我们可能会面临范围甚至更加广泛的假图像问题。

“人们的担忧在于，这些技术将会发展到让人很难辨别真伪的地步。”前谷歌AI政策主管、人工智能伦理与治理基金主任蒂姆·黄（Tim Hwang）指出，“你会觉得那会加剧我们已有的问题。”人工智能伦理与治理基金旨在资助与伦理有关的AI研究。

所有的这些图像都花费了计算机大约18天的时间才生成，达到系统认为它们可信的地步

生成式对抗网络的概念最初在2014年由研究者伊恩·古德菲洛（Ian Goodfellow）提出，当时他是蒙特利尔大学的博士生。他在当地的一家酒吧与人争论后想到了这个网络概念，当晚就开发了第一个原型。如今，古德菲洛是谷歌的研究者，他的思想在快速发展的人工智能领域是最重要的思想和最被广泛探索的概念之一。

虽然这种照片生成技术目前的应用仅限于静态图像，但许多研究人员都认为它可能会扩展至视频、游戏和虚拟现实领域。但在金马看来，这可能还要数年时间，因为那将需要强大得多的计算能力。那是英伟达和其它的芯片厂商也在研究的一个主要问题。

研究人员还在利用各种各样其它的机器学习技术来编辑出更令人信服的视频。

去年8月，华盛顿大学的一个研究团队开发了一个能够给美国前总统巴拉克·奥巴马（Barack Obama）视频加上对口型话语的系统，引起了媒体的广泛关注。包括加州创业公司和中国的科大讯飞在内的其它研究组织也在使用美国总统唐纳德·特朗普（Donald Trump）的照片开发类似的技术。

它们的产品并不算完全令人信服。但GAN和其它技术的快速进步，指向了一个任何人都能更容易制造虚假图像或者以假乱真的未来。这正是蒂姆·黄等专家真正担忧的地方。

利用公开图像和视频分析新闻动态的组织Bellingcat创始人艾略特·希金斯（Eliot Higgins）指出，虚假图像绝不是一个新问题。在Photoshop流行开来的这些年里，人们一直都承担着怀着怀疑态度去看待网上的东西的责任。

不过，相比文本或者口头语，很多人对于照片和视频还是颇为信任。蒂姆·黄认为，该技术将会演变成为一种AI竞赛，让那些试图蒙骗他人的人与那些试图识别骗术的人针锋相对。

莱赫蒂宁没有多谈他的研究将会给在线虚假信息的传播带来的影响。但他也指出，随着时间的推移，我们可能得重新思考图像的本性。“我们在接近一些根本性的问题。”他说道。（乐邦）

原文链接 https://www.nytimes.com/interact ... nerated-photos.html

		自动登录	找回密码
密码			立即注册