简单聊聊让照片动起来背后的AI算法

来源：语言识别时间：2022/11/3

你是不是也曾经在短视频平台看到过老照片的修复视频？甚至可能花钱请别人帮忙修复过珍贵的老照片？但这些可能你以为是专业的照片修复人员做的事情，其实只用一个软件进行AI计算后就能获得。今天就简单聊一聊“让照片动起来”背后的AI算法。

为什么目前AI技术带火的视频都是基于人像照片的内容？这就要从这项技术的原理“生成对抗网络”说起了。生成对抗网络，业内简称“GAN”（GenerativeAdversarialNetworks）。

拟人化的GAN

Generative在英语里面是“有生殖性的”意思，Adversarial是“对抗的”，Networks是“网络”，所以简单来说“GAN”就是一种可以自我繁殖进化的网络模型。

那么“GAN”主要做的是什么呢？以它最常用的图像识别领域为例，比如看图识狗，网络模型会有一组算法专门搜集狗的图片，并根据这些图片生成一只“不存在”的新狗，而它的对抗算法则是要识别出这只“不存在”的狗。

然后通过它们不断地对抗训练，最终这套算法一方面“造”狗能力超强，一方面“识”狗能力也超强。

目前，我发现在图片领域做得比较深入的是国内飞桨AI工作室做的“PaddleGAN”，基本上我们看到比较火的照片动态视频技术他们都有涉猎：

照片动漫化人像卡通化妆容迁移妆容迁移

唇形同步

脸部动作迁移老视频修复图像变换超分辨率

老照片修复曾经是抖音上风靡一时的收费项目，后来小火了一阵的“蚂蚁呀嘿”也让不少人为之付费，现在它们则是加成在一起，让老照片活过来唱歌说话成了更新的玩法。而这些技术，只要会一点Python语言，就可以找到开源的代码让AI来完成。

目前看到的新项目有老人变年轻、大人变小孩，可以克隆声音的“柯南变声器”等等，未来你可能真的无法判断屏幕后面的那个TA到底是男是女，是老是小。这是科技带给我们的神奇，也是科技带给我们的困扰，要科技向善，终究还是看使用它的人。

这里是「黄浩在观察」，观察世间动向，剖析深度思考，为你分享科技生活新认知，说说我的所闻所想，也欢迎在留言区po出你的观点或者问题，我会精选出有价值的观点和问题，为你解读和解答

#人工智能AI技术#