毕业论文
您现在的位置: 语言识别 >> 语言识别市场 >> 正文 >> 正文

简单聊聊让照片动起来背后的AI算法

来源:语言识别 时间:2022/11/3

你是不是也曾经在短视频平台看到过老照片的修复视频?甚至可能花钱请别人帮忙修复过珍贵的老照片?但这些可能你以为是专业的照片修复人员做的事情,其实只用一个软件进行AI计算后就能获得。今天就简单聊一聊“让照片动起来”背后的AI算法。

为什么目前AI技术带火的视频都是基于人像照片的内容?这就要从这项技术的原理“生成对抗网络”说起了。生成对抗网络,业内简称“GAN”(GenerativeAdversarialNetworks)。

拟人化的GAN

Generative在英语里面是“有生殖性的”意思,Adversarial是“对抗的”,Networks是“网络”,所以简单来说“GAN”就是一种可以自我繁殖进化的网络模型。

那么“GAN”主要做的是什么呢?以它最常用的图像识别领域为例,比如看图识狗,网络模型会有一组算法专门搜集狗的图片,并根据这些图片生成一只“不存在”的新狗,而它的对抗算法则是要识别出这只“不存在”的狗。

然后通过它们不断地对抗训练,最终这套算法一方面“造”狗能力超强,一方面“识”狗能力也超强。

目前,我发现在图片领域做得比较深入的是国内飞桨AI工作室做的“PaddleGAN”,基本上我们看到比较火的照片动态视频技术他们都有涉猎:

照片动漫化人像卡通化妆容迁移妆容迁移

唇形同步

脸部动作迁移老视频修复图像变换超分辨率

老照片修复曾经是抖音上风靡一时的收费项目,后来小火了一阵的“蚂蚁呀嘿”也让不少人为之付费,现在它们则是加成在一起,让老照片活过来唱歌说话成了更新的玩法。而这些技术,只要会一点Python语言,就可以找到开源的代码让AI来完成。

目前看到的新项目有老人变年轻、大人变小孩,可以克隆声音的“柯南变声器”等等,未来你可能真的无法判断屏幕后面的那个TA到底是男是女,是老是小。这是科技带给我们的神奇,也是科技带给我们的困扰,要科技向善,终究还是看使用它的人。

这里是「黄浩在观察」,观察世间动向,剖析深度思考,为你分享科技生活新认知,说说我的所闻所想,也欢迎在留言区po出你的观点或者问题,我会精选出有价值的观点和问题,为你解读和解答

#人工智能AI技术#

转载请注明:http://www.0431gb208.com/sjszlff/2230.html