输入文本就能生成高解析图片OpenAI

来源：语言识别时间：2022/9/12

AI人工智能的发展一日千里，并在许多方面展现超越人类的能耐，AI不但打败了世界棋王，也击溃电竞冠军团队（例如，OpenAI通过自家开发的Bots让《Dota2》游戏顶尖高手在一场表演赛中首尝败北的滋味）。不仅如此，AI还会写文章，由OpenAI研究实验室推出的GPT-2及GPT-3文本产生预训练语言模型，因为能书写出媲美人类文笔的文章，因而沦为撰写假新闻的利器。如今，OpenAI推出新一代的DALL·E2系统，只要通过一段描述文本便能叫AI帮你产生各种图片。

去年1月OpenAI推出基于GPT-2/GPT-3语言模型与CLIP图片识别系统的DALL·E，可将用户输入文本转变成生动的超现实主义图片。例如，用户可以通过文本描述，要求DALL·E产生一张宇航员在外太空骑马的图片，或是两只泰迪熊在月球上致力新AI研究的图片，所以其超现实的程度甚至媲美超现实主义画家达利（SalvadorDalí）。“DALL·E”这个字就是达利与迪士尼电影《瓦力》（WALL-E）机器人这两个名字的组合。

但第一代的DALL·E图片像素只有×，如今第二代的DALL·E2图片画质可达×，所以分辨率与低延迟的表现更胜一筹。如今DALL·E2更新了CLIP系统，并改名叫unCLIP。该新系统支持名为扩散作用（diffusion）的处理程序，该程序会先从随机点形成的图案开始，一旦取得更具体的描述重点后，会渐近地转变成图片。

除了产生新图片外，用户还可通过DALL·E2局部变更现有图片中的一部分，例如在水池中添加一只鸭子或去除某个对象，系统同时会将阴影、反光及材质等因素纳入考量。用户还可以根据原始图片，发挥创意地额外产生不同风格、内容或角度的变体图片。

如同语言模型会被拿来产生假新闻一样，DALL·E2之类的图片产生工具也有可能遭到滥用。对此，OpenAI提供了一些到位的保护机制，包括用户无法根据姓名生成人像照，也无法生成或上传令人反感的内容。再者，除了仇恨、骚扰、暴力、自残、裸露及非法活动等主题严禁涉及外，也禁止产生包括假新闻、政局、医疗乃至疾病相关的图片。

未来，OpenAI有可能不会直接公开推出DALL·E2，而会提供给第三方App使用。

（首图来源：OpenAI）

转载请注明：http://www.0431gb208.com/sjslczl/1537.html

上一篇文章：图片识别文字图文教程,免费OCR软件转文

下一篇文章： 1分钟教你快速掌握照片识别文字的方法