AI人工智能的发展一日千里,并在许多方面展现超越人类的能耐,AI不但打败了世界棋王,也击溃电竞冠军团队(例如,OpenAI通过自家开发的Bots让《Dota2》游戏顶尖高手在一场表演赛中首尝败北的滋味)。不仅如此,AI还会写文章,由OpenAI研究实验室推出的GPT-2及GPT-3文本产生预训练语言模型,因为能书写出媲美人类文笔的文章,因而沦为撰写假新闻的利器。如今,OpenAI推出新一代的DALL·E2系统,只要通过一段描述文本便能叫AI帮你产生各种图片。
去年1月OpenAI推出基于GPT-2/GPT-3语言模型与CLIP图片识别系统的DALL·E,可将用户输入文本转变成生动的超现实主义图片。例如,用户可以通过文本描述,要求DALL·E产生一张宇航员在外太空骑马的图片,或是两只泰迪熊在月球上致力新AI研究的图片,所以其超现实的程度甚至媲美超现实主义画家达利(SalvadorDalí)。“DALL·E”这个字就是达利与迪士尼电影《瓦力》(WALL-E)机器人这两个名字的组合。
但第一代的DALL·E图片像素只有×,如今第二代的DALL·E2图片画质可达×,所以分辨率与低延迟的表现更胜一筹。如今DALL·E2更新了CLIP系统,并改名叫unCLIP。该新系统支持名为扩散作用(diffusion)的处理程序,该程序会先从随机点形成的图案开始,一旦取得更具体的描述重点后,会渐近地转变成图片。
除了产生新图片外,用户还可通过DALL·E2局部变更现有图片中的一部分,例如在水池中添加一只鸭子或去除某个对象,系统同时会将阴影、反光及材质等因素纳入考量。用户还可以根据原始图片,发挥创意地额外产生不同风格、内容或角度的变体图片。
如同语言模型会被拿来产生假新闻一样,DALL·E2之类的图片产生工具也有可能遭到滥用。对此,OpenAI提供了一些到位的保护机制,包括用户无法根据姓名生成人像照,也无法生成或上传令人反感的内容。再者,除了仇恨、骚扰、暴力、自残、裸露及非法活动等主题严禁涉及外,也禁止产生包括假新闻、政局、医疗乃至疾病相关的图片。
未来,OpenAI有可能不会直接公开推出DALL·E2,而会提供给第三方App使用。
(首图来源:OpenAI)
转载请注明:http://www.0431gb208.com/sjslczl/1537.html