如果你经常上网,你可能最近已经看到或听说过人工智能(AI)图像生成、文本到图像AI或DALL-E AI。但如果你仍然不确定这些大惊小怪的到底是什么,没关系!

就科技而言,我们生活在一个非凡的时代。似乎每天都有新的技术发现掀起波澜,带来间接的承诺,让一些人感到恐惧,让另一些人感到兴奋。最近,这项技术是文本到图像的AI,更具体地说,是一种名为DALL-E的人工智能。

但这种“新”技术究竟是什么?它能做什么?它从何而来?

什么是DALL-E 2 AI?

DALL-E 2是一款新的人工智能系统,是OpenAI于2021年1月推出的原始DALL-E的继承者。该程序的新版本能够仅根据用户输入的描述性文本生成高质量、逼真的图像和艺术,分辨率比原始技术高4倍。而且,它还能够操作现有图像,以添加新的、有趣的元素。这些逼真的编辑和完全生成的图像一样令人印象深刻。

DALL-E这个名字是西班牙著名超现实主义艺术家萨尔瓦多Dalí和皮克斯可爱的立方体机器人的合成词瓦力

OpenAI是DALL-E和DALL-E 2 AI的创造者,是一家成立于2015年的人工智能研究实验室。该组织隶属于营利性公司OpenAI LP及其非营利性母公司OpenAI Inc.。

OpenAI团队他们希望“DALL-E 2能让人们创造性地表达自己。DALL-E 2还帮助我们了解先进的人工智能系统如何看待和理解我们的世界,这对我们创造造福人类的人工智能的使命至关重要。”

文字图像AI如何工作

直接从OpenAI的网站,DALL-E 2的工作原理一个叫做扩散的过程“[DALL-E 2]从随机点的模式开始,并在识别图像的特定方面时逐渐改变该模式。”

然而,从用户的角度来看,这意味着您可以按照字面意思输入任何描述性文本或提示(这是适当的,并且在合理的理解范围内),DALL-E将仅根据该文本输出相关图像。这是非常了不起的。就像我们之前提到的,机器学习程序也能够对现有的图像进行修改和添加——这更令人印象深刻。

想看一只章鱼在月球上抽雪茄吗?当然。再画一幅名画,但画中人戴着格劳乔·马克思的眼镜怎么样?你的赌注。

这些都是一些荒谬的例子,说明了这项技术的能力。但是,它也可以产生真正的、一流的图像和原创的艺术作品,这些作品足以与一些最具成就的人类创作作品相媲美。正因为如此,人们对这项技术的看法褒贬不一,尤其是从事创造性职业的人,他们担心技术会对他们不利。

人工智能能够吐出如此令人信服的图像,这一不可思议的能力让许多人提出了这样的问题:“DALL-E 2会扼杀创意职业吗?”考虑到这些生成的图像有多有说服力,这当然是一个合理的问题。

从好的方面来看,OpenAI希望他们的技术最终能被用于好的方面——而且是有用的。他们提到,他们看到了这个系统的价值,即能够通过激发灵感来帮助艺术家进行创作。

我们自己的设计和UX总监Ken Boostrom被接受参加BETA发布,现在能够使用DALL-E 2创建AI美术和图像。

Ken解释说:“作为一种创造力的工具,它非常好,可以生成独特的图像、构图、灯光、风格、角色的视觉分解等等……”“我让列奥纳多·达·芬奇画出一条龙,并请我最喜欢的画家雷诺阿画出桃树下的一对恋人。”

肯的提示:“皮埃尔-奥古斯特·雷诺阿风格的郁郁葱葱的花园里,桃树下的一对恋人”
肯的提示:“一条龙在Conté蜡笔在达芬奇风格”

“人工智能不会消失,它真的是一个很棒的工具。我们(设计师、美工、作家等)应该非常擅长AI命令、情景列表、描述性词汇、艺术家、风格和概念。”

DALL-E似乎是一个很好的开始。

DALL-E是开源和免费使用的吗?

开源的定义是指软件的原始源代码已被公开并免费提供,允许用户根据自己的喜好修改和发布。

想想音乐和电视中的“公共领域”,当某些东西进入公共领域时,人们可以自由地使用该主题,而不必担心版权法。这里的想法是一样的——开发人员已经公开发布了软件的原始代码,并表示可以按照任何人认为合适的方式使用和修改。

但现在的问题是——DALL-E 2是开源的吗?简短的回答是:不。稍微长一点的答案是:还没有。

OpenAI的托管版本的DALL-E 2已经经过训练,可以省略明显的内容,例如暴力、性或仇恨性质的图像。让这项技术开源的主要担忧是,当用户不可避免地使用人工智能工具做更糟糕的事情时,所有的培训都会被破坏。

就目前而言,如果你选择使用DALL-E 2,而它托管在OpenAI上,你必须遵守他们的要求内容策略

但是,这并没有阻止竞争对手,甚至是独狼们建造自己的人工智能图像机器。广受欢迎的DALL-E Mini在互联网上掀起了风暴,并被大量用于创建人工智能生成的表情包,它不是直接来自OpenAI的产品,但它的代码在很大程度上基于DALL-E和DALL-E 2。

好奇的人可以看看他们的定价模式:

DALL-E是几乎免费使用。OpenAI表示,用户可以免费使用DALL-E进行创作,使用每月重新填充的积分。对于有更高要求的用户,他们可以购买115个额外积分,只需15美元。

销售DALL-E 2生成图像

2022年7月,OpenAI宣布DALL-E 2正在进入BETA测试该公告的部分内容包括版权信息,其中提到:“用户获得使用DALL-E 2创建的图像商业化的完全使用权,包括打印、销售和商品的权利。这包括他们在研究预览期间生成的图像。”

这对于那些最终将利用这项技术来创造独特而迷人的图像的人来说是一件伟大的事情。OpenAI也收到了一些关于他们的用户打算如何使用DALL-E的见解,引用了以下内容:

  • 商业项目,比如儿童书籍的插图。
  • 新闻简报的艺术。
  • 游戏的概念艺术和角色。
  • 用于设计咨询的情绪板。
  • 电影的故事板。

DALL-E现在上线了,你可以购买积分来渲染,几乎可以肯定我们目前看到的不会是AI的最终形态。OpenAI一直坚持继续开发这项技术,在需要的地方进行改进和调整,并确保其安全使用。

查德·赫瑟林顿(Chad Hetherington)是加拿大安大略省布拉夫顿(Brafton)的一名内容作家。他喜欢策划美学,无论是文字、衣服还是家具。尽管如此,他还是在脑子里做了很多这样的事情,因为时间有限,资金有限。但是文字是免费的。