人工智能一直处于许多行业变化的最前沿,艺术也不例外。事实上,人工智能的一个有趣的应用是能够将单词和句子转化为令人难以置信的视觉艺术品。无论您是平面设计师、作家、内容创作者、负责撰写论文的学生,还是想要尝试人工智能创意可能性的人,都有几种工具可用于将文本变成杰作。
在这篇文章中,我们将列出使用文本输入创建 AI 艺术的最佳方法。
1. 达尔-E
ChatGPT并不是OpenAI为用户提供的唯一产品,它还具有DALL-E,这是一种可以从文本描述中生成图像的深度学习模型,是完成此操作的首批工具之一。该工具于 2021 年 3 月随 GPT-2 一起推出,然后更新到 DALL-E <>,此后由微软、CALA 和 Mixtiles 实施。
要使用 DALL-E,您需要启动 labs.openai.com 并登录到您现有的 OpenAI 帐户,或者使用您的电子邮件地址或 Google/Microsoft 帐户创建一个帐户。您可以将文本提示作为输入添加到 DALL-E 中,以生成各种图像,如数字艺术、逼真的图像、绘画、绘图等。
如果您缺乏灵感,可以查看DALL-E的主页,其中显示了用户创建的图像以及用于制作它们的输入。
处理完输入后,DALL-E 将显示一组与您的输入相关的四个图像。您可以通过单击展开视图在展开视图中查看这些图像中的任何一个。
当您从生成的结果中打开图片时,您可以选择下载图片、通过公开与他人共享图片、创建更多变体或在 DALL-E 的内置图像编辑器中编辑图片。
本机图像编辑器具有添加生成帧和擦除图像部分的选项,您可以通过生成新的变体来替换这些部分。生成框架允许您通过包含更多要添加的文本提示来向图像添加更多元素。
从输入生成一组图像后,DALL-E 将为每个请求扣除一个积分 – 通过文本提示生成图像、请求编辑图像或请求创建变体。所有用户每月获得 15 个积分,这些积分将在授予后 30 天到期,因此您不能将免费积分滚动到下个月。当您的积分用完时,您只能通过购买更多积分来生成更多图像,这些积分自购买之日起最多可以使用 12 个月。
2. 稳定的扩散
稳定扩散由 Stability AI 于 2022 年发布,是另一种文本到图像生成模型,以前基于 DALL-E,但目前由潜在扩散模型提供支持。
您可以使用此工具从文本输入创建图像,就像在 DALL-E 上一样,但稳定扩散提供了一个额外的功能,它称为“负面提示”。在“输入负面提示”文本框中,您可以提及图像中不需要的元素,例如“树木”和“蓝天”,并且生成的图像不会在其上绘制这些元素。
处理您的请求后,稳定扩散将根据您输入的输入向您显示一组 4 个 AI 生成的图像。您可以通过单击展开视图中的结果来查看图像。
在展开视图中,您可以将图像保存在桌面上,文件将以 768 x 768 像素的分辨率另存为 JPG。
还有另一个附加选项,可让您调整生成的图像与您输入的提示的接近程度。为此,您可以将“高级设置”中的“指导比例”滑块向左或向右拖动,以将值调整到 0 到 50 之间的任意位置。您可以选择更高的值,以确保创建的图像与您的输入更相关;如果要尝试并查看更多艺术版本,请使用较低的值。
您可以免费使用稳定扩散,因为该服务可供所有人使用,并且不依赖于信用系统。也不需要注册,这意味着您可以直接从网页从头开始创建图像。
3. 克雷永
在这篇文章中列出的工具中,只有Craiyon会为您的提示提供最多的结果。虽然大多数文本到图像生成器在单个提示下最多只能显示 4 张图像,但当您在 Craiyon 上输入提示并单击“绘图”时,您将看到一组 9 种不同的艺术品。您还可以通过在Android设备上从Play商店下载其应用程序来在手机上使用Craiyon;它尚未在iOS上可用。
虽然AI可能不会在所有生成的图像上显示您喜欢的艺术风格,但在我们的测试中,Craiyon的结果非常具有艺术性,并且所有建议的结果本身看起来都是独一无二的。与稳定扩散不同,Craiyon 不允许您指定负面提示,因此如果您希望 AI 从图像中删除或忽略某些元素,则必须将它们添加到输入提示中。
如果您喜欢任何生成的图像,可以单击它们并使用“下载”图标将它们保存在您的设备上。然后,图像将以比其他分辨率更高的分辨率(即 1024 x 1024 像素)保存为 WEBP 文件。Craiyon 还允许您使用您创建的图像创建自定义 T 恤,当您在生成结果的同一页面上向下滚动时,此选项将可见。您可以使用生成的图像之一或整个网格以及输入文本自定义此 T 恤。
至于它的用法,您可以使用Craiyon免费创建任意数量的图像,只要您愿意。在免费帐户中创建一组图像的等待时间为1-2分钟,从这些帐户保存的图像将在右下角带有水印。
如果您希望去除水印并减少等待时间,您可以订阅 Craiyon 的支持者或专业计划,每月 6 美元或 24 美元。除此之外,付费计划会将您的请求视为重中之重,您在生成图像时应该不会看到任何广告。从付费帐户生成的图像保持私密,而保存在免费帐户上的图像可以由Craiyon共享或匿名显示在Craiyon搜索中。
4. 跑道 ML
Runway ML与Stable Diffusion有联系,因为它与Stability AI合作,帮助开发AI图像生成器。虽然它通过视频创建、图像到图像对话以及使用更多提示扩展图像来扩展其 AI 工具套件,但它仍然允许您使用文本提示从头开始创建图像。
您可以通过打开此链接开始使用 Runway ML 的文本到图像工具,然后从头开始制作 AI 图像,而无需注册或创建帐户。
免费用户将获得多达 105 个积分,可用于从文本或 Runway 上可用的其他 AI 工具生成图像。单个图像创建将花费您 1 个积分,并且根据您请求的输出图像数量,您可能需要支付更多费用。当您的积分用完时,您必须注册并将您的帐户升级到 Runway ML 的标准或专业计划才能获得更多的每月积分。
与上面列出的其他AI工具不同,Runway产品与众不同的一件事是您可以在生成图像之前选择的一组自定义选项。您可以设置自定义纵横比、调整分辨率(不在免费帐户上)、选择输出数量,并指定提示权重以调整输出与您输入的提示的相关程度。
除此之外,您还可以为要生成的图像选择一种风格(如赛博朋克、数字、波普艺术、幻想等)、艺术应该遵循的媒介(绘画、蜡笔、油画、插图等)以及图片的整体情绪(如未来派、极简、丰富多彩、不祥、戏剧性、宇宙等)。
5. 袋熊梦
Dream by Wombo是另一个文本到图像的创建者,可以作为网络应用程序访问,也可以分别从Play商店和App Store下载其Android或iOS版本。您无需登录即可开始使用文本提示进行创作,但您输入的每个提示只能查看一张图像;随后输入的提示数没有限制。
如果您希望该工具生成多个输出,则必须选择升级到高级帐户,您可以以每月 9.99 美元或每年 89.99 美元的价格购买该帐户。该服务还提供 169.99 美元的终身高级会员资格,您可以使用它无限期地生成任意数量的 AI 艺术。高级计划可以为您提供 4 种不同的提示输出、最多 3 种变体、高级样式、更快的生成速度以及使用 AI 生成视频的附加功能。
当您在 Dream 上输入文本时,您可以使用一系列预设的艺术风格微调结果,其中一些是免费提供的。
该工具还允许您上传图像作为输入,您可以在生成输出时将其用作参考。除此之外,您还可以添加您的任何 NFT 艺术作为参考图像,以创建它的更多变体。
生成图像后,您可以使用“使用文本编辑”选项对输出图像进行进一步编辑。
当图像在编辑模式下加载时,通过键入提示输入要对其进行的更改。您最多可以对生成的图像进行 2 次编辑、保存这些变体或撤消此屏幕中的更改。