什么是 Creative Reality™ Studio?
D-ID 的 Creative Reality™ Studio 是一个自助服务平台,具有最好的生成 AI 工具,使用户能够创建带有移动和说话的化身的视频。Creative Reality™ Studio 结合了 D-ID 的深度学习面部动画技术与 GPT-3 文本生成和稳定扩散文本到图像功能的强大功能,是第一个为那些寻求创造令人惊叹的人提供的一体化平台和具有人工智能力量的尖端视频。
Creative Reality™ Studio 适合谁?
Creative Reality™ Studio 专为希望将数字人类用于销售、营销、培训和客户成功等广泛商业目的的企业以及希望使用 AI 化身通过将他们的艺术创作出令人惊叹的视频的内容创作者而开发生活。
视频
您支持什么视频格式和分辨率?
- 所有视频均以 MP4 格式生成
-
- 输出视频分辨率取决于您使用的 AI Presenter 以及您的 D-ID Creative Reality™ Studio计划。
- 标准 AI Presenter 输出分辨率始终高达 1280×1280 像素。
- Premium AI Presenter 输出分辨率
试用计划 – 720p
Lite 计划 – 不支持 Premium Presenter
Pro、Advanced 和 Enterprise 计划 – 1080p
- 输出视频分辨率取决于您使用的 AI Presenter 以及您的 D-ID Creative Reality™ Studio计划。
输出视频长度是多少?
使用 D-ID Creative Reality Studio 时,视频长度限制为 5 分钟。使用 API 时,视频长度最长为 10 分钟。
图片上传大小和格式要求是什么?
- 使用 D-ID Creative Reality Studio 时,图像大小限制为 4.5 MB。使用 API 时,它会上升到 15 MB
- 支持的格式 – JPEG、JPG、PNG
生成人脸
如何创建我想要制作动画的面孔?
在 Creative Reality™ Studio 中可以通过三种方式制作面部动画
- 从现有的预制头像中选择一个
- 上传面部图像
- 使用我们的 Stable Diffusion 驱动的文本到图像肖像生成器
让化身说话
我如何确定头像会说什么?
可以通过三种方式为视频添加声音
- 输入您希望头像说出的脚本
- 上传录音
- 使用 GPT-3 文本生成器编写脚本
你们提供语音克隆服务吗?
语音克隆目前仅适用于企业客户。如果您对此感兴趣,请通过support@d-id.com联系我们的支持团队
支持哪些音频格式和长度?
使用 Creative Reality Studio 时,音频大小限制为 4.5MB,最长 5 分钟。使用 API 时,音频大小最高可达 15MB,最长可达 10 分钟
支持的音频格式——MP3、FLAC、M4A、MP4、WAV
Creative Reality™ Studio 支持哪些语言?
该工作室目前支持 119 种语言,以及各种口音和说话风格
我可以添加停顿以使文本更逼真吗?
您可以通过单击文本框底部的秒表图标在脚本中添加中断。每次休息时间为 0.5 秒。
生成人脸时如何确保得到正确的结果?
图像提示是艺术与科学的结合。我们的图像生成软件经过优化,可以生成可以在工作室中制作动画的面孔,但还有很大的创造力空间。首先,我们建议您选择一个预先创建的提示并尝试这些提示的变体。或者,尝试在Lexica或众多在线提供的提示构建平台上搜索提示和灵感。
水印
为什么你所有的视频都有水印?
作为一家使用户能够创建基于 AI 的内容的公司,对我们来说重要的是,我们生成的视频的合成性质要透明。这也反映在我们的道德宣言中,可从http://d-id.com/ethics获取。
水印是什么样子的?
取决于你的计划:
- 试用版和精简版计划获得 D-ID 徽标水印
- Pro 计划用户获得一个通用的小型 AI 水印
- 高级和企业用户可以自定义 AI 水印,但不能删除。
图像、文本和音频审核
为什么我的图片被拒绝了?
有两个可能的原因:
答:您尝试使用的图像未能通过我们内置的审核流程。审核由第 3 方工具执行,仅允许企业客户绕过它,前提是他们使用自己的审核解决方案。
如果您是高级计划用户,您可以选择请求人工审核B. 您的图像不符合我们的图像指南:– 面对相机,中景– 中性表情,闭嘴– 最小头部尺寸 200×200 像素–良好且一致的照明– 高达 4.5MB – 无面部遮挡(太阳镜、面具、遮阳板、大耳环)