
通义万相
通义万相AI视频生成工具
Imagen是谷歌开发的基于扩散模型的文本生成图像人工智能系统,最新版本为Imagen 4(2025年5月发布),支持2K分辨率、精细细节生成及文字排版设计。以下是核心信息:
技术特点
– 高保真生成:通过整合大型语言模型与视觉生成技术,生成高质量图像,尤其擅长人物面部、手部及复杂场景(如水滴、织物)的细节表现 。
– 多语言与风格适配:支持多语言提示词翻译,可生成写实或抽象风格图像,并通过参考图像调整输出风格 。
– 文字与排版能力:优化文本叠加功能,适用于广告设计等场景,支持生成徽标、Logo及排版内容 。
版本与应用
– Imagen 4:普通版单张图像0.04美元,Ultra版(0.06美元/张)主打文本响应精度,集成至Gemini API、Vertex AI及Google Workspace 。
– Imagen 2:2023年发布,支持Inpainting/Outpainting编辑功能,曾用于生成油画、水下场景等复杂图像 。
价格与服务
– 付费模式:普通版按需计费,免费测试通过Google AI Studio提供 。
– 应用场景:社交媒体广告、创意设计及交互式应用(如拍立得风格照片生成) 。


