Z-Image高效图像生成

单流扩散 Transformer
高效的 60 亿参数图像生成模型

使用 Z-Image Turbo 生成图片

输入提示词,几秒内生成惊艳画面

灵感示例

生成的图片会显示在这里

精选作品墙

灵感墙,秒级生成

25 张最新作品,懒加载展示。点击任意图片即可放大查看细节。

点击放大
introduce

什么是 Z-Image?

Z-Image 是一个高效的 60 亿参数图像生成基础模型。它通过系统性的优化证明了顶尖性能的实现无需依赖巨大规模,在照片级真实感图像生成和中英双语文本渲染方面效果突出。

照片级真实感

摄影级别的真实感,能够精细控制画面的细节、光影和纹理。在保证高保真度的同时,兼顾了构图与整体氛围上的美学表现。

极速推理

在企业级 H800 GPU 上实现亚秒级推理延迟。仅需 8 步即可完成图像生成。

中英双语文本渲染

能准确渲染中英文文本,同时保持人脸真实性和画面美感,效果媲美顶尖闭源模型。

高效显存使用

能够在 16GB 显存的消费级显卡上流畅运行,让顶尖的图像生成技术惠及普通大众。

核心特性

一览 Z-Image 模型强大功能特性。

摄影级别真实感

benefits

模型变体

Z-Image 提供针对不同用例的专用模型:

1

🚀 Z-Image-Turbo

Z-Image 的蒸馏版本,擅长生成逼真图像,能精准渲染中英文文本,并严格遵循双语指令。仅需 8 步推理评估即可达到或超越主流竞品性能。

2

✍️ Z-Image-Edit

Z-Image 的持续训练变体,专用于图像编辑。它精于遵循复杂指令,能够胜任从精准的局部修改到全局的风格变换等多种任务,并同时保持高度的编辑一致性。

能力展示

探索 Z-Image 在各个领域的先进能力。

照片级真实感生成

在保证优秀美学质量的同时,实现强大的照片级真实感图像生成。

双语文本渲染

能够在各种场景下精确渲染复杂的中英文文本内容。

世界知识

具备广博的世界知识与对多元文化的深刻理解。

语义理解

使用结构化推理链注入逻辑与常识,提升理解能力。

创意编辑

精确执行复杂指令,实现灵活的图像变换。

指令遵循

展示对图像元素和变换的精细控制能力。

模型性能

在 AI Arena 上的竞争性结果,在开源模型中实现最先进性能。

60 亿 参数

60 亿

参数

8 步 推理步数

8 步

推理步数

16GB 显存需求

16GB

显存需求

<1秒 推理延迟

<1秒

推理延迟

人类偏好评估

根据基于 Elo 的人类偏好评估(在 AI Arena 上),Z-Image 与其他领先模型相比表现出极强的竞争力。

Z-Image 与其他领先模型相比表现出极强的竞争力,同时在开源模型中取得了最先进的结果。

arena

AI Arena, Elo 评分系统

AI Arena

Elo 评分系统

模型代码、权重及在线 Demo 已公开发布,以鼓励社区的探索和使用。

community

社区, 开源

社区

开源

我们希望通过此次发布,推动开发兼具普惠性、低成本与高性能的生成模型。

researchers

研究者, 学术

研究者

学术

保持更新

获取关于 Z-Image 的最新资讯和更新。

常见问题

关于 Z-Image 及其功能的常见问题。







更多信息,请访问我们的 GitHub 仓库

立即开始使用 Z-Image

体验 Z-Image 高效图像生成的力量。

🚀 开源并公开发布

通义 MAI 团队,阿里巴巴集团