Diffusion Transformer de Flujo Único
Modelo Eficiente de Generación de Imágenes con 6B Parámetros
Escribe tu prompt y mira cómo la IA crea imágenes increíbles en segundos
Aquí aparecerá tu imagen generada
Galería curada
25 resultados recientes con carga diferida. Toca cualquier ficha para ampliarla y ver los detalles.

Z-Image es un modelo fundacional eficiente de 6 mil millones de parámetros para generación de imágenes. A través de optimización sistemática, demuestra que el rendimiento de primer nivel es alcanzable sin depender de tamaños de modelo enormes, ofreciendo resultados sólidos en generación fotorrealista y renderizado de texto bilingüe.
Realismo de nivel fotográfico con control fino sobre detalles, iluminación y texturas. Logra excelente calidad estética en composición y ambiente general.
Logra latencia de inferencia sub-segundo en GPUs H800 de grado empresarial. Solo se necesitan 8 pasos para la generación.
Renderizado preciso de texto en chino e inglés mientras preserva el realismo facial y la composición estética general.
Puede ejecutarse suavemente en tarjetas gráficas de grado consumidor con menos de 16GB de VRAM, haciendo accesible la generación avanzada de imágenes.
Un vistazo a las poderosas capacidades del modelo Z-Image.

Z-Image ofrece modelos especializados para diferentes casos de uso:
Una versión destilada de Z-Image con fuertes capacidades en generación de imágenes fotorrealistas, renderizado preciso de texto en chino e inglés, y adherencia robusta a instrucciones bilingües. Llega a rendimiento comparable o superior a competidores líderes con solo 8 pasos.
Una variante de entrenamiento continuo de Z-Image especializada en edición de imágenes. Se destaca por seguir instrucciones complejas para realizar una amplia gama de tareas, desde modificaciones locales precisas hasta transformaciones de estilo globales, mientras mantiene alta consistencia de edición.
Descubre las capacidades avanzadas de Z-Image en varios dominios.
Ofrece generación de imágenes fotorrealistas sólida mientras mantiene excelente calidad estética.
Renderiza con precisión texto complejo en chino e inglés en varios escenarios.
Posee vasta comprensión del conocimiento mundial y conceptos culturales diversos.
Usa cadena de razonamiento estructurado para inyectar lógica y sentido común.
Ejecuta precisamente instrucciones complejas para transformaciones de imagen.
Demuestra control detallado sobre elementos de imagen y transformaciones.
Resultados competitivos en AI Arena con rendimiento de vanguardia entre modelos de código abierto.
Parámetros
Pasos de Inferencia
VRAM Requerido
Latencia de Inferencia
Según la Evaluación de Preferencias Humanas basada en Elo (en AI Arena), Z-Image muestra un rendimiento altamente competitivo contra otros modelos líderes.
Z-Image muestra un rendimiento altamente competitivo contra otros modelos líderes, mientras logra resultados de vanguardia entre modelos de código abierto.
AI Arena
Sistema de Puntuación Elo
El código del modelo, pesos y demo en línea están ahora públicamente disponibles para alentar la exploración y uso de la comunidad.
Comunidad
Código Abierto
Nuestro objetivo es promover el desarrollo de modelos generativos que sean accesibles, de bajo costo y alto rendimiento.
Investigadores
Académico
Obtén las últimas noticias y actualizaciones sobre Z-Image.
Preguntas comunes sobre Z-Image y sus capacidades.
Para más información, visita nuestro repositorio de GitHub
Experimenta el poder de la generación eficiente de imágenes con Z-Image.
🚀 Código abierto y públicamente disponible
Equipo Z-Image, Tongyi MAI, Alibaba Group