Single-Stream Diffusion Transformer
Model Generasi Gambar Efisien dengan 6B Parameter
Masukkan prompt dan lihat AI membuat gambar menakjubkan dalam detik
Gambar yang dihasilkan akan muncul di sini
Galeri kurasi
25 hasil terbaru dengan pemuatan malas. Ketuk ubin untuk memperbesar dan melihat detail.

Z-Image adalah model fondasi yang efisien dengan 6 miliar parameter untuk generasi gambar. Melalui optimasi sistematis, model ini membuktikan bahwa performa tingkat teratas dapat dicapai tanpa bergantung pada ukuran model yang sangat besar, menghasilkan hasil yang kuat dalam generasi fotorealistik dan rendering teks bilingual.
Realisme уровня fotografi dengan kontrol halus terhadap detail, pencahayaan, dan tekstur. Mencapai kualitas estetika yang sangat baik dalam komposisi dan suasana keseluruhan.
Mencapai latensi inferensi kurang dari satu detik pada GPU enterprise-grade H800. Hanya perlu 8 langkah untuk generasi.
Rendering yang akurat untuk teks bahasa Mandarin dan bahasa Inggris sambil mempertahankan realisme wajah dan komposisi estetika keseluruhan.
Dapat berjalan dengan lancar pada kartu grafis tingkat konsumen dengan VRAM kurang dari 16GB, membuat generasi gambar tingkat lanjut dapat diakses.
Sekilas tentang kemampuan powerful dari model Z-Image.

Z-Image menawarkan model khusus untuk berbagai kasus penggunaan:
Versi destilasi dari Z-Image dengan kemampuan kuat dalam generasi gambar fotorealistik, rendering yang akurat untuk teks bahasa Mandarin dan bahasa Inggris, dan kepatuhan yang kuat terhadap instruksi bilingual. Mencapai performa yang sebanding atau melebihi kompetitor terkemuka hanya dengan 8 langkah.
Varian pelatihan lanjutan dari Z-Image yang khusus untuk pengeditan gambar. Model ini unggul dalam mengikuti instruksi kompleks untuk melakukan berbagai tugas, mulai dari modifikasi lokal yang presisi hingga transformasi gaya global, sambil mempertahankan konsistensi pengeditan yang tinggi.
Jelajahi kemampuan canggih Z-Image di berbagai domain.
Menghasilkan generasi gambar fotorealistik yang kuat sambil mempertahankan kualitas estetika yang sangat baik.
Merender teks bahasa Mandarin dan Inggris yang kompleks secara akurat dalam berbagai skenario.
Memiliki pemahaman yang luas tentang pengetahuan dunia dan beragam konsep budaya.
Menggunakan rantai penalaran terstruktur untuk menyuntikkan logika dan akal sehat.
MenExecute instruksi kompleks dengan presisi untuk transformasi gambar.
Menunjukkan kontrol yang halus terhadap elemen dan transformasi gambar.
Hasil kompetitif di AI Arena dengan performa state-of-the-art di antara model open-source.
Parameter
Langkah Inferensi
VRAM Diperlukan
Latensi Inferensi
Menurut Elo-based Human Preference Evaluation (di AI Arena), Z-Image menunjukkan performa yang sangat kompetitif dibandingkan model-model terkemuka lainnya.
Z-Image menunjukkan performa yang sangat kompetitif dibandingkan model-model terkemuka lainnya, sambil mencapai hasil state-of-the-art di antara model open-source.
AI Arena
Sistem Peringkat Elo
Kode model, bobot, dan demo online sekarang tersedia untuk publik untuk mendorong eksplorasi dan penggunaan komunitas.
Komunitas
Sumber Terbuka
Kami bertujuan untuk mempromosikan pengembangan model generatif yang dapat diakses, biaya rendah, dan berkinerja tinggi.
Peneliti
Akademik
Dapatkan berita dan update terbaru tentang Z-Image.
Pertanyaan umum tentang Z-Image dan kemampuannya.
Untuk informasi lebih lanjut, kunjungi repositori GitHub kami
Rasakan kekuatan generasi gambar yang efisien dengan Z-Image.
🚀 Sumber terbuka dan tersedia untuk publik
Tim Z-Image, Tongyi MAI, Alibaba Group