Single-Stream Diffusion Transformer
Efektywny model generacji obrazów z 6 miliardami parametrów
Wpisz prompt i zobacz, jak AI tworzy niesamowite obrazy w kilka sekund
Twój wygenerowany obraz pojawi się tutaj
Kuratorowana galeria
25 najnowszych wyników z leniwym ładowaniem. Kliknij kafelek, aby powiększyć i zobaczyć szczegóły.

Z-Image to wydajny model bazowy z 6 miliardami parametrów do generowania obrazów. Poprzez systematyczną optymalizację udowadnia, że najwyższe wyniki są osiągalne bez polegania na ogromnych rozmiarach modeli, dostarczając mocne rezultaty w generacji fotorealistycznej i dwujęzycznym renderowaniu tekstu.
Realizm na poziomie fotograficznym z precyzyjną kontrolą nad detalami, oświetleniem i teksturami. Osiąga doskonałą jakość estetyczną w kompozycji i ogólnym nastroju.
Osiąga latencję wnioskowania poniżej jednej sekundy na procesorach graficznych klasy enterprise H800. Potrzebuje tylko 8 kroków do generacji.
Dokładne renderowanie zarówno tekstu chińskiego, jak i angielskiego, zachowując realizm twarzy i ogólną kompozycję estetyczną.
Może działać płynnie na kartach graficznych klasy konsumenckiej z mniej niż 16GB VRAM, czyniąc zaawansowaną generację obrazów dostępną.
Spójrz na potężne możliwości modelu Z-Image.

Z-Image oferuje wyspecjalizowane modele dla różnych przypadków użycia:
Destylacyjna wersja Z-Image z mocnymi możliwościami w generacji fotorealistycznych obrazów, dokładnym renderowaniem tekstu chińskiego i angielskiego oraz solidnym przestrzeganiem instrukcji dwujęzycznych. Osiąga wydajność porównywalną lub przewyższającą wiodących konkurentów zaledwie w 8 krokach.
Wariant kontynuacji treningu Z-Image wyspecjalizowany w edycji obrazów. Przewyższa w podążaniu za złożonymi instrukcjami do wykonywania szerokiego zakresu zadań, od precyzyjnych modyfikacji lokalnych po globalne transformacje stylu, zachowując wysoką spójność edycji.
Odkryj zaawansowane możliwości Z-Image w różnych dziedzinach.
Dostarcza mocną generację fotorealistycznych obrazów, zachowując doskonałą jakość estetyczną.
Dokładnie renderuje złożony tekst chiński i angielski w różnych scenariuszach.
Posiada ogromne zrozumienie wiedzy o świecie i różnorodnych konceptów kulturowych.
Wykorzystuje ustrukturyzowany łańcuch rozumowania do wprowadzania logiki i zdrowego rozsądku.
Precyzyjnie wykonuje złożone instrukcje dla transformacji obrazów.
Demonstruje precyzyjną kontrolę nad elementami obrazu i transformacjami.
Konkurencyjne wyniki w AI Arena z najnowocześniejszą wydajnością wśród modeli o otwartym kodzie źródłowym.
Parametry
Kroki wnioskowania
Wymagany VRAM
Latencja wnioskowania
Zgodnie z opartym na Elo systemem oceny preferencji ludzkich (w AI Arena), Z-Image wykazuje wysoce konkurencyjną wydajność w porównaniu z innymi wiodącymi modelami.
Z-Image wykazuje wysoce konkurencyjną wydajność w porównaniu z innymi wiodącymi modelami, osiągając najnowocześniejsze wyniki wśród modeli o otwartym kodzie źródłowym.
AI Arena
System oceny Elo
Kod modelu, wagi i demo online są teraz publicznie dostępne, aby zachęcić do eksploracji i użytkowania przez społeczność.
Społeczność
Otwarte źródło
Dążymy do promowania rozwoju modeli generatywnych, które są dostępne, niskokosztowe i wysokowydajne.
Badacze
Akademicki
Otrzymuj najnowsze wiadomości i aktualizacje o Z-Image.
Najczęściej zadawane pytania o Z-Image i jego możliwości.
Aby uzyskać więcej informacji, odwiedź nasze repozytorium GitHub
Doświadcz mocy efektywnej generacji obrazów z Z-Image.
🚀 Otwarte źródło i publicznie dostępne
Zespół Z-Image, Tongyi MAI, Grupa Alibaba