Z-Image高效圖像生成

單串流擴散 Transformer
具備 60 億參數的高效圖像生成模型

使用 Z-Image Turbo 生成圖片

輸入提示詞,數秒內生成驚豔畫面

靈感示例

生成的圖片會顯示在這裡

精選作品牆

靈感牆,秒級生成

25 張最新作品,延遲載入展示。點擊任意圖片即可放大查看細節。

點擊放大
introduce

什麼是 Z-Image?

Z-Image 是一個具備 60 億參數的高效圖像生成基礎模型。通過系統性優化,它證明了無需依賴龐大的模型規模也能達到頂級性能,在真實感生成和雙語文字渲染方面表現卓越。

攝影級真實感

達到攝影級的真實效果,可精細控制細節、光線和紋理。在構圖和整體氛圍方面展現出色的美學品質。

超高速推理

在企業級 H800 GPU 上實現亞秒級推理延遲。僅需 8 步即可完成生成。

雙語文字渲染

精準渲染中文和英文文字,同時保持面部真實感和整體美學構圖。

高效記憶體使用

可在消費級顯卡(VRAM 少於 16GB)上流暢運行,讓先進的圖像生成技術更加普及。

核心特色

一覽 Z-Image 模型的強大能力。

攝影級真實效果

benefits

模型變體

Z-Image 提供針對不同使用情境的專業模型:

1

🚀 Z-Image-Turbo

Z-Image 的精餾版本,在真實感圖像生成、中英文文字精準渲染和雙語指令遵循方面表現卓越。僅需 8 步即可達到媲美或超越主要競爭對手的性能。

2

✍️ Z-Image-Edit

Z-Image 的持續訓練變體,專精於圖像編輯。擅長遵循複雜指令執行多種任務,從精確的局部修改到全域風格轉換,同時保持高度編輯一致性。

能力展示

探索 Z-Image 在各個領域的先進能力。

真實感生成

提供強大的真實感圖像生成,同時保持出色的美學品質。

雙語文字渲染

在各種情境下精準渲染複雜的中文和英文文字。

世界知識

擁有對世界知識和多元文化概念的深刻理解。

語義理解

使用結構化推理鏈注入邏輯和常識。

創意編輯

精確執行複雜指令進行圖像轉換。

指令遵循

對圖像元素和轉換展現精細控制。

模型性能

在 AI Arena 上取得競爭性結果,在開源模型中達到最先進的性能。

60 億 參數數量

60 億

參數數量

8 推理步數

8

推理步數

16GB 所需 VRAM

16GB

所需 VRAM

<1秒 推理延遲

<1秒

推理延遲

人類偏好評估

根據基於 Elo 的人類偏好評估(在 AI Arena 上),Z-Image 與其他領先模型相比展現出高度競爭力的性能。

Z-Image 與其他領先模型相比展現出高度競爭力的性能,同時在開源模型中達到最先進的結果。

arena

AI Arena, Elo 評分系統

AI Arena

Elo 評分系統

模型代碼、權重和線上示範現在已公開可用,以鼓勵社群探索和使用。

community

社群, 開源

社群

開源

我們致力於促進可及、低成本、高性能的生成模型發展。

researchers

研究者, 學術

研究者

學術

保持更新

獲取關於 Z-Image 的最新消息和更新。

常見問題

關於 Z-Image 及其功能的常見問題。







如需更多信息,請訪問我們的 GitHub 倉庫

立即開始使用 Z-Image

體驗 Z-Image 高效圖像生成的強大能力。

🚀 開源並公開可用

Z-Image 團隊,通義 MAI,阿里巴巴集團