Z-Image(造相) 是阿里巴巴通义实验室开发的一个强大且高效的图像生成模型,拥有 6B 参数。它采用 可扩展单流 DiT(S3-DiT)架构,将文本、视觉语义 token 和图像 VAE token 在序列级别进行拼接,作为统一的输入流,最大化参数效率。 Z-Image(Base)是非蒸馏基础模型,专为社区驱动的微调和自定义开发而设计。 模型亮点:Documentation Index
Fetch the complete documentation index at: https://dripart-fix-cloud-button-text-1773163393.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
- 照片级真实质量:在保持出色美学质量的同时,提供强大的照片级真实图像生成
- 精准的双语文本渲染:擅长准确渲染复杂的中英文文本
- 提示词增强与推理:提示词增强器赋予模型推理能力
- 微调就绪:适合自定义训练和适配的理想基础模型
Z-Image 文生图工作流
下载工作流
下载 Z-Image 文生图工作流 JSON 文件。
在 ComfyUI Cloud 上运行
在 ComfyUI Cloud 上直接运行此工作流。
Z-Image 模型下载
qwen_3_4b.safetensors
Z-Image 文本编码器。
z_image_bf16.safetensors
Z-Image 扩散模型。
ae.safetensors
Z-Image VAE。