Etiqueta: Z-Image Turbo

  • Z-Image Turbo – ComfyUI

    Z-Image Turbo – ComfyUI

    Z-Image Turbo es un modelo de generación de imágenes realistas de alta resolución que puede correr en hardware de consumidor, que en mi caso es la vieja confiable RTX3060 de 12GB, y si, es un modelo sin restricciones.

    Cabe mencionar que éste es un modelo simplificado y que la versión completa será próximamente publicada.

    https://zimageturbo.org

    Instalación

    Archivos: https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/split_files

    Variante fp8: https://huggingface.co/drbaph/Z-Image-Turbo-FP8/tree/main

    Variantes GGUF: https://huggingface.co/jayn7/Z-Image-Turbo-GGUF/tree/main

    NombreFormatoTamaño
    z_image_turbo_bf16safetensors11.44 GB
    z_image_turbo_fp8_e5m2safetensors5.73 GB
    z_image_turbo_fp8_e4m3fnsafetensors5.73 GB
    z_image_turbo-Q8_0gguf6.72GB
    z_image_turbo-Q3_K_Sgguf3.53 GB

    El archivo de ejemplo de ComfyUI muestra donde se deben de guardar los archivos:

    📂 ComfyUI/
    └── 📂 models/
        ├── 📂 diffusion_models/
        │    └── z_image_turbo_bf16.safetensors
        │    └── z_image_turbo_fp8_e5m2.safetensors
        │    └── z_image_turbo_fp8_e4m3fn.safetensors
        |
        ├── 📂 diffusion_models/
        │    └── z_image_turbo-Q8_0.gguf
        │    └── z_image_turbo-Q3_K_S.gguf
        |
        ├── 📂 text_encoders/
        │    └── qwen_3_4b.safetensors
        |
        └── 📂 vae/
             └── ae.safetensors
    

    Generación

    An full body studio photography of a tiger mascot smiling energetic in a neutral pose in a white background.
    
    Fujifilm Pro 400H style, grainy film texture, low saturation, slightly overexposed, cinematic composition, unique camera angle. Fashion editorial style, 8K resolution.

    Datos de Generación

    • Seed: 2021
    • Steps: 8
    • Width: 1024 (px)
    • Height: 1024 (px)
    • Sampler: DDIM
    • Scheduler: DDIM Uniform

    Comparación de Modelos

    Conclusiones

    En mi opinión, la Q8_0 es la mejor opción a utilizar. Permite generar imágenes de excelente calidad, muy similares a las de la versión bf16, con la gran ventaja de que puede funcionar en tarjetas de grado consumidor de 8GB de VRAM.

    Para más imágenes: https://galeria.neuralizando.com/index.php?/category/1