Etiqueta: Hugging Face

  • Z-Image Base – ComfyUI

    Z-Image Base – ComfyUI

    Después de un corto tiempo de espera, sale Z-Image (Base), la versión completa de Z-Image Turbo (ZIT), un modelo que combina la calidad de imagen y velocidad.



    Importante


    La bandera de inicio –fast en el archivo run_(algo).bat de lanzamiento de ComfyUI, provoca que las imágenes generadas terminen completamente en negro.

    https://huggingface.co/city96/Qwen-Image-gguf/discussions/1#6892654731c9796ce6124437


    Instalación

    Descarga de archivos

    Archivos necesarios: https://huggingface.co/Comfy-Org/z_image/tree/main/split_files

    NombreTamaño
    z_image_bf16.safetensors12.3GB
    qwen_3_4b.safetensors8.04GB
    ae.safetensors335MB

    Nota: qwen_3_4b.safetensors y ae.safetensors son los mismos de Z-Image Turbo.

    Variante GGUF para Tarjetas de 8GB VRAM: https://huggingface.co/unsloth/Z-Image-GGUF/tree/main

    NombreTamaño
    z-image-Q8_0.gguf7.22 GB

    Ubicación de archivos

    📂 ComfyUI/
    └── 📂 models/
        ├── 📂 diffusion_models/
        │    └── z_image_bf16.safetensors
        |
        ├── 📂 unet/
        │    └── z-image-Q8_0.gguf
        |
        ├── 📂 text_encoders/
        │    └── qwen_3_4b.safetensors
        |
        └── 📂 vae/
             └── ae.safetensors

    Parámetros

    Samplers (bf16)

    Schedulers (bf16)

    Steps

    bf16 vs q8_0


    Generación de prueba

    • GGUF Name: z-image-Q8_0.gguf
    • Seed: 2011
    • Steps: 24
    • Width: 1024 (px)
    • Height: 1024 (px)
    • Sampler: exp_heun_2_x0_sde
    • Scheduler: Normal
    An full body studio photography of a tiger mascot smiling energetic in a neutral pose in a white background.
    
    Fujifilm Pro 400H style, grainy film texture, low saturation, slightly overexposed, cinematic composition, unique camera angle. Fashion editorial style, 8K resolution.

    Conclusiones

    Una de las principales diferencias con la versión Turbo, es que, a simple vista, se adhiere más al prompt; y ahora tiene la posibilidad de usar un prompt negativo, a costa de un mayor tiempo de generación, cosas que se puede mitigar con el uso de del nodo EasyCache, que nos ayuda a reducir el tiempo de generación a casi la mitad.

    La versión FP8 y Q8, son el tope para una tarjeta de 8GB de VRAM, al igual que Z-Image Turbo, aunque en lo personal, prefiero el estilo de Z-Image Turbo.


    Fuente

  • Clonar voces con Qwen3-TTS – ComfyUI

    Clonar voces con Qwen3-TTS – ComfyUI

    Siempre he tenido ganas de leer distintos libros clásicos, pero nunca he tenido la voluntad de ir a una librería a comprar algo para leer en el camino al trabajo, así que me llegó la idea de ¿porqué no generar un audio libro’, el problema es que los servicios en línea, tienen una limitada cantidad de texto para convertir, y eso de copiar y pegar constantemente, como que no se siente muy motivador; así que no hay mejor solución que pasar un par de horas configurando ComfyUI y descargando modelos, a pasar unos 15 minutos copiando y pegando texto de un libro en https://elevenlabs.io/.



    Instalación

    Entorno

    Buscamos el ejecutable de Python, ubicado en la carpeta python_embeded donde se encuentra nuestra instalación de ComfyUI y abrimos la consola en ésa ubicación.

    📂 ComfyUI/
    └── 📂 python_embeded/
        └── python.exe

    Se ejecuta el siguiente comando para instalar la rama de xet de huggingface_hub, para descargar modelos pesados y qwen_tts:

    python -m pip install huggingface_hub[xet] qwen_tts
    

    Nodo

    ComfyUI-Qwen3-TTS https://github.com/ai-joe-git/ComfyUI-Qwen3-TTS


    Flujo de Trabajo

    Audio Referencia

    Generado en https://elevenlabs.io/ con mis créditos.

    Audio Generado

    Usando la vieja confiable RTX 3060 de 12GB.


    Más información

  • Faceswap con MTB – ComfyUI

    Faceswap con MTB – ComfyUI

    Todo comenzó con una imagen de una figura de acción generada con Z Image Turbo que me gustó bastante, excepto por un pequeño detalle: la cara, que en retrospectiva se ve bien. Normalmente en éstos tipos de flujo de trabajo busco tener consistencia de personajes en diferentes generaciones.

    Y por tal motivo, empiezo mi jornada en la búsqueda de un workflow para reemplazar caras, con distintos grados de éxito, el plug-in de Comfy MTB (https://github.com/melMass/comfy_mtb), ofrece la solución más sencilla (y hasta la fecha, aparentemente la única que funciona sin mayores problemas).

    El plug-in descarga la mayoría de modelos necesarios de análisis facial, excepto el inswapper_128.onnx, que se dedica a hacer el intercambio de cara; Aparentemente, éste modelo desapareció de Github, debido a un escándalo de deepfakes nsfw, cosa que es bastante entendible.

    Siempre que genero un personaje, me viene a la mente: «es muy probable que ésta persona exista en la vida real», lo cual es inquietante, por decir lo menos.

    Instalación

    Los archivos de intercambio de caras se pueden descargar desde https://huggingface.co/datasets/Gourieff/ReActor/tree/main/models

    NombreTamaño
    inswapper_128.onnx554 MB
    reswapper_128.onnx554 MB
    reswapper_256.onnx554 MB

    y se colocan en:

    📂 ComfyUI/
    └── 📂 models/
        └── 📂 insightface/
             ├── inswapper_128.onnx
             ├── reswapper_128.onnx
             └── reswapper_256.onnx

    Nota: inswapper_128_fp16.onnx no funciona.

    Flujo de trabajo

    En lo personal, me gusta más la versión de inswapper_128, dado que ofrece un resultado más fiel para la cara de que quiero se parezca, aunque el resultado sea algo borroso, dado a que pertenece a una época anterior a los modelos de alta resolución.

  • Descargar contenido desde Hugging Face

    Descargar contenido desde Hugging Face

    A veces necesito descargar algo de Hugging Face, y a veces se me olvida el comando para instalar el cliente.

    pip install uv
    uv tool install "huggingface_hub"
    

    Para establecer que la herramienta se pueda llamar de manera global

    uv tool update-shell
    

    Comando para descargar algo

    hf download <repo-id> --repo-type=dataset --local-dir .
    

    Y claro, se me olvida especificar la ruta a la hora de descargar, así que aquí esta la ruta del cache donde se guarda todo de manera predeterminada (Windows)

    %USERPROFILE%\.cache\huggingface\hub\
    

    Referencias