Flux: Generación de imágenes texto-a-imagen que está revolucionando el mercado

Black Forest Labs, el equipo original detrás de Stable Diffusion, ha lanzado un nuevo y revolucionario modelo de generación de imágenes conocido como Flux. Con una impresionante capacidad de 12 mil millones de parámetros, Flux se destaca por su capacidad para crear imágenes de alta calidad que evocan la estética de Midjourney. Este artículo explora las características clave, variaciones del modelo y su desempeño, ofreciendo una visión integral sobre lo que Flux tiene para ofrecer.

Características Clave de Flux

Flux se distingue por su arquitectura híbrida avanzada y por su capacidad para generar imágenes en una variedad de formatos y resoluciones. A continuación, se detallan sus principales características:

  • Arquitectura Híbrida: Flux emplea una arquitectura híbrida que combina bloques de transformadores de difusión multimodal y paralelos. Este enfoque innovador permite una generación de imágenes más versátil y detallada.
  • Ratios y Resoluciones Diversos: El modelo admite diferentes ratios de aspecto y resoluciones que llegan hasta 2.0 megapíxeles, ofreciendo una flexibilidad significativa para distintos usos y necesidades.
  • Seguimiento de Prompts: Flux muestra una notable capacidad para seguir las indicaciones de los prompts, logrando representar con precisión elementos complejos como manos, pies y estilos específicos.

Variaciones del Modelo Flux

Flux está disponible en tres versiones distintas, cada una con características específicas adaptadas a diferentes necesidades:

  • FLUX.1 [dev]: La versión base del modelo con 12 mil millones de parámetros, que se ha liberado como código abierto bajo una licencia no comercial para que la comunidad pueda construir sobre ella.
  • FLUX.1 [schnell]: Una versión destilada del modelo base que ofrece un rendimiento hasta 10 veces más rápido. Esta versión está licenciada bajo Apache 2, facilitando su integración en proyectos comerciales.
  • FLUX.1 [pro]: Una versión de código cerrado disponible únicamente a través de una API, proporcionando acceso a características avanzadas para aplicaciones empresariales.

Desempeño y Evaluación

Las primeras revisiones sugieren que Flux cumple con las expectativas que muchos tenían de Stable Diffusion 3. El modelo proporciona imágenes de alta calidad y estéticamente agradables, con una fuerte coherencia respecto a los prompts dados. Flux puede funcionar en GPUs con 12GB de VRAM utilizando configuraciones de menor precisión, lo que lo hace accesible para una amplia gama de usuarios.

La empresa Black Forest Labs, fundada por los creadores de Stable Diffusion Robin Rombach y Patrick Esser, ha asegurado 31 millones de dólares en financiamiento inicial para respaldar el desarrollo de Flux. Además, el equipo tiene planes de lanzar modelos de texto-a-video en el futuro, lo que promete ampliar aún más las capacidades de generación multimedia.

Iniciativa Comunitaria de Evaluación

Dado que evaluar la calidad de un nuevo modelo puede ser complicado debido a las variaciones en semillas, pasos y programadores, así como a la presentación selectiva de ejemplos, se está estableciendo una galería comunitaria para generar imágenes con Flux Pro de forma gratuita. Esta iniciativa busca aumentar el tamaño de la muestra disponible públicamente, proporcionando una evaluación más representativa del modelo.

Es importante destacar que esta galería comunitaria es una iniciativa independiente y no está afiliada a Black Forest Labs. A través de esta plataforma, se espera ofrecer a los usuarios una visión más amplia y objetiva de las capacidades de Flux.

En resumen, el lanzamiento de Flux representa un avance significativo en la generación de imágenes texto-a-imagen de código abierto. Con su arquitectura innovadora y sus diversas opciones de modelo, Flux ofrece a los creadores y desarrolladores una herramienta poderosa para explorar y expandir sus proyectos visuales. La evaluación comunitaria y los futuros desarrollos en el campo del texto-a-video indican que Flux no solo está configurado para marcar una diferencia en el presente, sino también para ser una plataforma clave en el futuro de la generación de imágenes.

Pruébalo gratis en Fluxpro.art.

Scroll al inicio