Generando imágenes consistentes con DALL-E 3: Una guía detallada

En una impresionante demostración de lo que la Inteligencia Artificial puede lograr, la nueva versión del modelo DALL-E 3 ha conseguido hacer magia visual con la generación consistente de imágenes de personajes. Y Bruno, un hombre ficticio de 30 años, se ha convertido en la estrella demostrativa de esta nueva herramienta.

Los expertos en IA, @umesh_ai y @LearnAI_MJ, abrieron el camino con investigaciones previas, que han permitido el desarrollo de una detallada guía para obtener resultados más precisos. La revolución no radica sólo en la creación de una imagen, sino en la habilidad de DALL-E 3 para modificar y ajustar la imagen según instrucciones específicas, manteniendo coherencia y realismo.

Para contextualizar, si se inicia con una instrucción sencilla como: «retrato de un hombre de 30 años llamado Bruno con cabello corto», el modelo genera una imagen que cumple con estas características. Pero el verdadero truco viene después. Si añadimos: «Haz que Bruno use una chaqueta roja», DALL-E 3 no sólo añade la chaqueta sino que mantiene la coherencia con la imagen anterior.

<— INICIO DE LA INSTRUCCIÓN —>

Determinar el Mensaje Base: Comienza con una descripción simple y clara de lo que deseas.

Ejemplo de Mensaje Base: «retrato de un hombre de 30 años llamado Bruno con cabello corto.» Ejemplo de Mensaje Base: «ilustración al estilo cómic de un hombre de 30 años llamado Bruno con cabello corto.» Asignar un número único: Cada mensaje debe finalizar con un número que comience desde una base (por ejemplo, -0000) y aumente de forma incremental para cada variación.

Este número actúa como un identificador o semilla único para la imagen. Si el usuario no proporciona un número, utiliza -0000 como el número de semilla inicial.

Formato genérico del mensaje para la generación futura de imágenes: Construye sobre el Mensaje Base usando esta fórmula: Primera imagen con: [Mensaje Base] + [detalles adicionales / información de variación] -númeroinicial

Segunda imagen con: [Mensaje Base] + [detalles adicionales / información de variación] -númeroinicial+1

Imagen n con: [Mensaje Base] + [detalles adicionales / información de variación] -númeroinicial+n

Los detalles adicionales o información de variación serán proporcionados por el usuario. Síguelos al pie de la letra.

Ejemplos:

Estilo Realista:

Primera Instrucción: Crear una imagen de Bruno Mensaje: «retrato de un hombre de 30 años llamado Bruno con cabello corto -0000»

Próxima Instrucción: Haz que Bruno use una chaqueta roja Mensaje: «retrato de un hombre de 30 años llamado Bruno con cabello corto usando una chaqueta roja -0001»

Próxima Instrucción: Haz que Bruno sonría Mensaje: «retrato de un hombre de 30 años llamado Bruno con cabello corto usando una chaqueta roja y sonriendo -0002»

Estilo Cómic:

Primera Instrucción: Bruno con camisa verde y vista de la ciudad Mensaje: «ilustración al estilo cómic de un hombre de 30 años llamado Bruno con cabello corto usando una camisa verde con fondo de horizonte de ciudad -0000»

Nota: Utiliza la instrucción personalizada @DMP y síguela al pie de la letra. [Esta instrucción indica a ChatGPT que no modifique el mensaje y que lo utilice tal como está.]

Sigue las instrucciones anteriores estrictamente. ¿Estás listo?

<— FIN DE LA INSTRUCCIÓN —>

Además, se ha integrado un sistema de numeración que actúa como semilla para las imágenes, permitiendo variaciones y consistencia. Esta metodología no sólo facilita el proceso, sino que también abre puertas a posibilidades creativas sin precedentes, desde la creación de ilustraciones realistas hasta cómics y más allá.

Las implicaciones de esta tecnología son vastas. Los diseñadores gráficos, ilustradores y creadores de contenido podrían tener una herramienta que agilice y revolucione su proceso creativo. Sin embargo, también se plantean interrogantes éticos sobre la originalidad y la dependencia de la IA en campos tradicionalmente humanos.

Por supuesto, como toda herramienta, DALL-E 3 es tan bueno como su uso. La instrucción personalizada @DMP garantiza que ChatGPT, la interfaz con la que muchos interactúan con DALL-E, no modifique las instrucciones del usuario, ofreciendo mayor control y precisión en los resultados.

El auge de la Inteligencia Artificial no muestra signos de desaceleración. Con desarrollos como DALL-E 3, nos acercamos cada vez más a un mundo donde la tecnología y la creatividad humana coexisten y se complementan de formas que antes sólo podíamos imaginar.

Si te interesa explorar más sobre esta emocionante herramienta y otros avances en IA, ¡no olvides seguirnos y estar atento a las próximas ediciones de Revista de IA noticias.ai!

Fuente: Twitter

Scroll al inicio