Cómo usar nombres de fotógrafos en los prompts de Midjourney

Añadir el nombre de un fotógrafo al prompt de Midjourney cambia el resultado de forma visible e inmediata. La plataforma, desarrollada por Midjourney, Inc., asoció cada nombre a patrones visuales concretos durante el entrenamiento —iluminación, composición, paleta, sujeto— y los aplica en cuanto los reconoce en la instrucción. Con los fotógrafos más documentados en su corpus, los resultados son bastante fieles al original; con los menos conocidos, el modelo tiende a mezclar estilos.

Cada fotógrafo lleva una firma visual propia: Annie Leibovitz remite a retratos con luz dramática de estudio y sujetos con carácter; Ansel Adams, a blanco y negro de rango tonal muy trabajado en paisajes de montaña; Henri Cartier-Bresson, a escenas de calle con geometría urbana capturada en el instante exacto.

Cómo funciona en la práctica

El experimento que documentó @TheMouseCrypto en Twitter en abril de 2023 lo ilustra bien: generó imágenes con un prompt simple y repitió la instrucción añadiendo el nombre de un fotógrafo al final. El estilo cambió de forma clara en ambos casos, con diferencias visibles en la paleta de colores, la composición, el tipo de luz y el sujeto habitual del artista elegido.

Añadir la referencia es directo: toma el prompt habitual y coloca el nombre del fotógrafo al final.

a woman in a cafe, natural light, in the style of Annie Leibovitz

Se puede afinar añadiendo datos técnicos del artista: modelo de cámara, tipo de objetivo o configuración de luz habitual. En fotógrafos muy documentados esto refuerza la interpretación del modelo; en los menos conocidos, el efecto es mínimo.

Si no tienes claro qué elementos definen a un fotógrafo concreto, puedes pedirle a ChatGPT que describa su paleta, tipo de iluminación y composición típica, e integrar esa descripción directamente en el prompt.

Por qué los modelos aprenden estilos fotográficos

Los modelos de difusión (Midjourney, DALL-E, Stable Diffusion) se entrenan con grandes conjuntos de datos que emparejan texto con imagen. Cuando ese conjunto incluye suficientes obras de un fotógrafo junto a su nombre y descripciones de su trabajo, el modelo aprende a asociar ese nombre con patrones visuales concretos.

El nivel de fidelidad depende de cuánto material tiene el modelo de ese artista. Los fotógrafos más conocidos y con obras ampliamente indexadas producen resultados reconocibles; con los menos documentados, el modelo mezcla estilos en lugar de reproducir uno de forma directa.

Este mecanismo está en el centro del debate legal sobre el uso de obras de artistas en el entrenamiento de modelos sin su consentimiento. En 2023, la demanda del New York Times contra OpenAI y Microsoft por infracción de derechos de autor abrió ese frente judicial, que varios fotógrafos y agencias de imagen siguen de cerca.

Qué fotógrafos dan mejores resultados por género

Nombres que producen resultados más reconocibles en Midjourney, organizados por género fotográfico:

  • Retrato: Annie Leibovitz (iluminación de estudio, sujetos con carácter), Yousuf Karsh (luz suave, gran formato), Platon Antoniou (primerísimos planos, fondos neutros), Richard Avedon (fondo blanco, expresión directa).
  • Fotografía callejera: Henri Cartier-Bresson (el instante decisivo, geometría urbana), Garry Winogrand (encuadres caóticos, calle americana años 60-70), Vivian Maier (blanco y negro, distancia emocional).
  • Paisaje: Ansel Adams (blanco y negro de alta gama, naturaleza americana), Sebastião Salgado (alto contraste, temática social y naturaleza), Galen Rowell (luz dorada de hora mágica).
  • Documental: Dorothea Lange (épocas de crisis, expresiones directas), Robert Capa (proximidad al sujeto, escenas de conflicto), Steve McCurry (color saturado, culturas no occidentales).
  • Moda: Irving Penn (fondos de papel, luz difusa, elegancia contenida), Helmut Newton (blanco y negro teatral, alto contraste), Mario Testino (color vivo, glámur directo).
  • Bellas artes: Cindy Sherman (autorretrato conceptual, identidad), Andreas Gursky (vistas aéreas, grandes formatos), Hiroshi Sugimoto (larga exposición, minimalismo).
  • Arquitectura: Julius Shulman (casas modernistas californianas, luz del atardecer), Iwan Baan (arquitectura contemporánea en contexto urbano).
  • Macro y naturaleza: Levon Biss (macro de insectos con nitidez extrema), Frans Lanting (vida salvaje, composición limpia).

El hilo original recoge también géneros como astrofotografía (Adam Block), fotografía submarina (David Doubilet), fotografía con drones (Dirk Dallas) o de conciertos (Anton Corbijn). Estos nombres producen resultados más variables porque el modelo tiene menos material de entrenamiento asociado.

Combinaciones y parámetros avanzados

Midjourney permite mezclar dos o tres referencias en el mismo prompt. Lo más práctico es usar una referencia principal y una secundaria que aporte un rasgo concreto: el color de una y la composición de la otra.

street scene at dusk, Annie Leibovitz style, Vivian Maier composition

Con cuatro referencias o más el modelo tiende a promediarlas y el resultado pierde los rasgos distintivos de cada artista. Los parámetros que más influyen en la fidelidad estilística son --stylize (cuánto se aleja el modelo del prompt literal) y --chaos (variabilidad entre generaciones). Para reproducir un estilo fotográfico clásico, valores bajos de --stylize dan resultados más fieles a la referencia.

Sobre los costes de usar modelos de IA generativa a escala, el artículo La factura oculta de la IA: los tokens ya no parecen tan baratos explica cómo las empresas calculan el precio real de estas herramientas.

Preguntas frecuentes

¿Qué pasa si Midjourney no reconoce el nombre del fotógrafo?

El modelo devuelve un resultado genérico o mezcla el nombre con referencias visuales cercanas. La solución es añadir una descripción explícita del estilo: tipo de luz, paleta de colores, composición y género fotográfico que caracteriza a ese artista.

¿Es legal usar el nombre de un fotógrafo vivo en un prompt de Midjourney?

Usar el nombre en un prompt para uso personal no está prohibido por los términos de servicio de Midjourney. Usarlo de forma comercial para emular directamente el trabajo de un artista vivo entra en una zona legal que los tribunales de varios países están resolviendo desde 2023.

¿Funciona igual en DALL-E 3 o Stable Diffusion?

El mecanismo es similar en los tres, ya que todos son modelos de difusión entrenados con texto e imagen emparejados. DALL-E 3, integrado en ChatGPT, tiende a producir resultados más literales; Stable Diffusion, al ser de código abierto, da más libertad pero requiere más precisión en el prompt para conseguir el mismo nivel de fidelidad estilística.

¿Añadir el modelo de cámara del fotógrafo mejora el resultado?

En fotógrafos asociados a un equipo concreto, como Ansel Adams con cámaras de gran formato, añadir la cámara puede reforzar la textura y el grano del resultado. En fotógrafos que han trabajado con varios equipos, el efecto es mínimo y la referencia del nombre es más determinante.

¿Qué parámetros de Midjourney afectan más al estilo del fotógrafo?

El parámetro --stylize es el más relevante: valores bajos (entre 0 y 200) hacen que el modelo se ciña más a la referencia del fotógrafo; valores altos (entre 400 y 1.000) le dan más libertad creativa y el resultado se aleja del estilo original. Para reproducir un fotógrafo específico lo habitual es trabajar entre 100 y 300.

Fuente: experimento documentado por @TheMouseCrypto en Twitter (abril 2023).

Scroll al inicio