Qué es un prompt en Midjourney y cómo escribirlo bien

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Un prompt en Midjourney es la instrucción de texto, a veces acompañada de una imagen de referencia, con la que le indicas al modelo qué imagen quieres que genere. La traducción más cómoda al español, como apuntó Carlos Santana en su día, sería «apunte»: una descripción breve que el modelo interpreta para componer la imagen.

El prompt es la palanca principal para controlar el resultado. Con el mismo modelo puedes sacar una foto realista, una ilustración estilo Pixar o un boceto a lápiz dependiendo de cómo escribas la instrucción y de los parámetros que pongas al final. Por eso el prompt engineering ya tiene foros propios, repositorios de ejemplos y trucos que se pasan de unos usuarios a otros. Si te interesa el contexto general, OpenAI publicó su biblioteca gratuita Prompt Packs con ejemplos por perfil profesional.

Estructura de un prompt en Midjourney

La forma básica de un prompt en Midjourney sigue siempre el mismo esquema, tanto si lo lanzas desde el bot de Discord como desde la web oficial:

Comando: /imagine en Discord, o el campo de texto si trabajas desde midjourney.com.
Imagen de referencia (opcional): una URL pública accesible que el modelo pueda leer para mantener estilo o composición.
Texto descriptivo: la parte que más pesa. Sujeto principal, contexto, estilo, iluminación, lente, ambiente y paleta de color.
Parámetros: banderas que se añaden al final con doble guion. Las más usadas son --ar (proporción), --s (stylize), --c (chaos), --niji (estilo anime) y --v (versión del modelo).

El orden importa menos de lo que parece, aunque la práctica habitual es ir de lo general a lo concreto, dejando el sujeto y la escena al principio y los parámetros técnicos al final. Los modelos recientes interpretan bien las descripciones largas, así que no hace falta ser telegráfico ni meter listas interminables de adjetivos.

Estructura del comando /imagine de Midjourney con sus parámetros — Anatomía del comando /imagine: comando, descripción y parámetros

Cómo se usa Midjourney hoy

Midjourney empezó como un bot exclusivo de Discord, cosa que despistaba a quienes no estaban acostumbrados a esa interfaz. Eso ya cambió. La compañía mantiene Discord como entorno alternativo, cómodo para probar ideas en comunidad, pero la web midjourney.com es ya el sitio principal: galería personal, editor para retoques, herramienta de variaciones y un panel de parámetros que evita tener que aprenderse las banderas de memoria.

Y Midjourney ya no es solo imagen. En junio de 2025 lanzó V1, su primer modelo de vídeo, que anima imágenes generadas previamente y compite con Sora, Veo, Runway o Kling. La lógica del prompt es parecida a la de imagen, pero con instrucciones de movimiento y duración. La cobertura del lanzamiento desde el ángulo de mercado y datacenter está en Revista Cloud.

Sigue sin haber API pública oficial, así que las integraciones se hacen vía web o tirando de soluciones intermedias de terceros. Si buscas generación con API estándar y consistencia de personajes, conviene mirar también Gemini de Google o las APIs de imagen de OpenAI. Como referencia comparativa, en su momento Midjourney v5.2 marcó un salto importante con la herramienta de zoom y mejoras en composición que aún se notan en versiones actuales, y modelos como FLUX han traído alternativas open source con calidad cercana.

Antes de usar las imágenes en producción conviene tener claro un detalle legal, y es que aunque las generes tú con un prompt propio, no siempre cuentas con derechos plenos sobre el resultado. Lo desgranamos en este análisis sobre quién es dueño de las imágenes generadas con IA, donde se ven los matices según país, plataforma y uso comercial.

Ejemplos de prompts y resultados

Para ver el efecto de un prompt sobre el resultado, nada como mirar ejemplos concretos. Estos son del archivo del blog y mantienen su valor como referencia de cómo describir sujeto, fondo, iluminación y parámetros.

/imagine churros

Prompt: /imagine churro food, white background –s 750. El parámetro --s 750 sube el peso del estilo del modelo, así que la imagen final sale más «de catálogo» y menos plana.

Churros generados con Midjourney sobre fondo blanco

/imagine piano clásico

Prompt: /imagine classic piano, room with big windows and sunset light, white style room, real engine, hdr –ar 3:2 –s 750. El truco está en describir la luz («sunset light», «hdr») y el ambiente, no solo el objeto. La proporción 3:2 con --ar da una composición más cinematográfica.

Piano clásico en habitación con luz de atardecer generado con Midjourney

/imagine pan de molde fotorrealista

Prompt: /imagine whole bread and cut, white background, high resolution, photorealistic, hyper realistic, more detailed, extremely detailed background, still life, photorealism, dynamic composition, 8k, ultra resolution, cinematic –ar 2:3. Encadenar términos de fotografía («photorealistic», «still life», «8k») sube el realismo, aunque hay que vigilar que la imagen no acabe pareciendo una foto de banco genérica.

Pan de molde fotorrealista generado con Midjourney

/imagine gorila albino con imagen de referencia

Prompt: /imagine <https://s.mj.run/ZkzNTCjaL6E> a baby yellow gorilla, white hair, pink skin, mesmerizingly beautiful, ultra realistic, 8k, movie looking cool, hyperrealistic, fashion photography, advertising photography, macro lens, depth of field, cinematic lighting –s 750. La URL al principio actúa como imagen de referencia, así que el modelo toma estilo o composición de esa imagen y aplica el resto del prompt encima. Es una técnica útil para mantener un look consistente entre generaciones.

Gorila albino bebé generado con Midjourney usando imagen de referencia

Parámetros que conviene conocer

--ar W:H: proporción del lienzo. --ar 3:2 para horizontal estilo foto, --ar 2:3 para vertical, --ar 16:9 para wallpapers o redes sociales.
--s (stylize): cuánto peso tiene el estilo del modelo frente al texto literal. Valores bajos (0-50) respetan más el prompt; altos (500-1000) generan imágenes más artísticas pero alejadas de lo pedido.
--c (chaos): cuánto varían las cuatro imágenes que devuelve el modelo. Útil cuando quieres explorar opciones distintas en lugar de cuatro versiones casi iguales.
--niji: activa el modelo Niji, especializado en estilo anime y manga.
--v: fija la versión del modelo. Cada nueva versión cambia composición, anatomía y nitidez, así que conviene especificar si quieres reproducir un look antiguo.
--no: lista de elementos que no quieres que aparezcan en la imagen. Por ejemplo, --no text, watermark evita marcas de agua o texto sintético.

Buenas prácticas para escribir prompts

Empieza por el sujeto y luego añade contexto. «A red fox sitting on snow at golden hour» funciona mejor que un párrafo que entierra al protagonista entre adjetivos.
Describe la luz y la cámara como si fueras fotógrafo. «Cinematic lighting», «50mm lens» o «shallow depth of field» empujan al modelo hacia un look concreto.
Evita listas larguísimas de adjetivos sinónimos. Diez palabras que dicen lo mismo confunden más que aclaran.
Prueba variaciones (V1, V2…) en lugar de reescribir el prompt entero cada vez. Te ahorra créditos y mantiene la consistencia.
Si quieres consistencia entre imágenes (mismo personaje, mismo estilo), usa la URL de una generación previa como referencia.

Preguntas frecuentes

¿Qué diferencia hay entre prompt en Midjourney y en otros modelos?

La estructura general (sujeto, contexto, estilo y parámetros) es común a casi todos. Lo que cambia son las banderas concretas y la sensibilidad al texto. Midjourney aporta mucho estilo propio aunque no se lo pidas, mientras que modelos como Gemini, FLUX o las APIs de OpenAI suelen ser más literales y se acercan más a lo que escribes sin embellecer.

¿Hace falta saber inglés para escribir prompts en Midjourney?

Funciona en español, pero los resultados siguen siendo mejores en inglés. La mayoría del entrenamiento del modelo es en ese idioma, así que descripciones técnicas («cinematic lighting», «50mm lens», nombres de movimientos artísticos) responden con más precisión cuando se escriben en inglés.

¿Qué hace exactamente el parámetro –s o stylize?

Controla cuánta libertad estética se toma el modelo respecto a tu prompt. Un valor bajo (0-50) entrega imágenes más fieles al texto pero a veces planas; un valor alto (500-1000) deja entrar más estilo «Midjourney» y suele dar imágenes más vistosas pero menos fieles. El valor por defecto se mueve en torno a 100.

¿Se puede usar Midjourney sin Discord?

Sí. La web midjourney.com es ya la interfaz principal y permite generar, editar y organizar imágenes sin tocar Discord. El bot queda como opción para quien quiera trabajar en comunidad o esté acostumbrado a la dinámica de chat.

¿Hay API pública de Midjourney?

No de forma oficial. Midjourney sigue sin abrir API para integraciones de terceros, así que cualquier servicio que diga «Midjourney por API» tira de scraping o de cuentas no oficiales, con el riesgo de bloqueos. Si necesitas generación de imagen integrada en producto, conviene mirar APIs estables como las de OpenAI, Stability AI o Gemini.

¿Sirven los prompts antiguos con los modelos actuales?

Suelen funcionar, pero el resultado cambia. Cada versión del modelo reinterpreta los mismos términos de forma distinta, así que una iluminación que en V4 daba cierto look ahora puede salir más limpia o más estilizada. Si reproduces ejemplos de hace dos años, fija la versión con --v o asume que el resultado será diferente.

Para inspiración, en AI Free Images hay galerías de imágenes generadas con IA con sus prompts asociados.