OpenAI lanza Sora 2: vídeo + audio con física más realista, mayor control y una app social de “cameos” para crear contigo dentro de la escena

OpenAI presentó Sora 2, su nuevo modelo de generación de vídeo y audio, con tres promesas clave: física y coherencia más realistas, controles más finos para dirigir planos y persistir estados entre escenas, y sonido sincronizado (diálogos, efectos y paisajes sonoros) en una sola pasada. Junto al modelo llega Sora, una app social para iOS que permite crear, remixar y—novedad destacada—aparecer dentro de los vídeos mediante “cameos” verificados por el propio usuario.

Introducing Sora 2

Qué aporta Sora 2 (y por qué es distinta)

  • Física y “simulación del mundo” más creíble: el modelo tiende menos a “hacer trampas” para cumplir el prompt. Si un baloncestista falla, el balón rebota (en lugar de teletransportarse a la canasta). Se han mostrado secuencias complejas (gimnasia olímpica, backflips sobre una paddleboard, triple axel con un gato a bordo) que exigen dinámicas de rigidez, flotabilidad y conservación más consistentes.
  • Mayor control de dirección: sigue instrucciones intrincadas a lo largo de varios planos, mantiene la continuidad de objetos y personajes, y brilla en estilos cinematográfico, realista y anime.
  • Audio integrado: genera diálogos, FX y ambientes con un grado de realismo notable, sincronizados con la acción.
  • Inyección de elementos reales: con un breve vídeo/voz del usuario, el sistema inserta su apariencia y timbre en cualquier escena generada, funcionalidad extensible a personas, animales u objetos.

OpenAI reconoce que el modelo no es perfecto y comete errores, pero sostiene que la escala de entrenamiento en vídeo está empujando a Sora hacia una simulación físicamente más fiable.


Una app social centrada en crear, no en consumir

OpenAI lanza también Sora, una app invitacional para iOS:

  • Cameos: tras un registro único (vídeo + audio) para verificar identidad y capturar la semejanza, puedes aparecer en vídeos que generes tú o tus amigos—con controles finos sobre quién puede usarlos y revocación en cualquier momento.
  • Remix colaborativo**: toma una creación ajena y cámbiala (personajes, ambiente, nuevas escenas), con feed personalizable diseñado para inspirar creación (no para maximizar tiempo de pantalla).
  • Control del usuario sobre el feed**: recomendadores instruibles en lenguaje natural, encuestas periódicas de bienestar para ajustar contenidos y un sesgo por defecto hacia personas que sigues o con quienes interactúas.

OpenAI asegura no optimizar para scroll infinito y declara una “filosofía de feed” centrada en expresión y co-creación. Para adolescentes, habrá límites por defecto en el número de vídeos del feed, permisos más estrictos para cameos, equipos humanos para moderar casos de acoso, y controles parentales vía ChatGPT (desactivar personalización, gestionar mensajes, ajustar límites).


Despliegue, acceso y precios

  • Disponibilidad: app Sora en iOS hoy en EE. UU. y Canadá (ampliación “rápida” a más países). Acceso por invitación; registro in-app para notificación cuando se habilite tu cuenta.
  • Web: tras recibir invitación, acceso a Sora 2 en sora.com.
  • Coste: gratis al inicio con límites generosos sujetos a capacidad de cómputo; posibilidad futura de pago por generación extra cuando haya picos de demanda.
  • Modelos: Sora 2 (calidad estándar), Sora 2 Pro experimental para ChatGPT Pro en sora.com (y próximamente en la app). Sora 1 Turbo sigue disponible; tus vídeos anteriores permanecerán en tu biblioteca.
  • API: la compañía planea ofrecer Sora 2 en API.

Seguridad, consentimiento y bienestar

OpenAI detalla un paquete de salvaguardas:

  • Consentimiento de imagen y voz: controlas quién puede usar tus cameos; puedes revocar permisos y eliminar cualquier vídeo que te incluya (incluso borradores de otros).
  • Proveniencia y contenido: mecanismos para prevenir generación de material dañino, moderación humana ampliada, y énfasis en transparencia.
  • Bienestar: límites por defecto para adolescentes, encuestas y ajustes proactivos de feed. Modelo de monetización orientado a cubrir cómputo, no a maximizar la adición.

Qué significa para creadores y estudios

  • Previsualización de escenas con dinámica creíble (saltos, fluidos, rigidez) acelera storyboarding, previz y iteración artística.
  • Control de continuidad entre planos y persistencia de estado permiten secuencias más largas sin “resets” inesperados.
  • Audio integrado reduce pasos de posproducción para maquetas y pitches.
  • Cameos abren formatos de narrativa social y marketing con participación directa de comunidades.

Límites y preguntas abiertas

  • Fidelidad física: aunque mejora, aún hay fallos; escenas con contacto complejo, multitudes o simulaciones finas pueden romperse.
  • Derechos de terceros: el uso de cameos y “parecidos razonables” exigirá atención a derechos de imagen y propiedad intelectual (especialmente en campañas comerciales).
  • Capacidad de cómputo: la experiencia de “gratis con límites” dependerá de la infraestructura; OpenAI anticipa colas y uso de pago por extra en picos.
  • Acceso mundial: la app inicia en EE. UU./Canadá; la expansión dependerá de marcos regulatorios y capacidad.

En síntesis

Sora 2 marca un salto en realismo físico, control y audio integrado en generación de vídeo, y llega acompañado de una app social que convierte la co-creación (y aparecer en lo que imaginas) en el centro de la experiencia. Si el modelo mantiene su promesa de obedecer la física y la app cumple al priorizar bienestar frente a scroll, podría inaugurar un formato distintivo frente a plataformas centradas en consumo pasivo.

Disponibilidad: app Sora en iOS (EE. UU./Canadá, invitaciones), Sora 2 gratis con límites, opción Sora 2 Pro para ChatGPT Pro, y API en camino.

Scroll al inicio