Claude Opus 4.6 sube el listón: más capacidad para programar y trabajar con documentos gigantes

Anthropic ha presentado Claude Opus 4.6, una actualización que busca consolidar a su modelo más avanzado como herramienta “todoterreno” para programación, análisis y tareas de oficina. El anuncio llega en un momento en el que las empresas ya no solo prueban la Inteligencia Artificial como asistente de chat, sino como pieza de producción: revisando código, preparando informes, analizando datos y automatizando flujos de trabajo completos.

La gran promesa de Opus 4.6 es doble. Por un lado, mejoras claras en tareas de ingeniería de software: planificación más cuidadosa, mayor resistencia en trabajos largos tipo “agente” y mejor rendimiento en revisión y depuración, con más capacidad para detectar sus propios fallos antes de que lleguen a producción. Por otro, un salto en la gestión de contexto: una ventana de hasta 1.000.000 de tokens (en beta), pensada para trabajar con cantidades masivas de información sin que el modelo “se deshilache” a medida que la conversación crece.

La carrera por el “contexto largo” y el fin del “context rot”

Uno de los problemas más repetidos por usuarios avanzados es el llamado context rot: cuando el sistema empieza bien, pero pierde precisión al acumular cientos de miles de palabras, mezclando instrucciones o ignorando detalles que estaban “dentro” del contexto. Anthropic afirma que Opus 4.6 mejora de forma notable en pruebas de recuperación de información “escondida” en grandes volúmenes de texto.

En ese frente, la compañía destaca resultados superiores frente a modelos anteriores en pruebas tipo “aguja en el pajar”, y presenta la actualización como un paso para casos de uso reales: contratos largos, documentación técnica extensa, repositorios de código grandes, debida diligencia o investigación interna con múltiples documentos. En la práctica, la apuesta es que un modelo con más memoria útil reduce el número de iteraciones: menos “pásame otra vez el documento”, menos resúmenes manuales y menos trabajo de pegar trozos para que el modelo “no se olvide”.

Programar ya no es solo escribir código: es navegar, planificar y revisar

El foco más visible de Opus 4.6 está en el trabajo de desarrollo. Anthropic sostiene que el modelo planifica mejor antes de actuar y aguanta tareas más largas sin necesidad de guiarlo paso a paso. La idea es que no se limite a generar fragmentos, sino que se acerque a un flujo más cercano a un ingeniero: entender el objetivo, revisar el contexto, detectar dependencias, anticipar riesgos y luego ejecutar.

En su comunicación, la compañía también resalta el rendimiento del modelo en evaluaciones de tipo “agente”, donde lo importante no es resolver una pregunta aislada, sino completar tareas con varias acciones encadenadas (por ejemplo, revisar un proyecto, encontrar un bug, proponer un parche y justificarlo). En esa línea, Opus 4.6 presume de liderazgo en Terminal-Bench 2.0 y de buen desempeño en pruebas de búsqueda y localización de información compleja como BrowseComp, dos benchmarks que reflejan una tendencia del mercado: la Inteligencia Artificial como “operador” que consulta, decide y ejecuta, no solo como generador de texto.

128.000 tokens de salida y herramientas para tareas largas

Otra novedad importante está en el tamaño de salida: hasta 128.000 tokens, una cifra que apunta a casos donde el resultado final no cabe en una respuesta convencional. Esto abre la puerta a entregar de una vez documentos extensos, resúmenes estructurados, revisiones de código completas o materiales listos para publicar sin partirlos artificialmente en múltiples prompts.

Para que esos trabajos largos no choquen con límites prácticos, Anthropic introduce además “context compaction” (en beta), un mecanismo que permite que el propio sistema resuma y sustituya contexto antiguo cuando la conversación se acerca a un umbral configurado. No es solo un truco de comodidad: es una forma de sostener proyectos prolongados sin que el usuario tenga que reiniciar o “podar” manualmente.

A esto se suman controles de “esfuerzo” (niveles de low, medium, high y max) y el llamado “adaptive thinking”, con el que el modelo decide cuándo merece la pena razonar más a fondo. El mensaje entre líneas es claro: los modelos cada vez “piensan” más, pero el mercado exige poder ajustar coste, latencia y profundidad según el tipo de tarea.

Más allá del chat: Excel, PowerPoint y trabajo de oficina

El anuncio también busca aterrizar Opus 4.6 en un terreno que interesa a empresas: la productividad diaria. Anthropic asegura mejoras sustanciales de Claude en Excel, con más capacidad para estructurar datos desordenados, planificar cambios y resolver tareas multietapa en una sola pasada. Y añade una novedad llamativa: Claude en PowerPoint llega como vista previa de investigación, orientado a crear presentaciones respetando diseños, tipografías y plantillas.

La lectura es estratégica: la Inteligencia Artificial no compite solo por “responder mejor”, sino por integrarse en el software donde se toman decisiones y se produce trabajo real. El salto hacia documentos, hojas de cálculo y presentaciones es un paso natural en esa carrera.

Precio, disponibilidad y el debate de fondo: quién gana el “trabajo de valor”

Opus 4.6 se ofrece en claude.ai, en la API y en grandes plataformas cloud (incluyendo AWS Bedrock, Google Vertex AI y Microsoft Foundry, según indica Anthropic). En precios, la compañía mantiene la referencia de 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, con tarifa premium para prompts por encima de 200.000 tokens (10 y 37,50 dólares por millón, respectivamente). También menciona una modalidad de inferencia “solo en EE. UU.” con recargo del 1,1×.

Más allá de cifras, el anuncio alimenta un debate que ya se está volviendo empresarial: si el “trabajo” de la Inteligencia Artificial se desplaza hacia tareas complejas (código, análisis, documentos y decisiones), la ventaja ya no estará solo en el modelo, sino en la capacidad de integrarlo con herramientas, datos y procesos sin romper la gobernanza ni disparar el coste.


Preguntas frecuentes

¿Qué implica una ventana de contexto de 1.000.000 de tokens en Claude Opus 4.6?
Permite trabajar con grandes volúmenes de texto (documentación, contratos, repositorios o dossiers) manteniendo más información relevante dentro de una misma sesión, con menos necesidad de resumir o fragmentar manualmente.

¿Cuándo se aplica la tarifa premium de Claude Opus 4.6 y cómo afecta al coste?
Anthropic indica que el precio premium se activa en prompts que superan los 200.000 tokens, elevando el coste por millón de tokens tanto en entrada como en salida. Está pensado para usos de “contexto extremo”.

¿Para qué sirve “context compaction” en tareas largas con agentes de Inteligencia Artificial?
Es una función para sostener conversaciones o proyectos prolongados: resume parte del historial y lo sustituye por un compacto, evitando chocar con límites y manteniendo continuidad operativa.

¿Qué tipo de trabajos de programación mejora Opus 4.6 frente a modelos anteriores?
Anthropic destaca mejoras en planificación, revisión de código y depuración, además de mayor fiabilidad en tareas largas tipo agente, especialmente en bases de código grandes y flujos con múltiples pasos.

Introducing Claude Opus 4.6
Scroll al inicio