Claude Sonnet 4.6: Anthropic dispara la “IA agéntica” con 1.000.000 de tokens y el mismo precio

El calendario de lanzamientos de modelos de Inteligencia Artificial en 2026 está siendo tan agresivo que ya no se mide solo en “mejoras”, sino en cambios de hábito. En ese contexto, Anthropic ha anunciado Claude Sonnet 4.6, una nueva versión que la compañía presenta como su Sonnet más capaz hasta la fecha y que llega con un mensaje muy directo: más rendimiento en programación, razonamiento largo, planificación de agentes y “uso del ordenador”, sin elevar el coste.

La clave está en dos decisiones que afectan a millones de usuarios. La primera: Sonnet 4.6 pasa a ser el modelo por defecto para quienes usan los planes Free y Pro en claude.ai y Claude Cowork. La segunda: el precio se mantiene como en Sonnet 4.5, desde 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida, una estructura pensada para que el salto de capacidad se note sin obligar a “subir de gama” a cada paso.

De modelo “equilibrado” a motor de trabajo serio

La familia Sonnet suele ocupar ese punto medio entre velocidad y potencia, pero Anthropic subraya que 4.6 es un “upgrade completo” en habilidades: coding, razonamiento con contexto largo, planificación agéntica, trabajo de conocimiento y diseño. En la práctica, el objetivo es claro: que tareas que antes obligaban a recurrir a modelos superiores (más caros) puedan ejecutarse con esta variante sin sacrificar resultados.

La compañía pone el foco en un detalle que, para equipos técnicos, pesa más que cualquier eslogan: la consistencia. En su comunicación, Anthropic afirma que desarrolladores con acceso temprano han mostrado preferencia por Sonnet 4.6 frente a 4.5 por mejoras en seguimiento de instrucciones y regularidad al completar tareas.

Claude Code: la preferencia del usuario como métrica “real”

Más allá de benchmarks, Anthropic cita pruebas internas en Claude Code (su herramienta orientada a programación), donde los usuarios prefirieron Sonnet 4.6 sobre Sonnet 4.5 aproximadamente el 70% de las veces. Y añade un dato aún más llamativo: Sonnet 4.6 fue preferido frente a Opus 4.5 el 59% del tiempo, con usuarios valorando menos tendencia a “sobreingeniería”, mejor seguimiento de instrucciones y menos falsas afirmaciones de éxito.

Estas cifras importan por un motivo muy simple: en programación asistida por IA, el problema no suele ser “si escribe código”, sino si lo hace sin duplicar lógica, si lee el contexto antes de tocar archivos y si mantiene la disciplina durante sesiones largas. Anthropic sostiene que 4.6 consolida mejor lógica compartida y reduce frustraciones en flujos prolongados.

1.000.000 de tokens: el contexto largo deja de ser “demostración”

El otro gran titular es la ventana de contexto de 1.000.000 de tokens en beta. Anthropic la vende como suficiente para contener bases de código completas, contratos largos o decenas de documentos en una sola petición. Pero la promesa no es solo “cabe”, sino “razona de verdad” con todo ese material, algo crucial para planificación a largo horizonte en agentes.

En el ecosistema profesional, esto impacta en dos escenarios muy concretos:

  • Revisión y refactorización asistida en repositorios grandes, donde los fallos suelen venir de perder contexto.
  • Trabajo con documentación corporativa (PDFs, tablas, políticas internas) sin trocear el input en múltiples llamadas.

De hecho, Anthropic destaca mejoras en comprensión documental y menciona evaluaciones como OfficeQA, centradas en leer documentos empresariales (gráficas, PDFs, tablas) y razonar desde hechos, apuntando a una mejora tangible en cargas de “document intelligence”.

“Uso del ordenador”: menos conectores, más automatización (y más riesgo)

Donde 4.6 intenta diferenciarse con fuerza es en el llamado computer use: la capacidad de operar software como lo haría una persona, con ratón y teclado, en lugar de depender de APIs o integraciones hechas a medida. Anthropic recuerda que este enfoque busca atacar un problema real: la mayoría de organizaciones aún usa herramientas internas o legacy sin interfaces modernas.

Ahora bien, la compañía también reconoce el límite: el modelo “todavía va por detrás de los humanos más hábiles” usando un ordenador, y los errores en tareas reales pueden tener más impacto que en un benchmark.

Además, esta capacidad abre una puerta delicada: la inyección de prompt, es decir, instrucciones maliciosas escondidas en páginas web para secuestrar el comportamiento del agente. Anthropic asegura que sus evaluaciones muestran una mejora importante de Sonnet 4.6 frente a 4.5 en resistencia a este tipo de ataques, y lo sitúa en niveles similares a Opus 4.6.

Productividad con menos fricción: compacción de contexto, búsqueda y MCP

Sonnet 4.6 no llega solo. Anthropic acompaña el lanzamiento con novedades que apuntan a un patrón: hacer que los agentes consuman menos tokens y trabajen con más herramientas sin romper el flujo.

Entre las actualizaciones destacadas figuran:

  • Context compaction en beta, que resume automáticamente contexto antiguo cuando la conversación se acerca a límites, extendiendo el “contexto efectivo”.
  • Herramientas de web search y fetch que, según Anthropic, ahora escriben y ejecutan código para filtrar resultados y conservar solo lo relevante en contexto (mejorando calidad y eficiencia).
  • En Claude in Excel, soporte de conectores MCP para trabajar con herramientas de datos del día a día (S&P Global, LSEG, PitchBook, Moody’s, FactSet, entre otras) sin salir de Excel; disponible en planes Pro, Max, Team y Enterprise.

En el fondo, la narrativa es coherente con lo que está empujando el mercado: menos “chat suelto” y más IA integrada en flujos, con memoria operativa, ejecución de acciones y conectores a sistemas externos.

¿Sustituye a Opus? Anthropic marca la línea roja

Pese al salto, Anthropic deja un aviso a navegantes: Opus 4.6 sigue siendo la opción más fuerte para trabajos donde “hay que clavarlo”, como refactorización profunda, coordinación de múltiples agentes o problemas que exigen razonamiento más intenso.

Dicho de otro modo: Sonnet 4.6 busca convertirse en el “caballo de batalla” para más empresas y desarrolladores, pero Anthropic no vende que la gama alta haya desaparecido; vende que ahora se usa menos.


Preguntas frecuentes

¿Qué mejora Claude Sonnet 4.6 frente a Sonnet 4.5 para programadores?
Anthropic destaca mejoras en consistencia, seguimiento de instrucciones y trabajo en sesiones largas. En Claude Code, usuarios prefirieron Sonnet 4.6 frente a 4.5 aproximadamente el 70% de las veces.

¿Qué significa una ventana de contexto de 1.000.000 de tokens en un modelo de IA?
Permite incluir grandes volúmenes de información en una sola petición (por ejemplo, una base de código completa o documentación extensa). En Sonnet 4.6 esa capacidad está en beta y Anthropic afirma que el modelo puede razonar de forma efectiva sobre todo el contexto.

¿Qué es el “uso del ordenador” (computer use) en Claude y para qué sirve en empresas?
Es la capacidad de operar software sin APIs, como un humano: navegar, hacer clics y escribir. Es útil para automatizar herramientas legacy o portales internos donde crear conectores a medida era costoso.

¿Qué riesgos de seguridad introduce un agente que navega por webs y usa el ordenador?
Uno de los riesgos principales es la inyección de prompt (instrucciones ocultas en páginas para manipular al agente). Anthropic afirma que Sonnet 4.6 mejora de forma notable la resistencia a este tipo de ataques respecto a Sonnet 4.5.

Scroll al inicio