Durante los dos últimos años, muchas empresas han adoptado herramientas de Inteligencia Artificial con una sensación cómoda: por 20 o 25 dólares al mes por usuario podían dar acceso a modelos avanzados, asistentes de escritura, análisis de documentos, generación de código, búsqueda, creación de archivos o automatización ligera. Comparado con casi cualquier software empresarial, parecía barato. Demasiado barato.
La tesis que empieza a ganar fuerza es incómoda: una parte de ese precio no refleja el coste real de prestar el servicio, sino una fase de captación subvencionada. Los grandes proveedores de IA han priorizado adopción, hábito y dependencia antes que márgenes claros. El problema para las empresas es que muchas ya están construyendo flujos de trabajo sobre precios que quizá no sean sostenibles.
El precio por asiento oculta el consumo real
La comparación entre suscripción y API muestra bien el desajuste. Anthropic ofrece Claude Pro por 20 dólares al mes para uso individual, mientras que sus planes Max suben a 100 y 200 dólares según capacidad. En API, Claude Sonnet 4.6 cuesta 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida; Claude Opus 4.6 y Opus 4.7 se sitúan en 5 dólares de entrada y 25 dólares de salida por millón de tokens.
La diferencia no es menor. Un trabajador que use Claude varias horas al día para cargar documentos, resumir informes, generar código, preparar presentaciones o analizar datos puede consumir millones de tokens en una semana. Si ese mismo consumo se pagase íntegramente a precio API, la factura podría acercarse más a decenas o cientos de dólares mensuales por usuario que a los 20 dólares de una suscripción básica.
No todos los usuarios llegan a ese nivel. Muchos hacen consultas breves, redactan correos o resumen textos de forma ocasional. Pero en empresas con perfiles intensivos, como desarrollo, consultoría, legal, marketing, análisis financiero o investigación, el consumo puede crecer rápido. Y cuanto más se integra la IA en el trabajo diario, más difícil resulta volver atrás.
| Escenario mensual | Coste aproximado |
|---|---|
| 50 usuarios con suscripción de 20 dólares | 1.000 dólares |
| 50 usuarios con consumo equivalente a 100 dólares | 5.000 dólares |
| 50 usuarios con consumo equivalente a 300 dólares | 15.000 dólares |
| 50 usuarios con consumo equivalente a 800 dólares | 40.000 dólares |
La tabla no pretende fijar una tarifa universal. Sirve para ilustrar el riesgo presupuestario. Una misma plantilla puede parecer barata bajo un modelo plano y convertirse en una partida relevante si el proveedor pasa a cobrar por consumo, añade límites más estrictos o empuja a planes superiores.
Los agentes rompen el modelo plano
El cambio más importante no es el chatbot, sino el agente. Una conversación tradicional tiene un consumo relativamente previsible: pregunta, respuesta, alguna iteración más. Los agentes de código, investigación o automatización trabajan de otra forma. Leen repositorios, abren archivos, ejecutan pruebas, consultan documentación, corrigen errores, vuelven a analizar y mantienen contexto durante sesiones largas.
Ese patrón consume muchos más tokens y más computación. No es casualidad que GitHub haya anunciado el cambio de Copilot hacia facturación basada en uso a partir del 01/06/2026, sustituyendo las unidades de solicitudes premium por GitHub AI Credits medidos según tokens de entrada, salida y caché. La explicación oficial es clara: Copilot ha evolucionado hacia experiencias más agénticas, y ese tipo de uso tiene demandas de inferencia más altas.
Anthropic también ha empezado a mostrar el camino. Sus planes de pago pueden activar “extra usage” para seguir trabajando al superar límites, pero ese uso adicional se factura a tarifas estándar de API. En el caso empresarial, la propia página de precios de Claude indica un modelo de asiento más coste de uso a tarifas API. La señal es relevante: el mercado se mueve de “todo incluido” hacia “asiento más consumo”.
OpenAI también ha ajustado su oferta por arriba. ChatGPT Pro se lanzó como un plan de 200 dólares mensuales para usuarios con cargas más intensivas, y la compañía ha ido separando cada vez más las experiencias de consumo, negocio, desarrollo y uso agéntico. En su página actual de planes, OpenAI ya presenta propuestas para equipos de desarrollo con pago por uso en Codex y sin cuota fija por asiento. Es una pista de hacia dónde va el mercado: la IA pesada no se comporta como un SaaS clásico.
El riesgo para empresas: dependencia antes que presupuesto
El problema no es que la IA vaya a encarecerse. Eso puede ser normal en una tecnología intensiva en infraestructura. El problema es que muchas empresas no están midiendo su exposición real. Compran licencias por usuario, celebran una adopción rápida y no siempre saben cuántos tokens consumen los equipos, qué tareas dependen ya de la herramienta, qué proveedor concentra más procesos o cuánto costaría migrar.
Ese es el riesgo de producto gancho. Primero se crea hábito. Después se integra en flujos de trabajo. Luego se vuelve difícil sustituirlo. Y cuando el precio cambia, la empresa descubre que la partida era pequeña solo porque alguien estaba absorbiendo parte del coste al otro lado.
El informe Q1 2026 AI Quarterly Pulse de KPMG muestra que las organizaciones de Estados Unidos proyectan un gasto medio en IA de 207 millones de dólares en los próximos 12 meses, casi el doble que un año antes. El dato refleja que la IA ya no es un experimento marginal, sino una partida de inversión importante. También indica que la conversación con el CFO será cada vez más inevitable.
Para los directores financieros, el riesgo no está solo en pagar más. Está en no poder explicar el retorno. Si una herramienta pasa de costar 1.000 dólares al mes a 20.000 o 40.000, la dirección pedirá métricas: horas ahorradas, ingresos generados, reducción de errores, productividad por equipo, impacto en ventas, mejora de soporte o velocidad de desarrollo. Quien no haya medido desde el principio tendrá dificultades para defender la factura.
Para los CIO y CTO, la exposición es técnica y contractual. Depender de un solo proveedor, sin control de consumo, sin límites por equipo, sin auditoría de prompts, sin política de modelos y sin alternativas internas o externas, convierte un cambio de precios en un problema operativo.
Qué deberían hacer ahora las empresas
La primera medida es dejar de contar solo licencias. Hay que medir consumo real por equipo, tarea, modelo y herramienta. Un usuario de soporte no consume igual que un desarrollador usando agentes de código. Un equipo legal con documentos largos no se parece a un departamento que usa IA para correos breves.
La segunda es simular escenarios. ¿Qué ocurre si el coste se multiplica por dos? ¿Y por cinco? ¿Qué workflows seguirían siendo rentables? ¿Cuáles deberían migrar a modelos más baratos? ¿Qué tareas podrían ejecutarse con modelos open source o privados? ¿Qué procesos requieren modelos premium y cuáles pueden resolverse con opciones más ligeras?
La tercera es evitar el bloqueo de proveedor. No todas las empresas necesitan desplegar modelos propios, pero sí conviene diseñar una arquitectura con opciones: varias APIs, capas de orquestación, observabilidad de tokens, políticas de caché, evaluación de calidad y capacidad de mover cargas entre modelos. La portabilidad no es gratis, pero puede evitar sorpresas.
La cuarta es separar uso experimental de uso productivo. Una cosa es que un empleado pruebe un asistente para redactar mejor. Otra, que una unidad de negocio dependa de agentes para generar código, responder clientes o analizar contratos. Cuando la IA pasa a producción, necesita gobierno, presupuesto, seguridad y métricas.
La era de la IA barata no tiene por qué terminar de golpe, pero ya se ven señales claras de ajuste. Los proveedores están aprendiendo que los modelos planos no encajan bien con cargas agénticas y uso intensivo. Las empresas, por su parte, deben aprender que una suscripción de 20 dólares puede ser solo el precio de entrada, no el coste real de operar con IA a escala.
La pregunta no es si la Inteligencia Artificial seguirá siendo útil. La pregunta es quién habrá hecho los números antes de que la factura cambie.
Preguntas frecuentes
¿Por qué se dice que las suscripciones de IA son una “bomba de relojería”?
Porque muchas empresas están usando herramientas de IA con precios planos bajos, mientras el coste real de computación puede ser mucho mayor en usuarios intensivos. Si los proveedores ajustan tarifas o pasan a consumo, el gasto puede crecer rápido.
¿Qué cambia con la IA agéntica?
Los agentes trabajan durante más tiempo, leen más contexto, ejecutan tareas, generan código y hacen múltiples iteraciones. Eso consume más tokens y más computación que un chatbot tradicional.
¿Todas las empresas van a pagar mucho más por IA?
No necesariamente. Dependerá del uso real, los modelos empleados, los límites contratados y la capacidad de optimizar cargas. Pero las empresas con uso intensivo y sin control de consumo están más expuestas.
¿Qué puede hacer una empresa para reducir el riesgo?
Medir consumo por equipo, simular subidas de precio, definir límites de gasto, evitar dependencia de un solo proveedor, usar modelos adecuados para cada tarea y separar pruebas de usos productivos.
vía: The State of Brand












