La factura oculta de la IA: los tokens ya no parecen tan baratos

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

La Inteligencia Artificial prometía una ecuación sencilla para muchas empresas: más productividad, menos tareas repetitivas y costes laborales más bajos. Dos años después del despliegue masivo de asistentes, copilotos y agentes, esa promesa empieza a tropezar con una realidad menos cómoda. Los modelos son útiles, pero ejecutarlos no es gratis. Y en algunos equipos intensivos en IA, el gasto en cómputo empieza a rivalizar con el coste de las personas que supuestamente iba a sustituir.

El debate ha ganado fuerza después de unas declaraciones de Bryan Catanzaro, vicepresidente de Applied Deep Learning en NVIDIA. Según recogió Fortune, el directivo explicó que en su equipo el coste de cómputo está “muy por encima” del coste de los empleados. El caso de NVIDIA no representa a una empresa media: hablamos de un equipo que trabaja en la frontera de la IA y que consume recursos muy superiores a los de un departamento convencional. Pero la frase sirve como aviso para el resto del mercado.

Los tokens entran en la cuenta de resultados

Durante la primera ola de adopción, muchas empresas trataron la Inteligencia Artificial como una suscripción más. Se pagaba una licencia mensual, se medía el número de usuarios y se esperaba que la productividad compensara el gasto. Esa etapa está cambiando. Los proveedores empiezan a mover sus productos hacia facturación basada en uso, donde cada prompt, cada respuesta larga, cada archivo procesado y cada iteración de un agente consumen tokens y, por tanto, presupuesto.

GitHub Copilot es un ejemplo claro. GitHub ha anunciado que todos los planes de Copilot pasarán a un modelo de facturación basado en uso desde el 1 de junio de 2026, mediante GitHub AI Credits. El consumo se calculará con tokens de entrada, salida y caché, usando las tarifas API de cada modelo. En la práctica, una petición larga o una respuesta extensa costarán más que una interacción breve.

Este cambio altera los incentivos. Una alucinación ya no es solo una molestia que obliga a revisar una respuesta. También puede tener un coste económico si el modelo genera más texto, ejecuta más pasos o entra en bucles de corrección. Los agentes elevan aún más el riesgo porque pueden lanzar muchas llamadas encadenadas a modelos, herramientas, repositorios, documentos y servicios externos sin que el usuario perciba cada una de ellas como un gasto separado.

Anthropic también ha revisado al alza sus estimaciones de coste para Claude Code. Según información publicada por Business Insider y recogida por LinkedIn News y otros medios, la compañía elevó su estimación media de gasto de 6 a 13 dólares por desarrollador y día activo, con costes que pueden mantenerse por debajo de 30 dólares diarios para el 90 % de usuarios. No es una cifra inasumible para un desarrollador caro, pero sí cambia la conversación cuando se multiplica por miles de empleados, usos intensivos y agentes ejecutándose durante horas.

El problema no es que la IA sea siempre cara. Muchas tareas siguen siendo baratas si se usan modelos pequeños, prompts bien diseñados y flujos controlados. El problema es que el gasto escala con facilidad. Un equipo que prueba agentes de programación, análisis documental, generación de informes, soporte interno y automatización puede descubrir tarde que el presupuesto mensual se ha disparado.

Productividad prometida, productividad demostrada

El otro lado de la ecuación es la productividad. Si la IA ahorra muchas horas, el coste de los tokens puede estar justificado. El problema es que las ganancias no siempre aparecen de forma clara en las métricas de empresa. Un working paper del National Bureau of Economic Research, basado en encuestas a casi 6.000 directivos de Estados Unidos, Reino Unido, Alemania y Australia, concluyó que más del 80 % de las empresas no reportó impacto de la IA en empleo o productividad durante los últimos tres años.

La cifra no significa que la IA no sirva. Significa que la adopción todavía es superficial, desigual o difícil de medir. Muchos empleados usan estas herramientas para redactar, resumir o buscar ideas, pero eso no siempre se traduce en más ventas por empleado, menos plantilla, menos tiempo de ciclo o mejores márgenes. En algunas organizaciones, la IA se añade al trabajo existente en lugar de rediseñarlo.

Harvard Business Review ha descrito precisamente ese riesgo. En un artículo publicado en febrero de 2026, investigadores de Berkeley Haas señalaron que la IA puede intensificar el trabajo en vez de reducirlo. Los empleados pueden asumir más tareas, trabajar a más ritmo y extender su jornada porque ahora tienen herramientas que les permiten producir más, pero no necesariamente descansar más. Si la organización no cambia prioridades, la productividad inicial puede transformarse en fatiga, peor toma de decisiones y mayor rotación.

Este punto es importante para los directivos. La IA no crea productividad por instalación. La crea cuando cambia procesos, elimina pasos, reduce esperas, mejora decisiones o evita trabajo duplicado. Si solo se añade una capa de copilotos sobre flujos mal diseñados, el resultado puede ser más ruido, más outputs que revisar y más presión sobre los empleados.

La paradoja de despedir personas para pagar cómputo

La tensión llega en un momento de despidos masivos en tecnología. Tom’s Hardware, citando datos de la industria, señaló que en el primer trimestre de 2026 se eliminaron 78.557 empleos tecnológicos y que casi la mitad de esos recortes se atribuyeron a IA o automatización de flujos de trabajo. Otros medios han advertido de que muchas compañías pueden estar usando la IA como explicación conveniente para ajustes que también responden a márgenes, reorganizaciones o presión inversora.

La paradoja es evidente. Algunas empresas reducen plantilla con el argumento de que la Inteligencia Artificial hará más eficiente el negocio, pero al mismo tiempo aumentan el gasto en infraestructura, licencias, tokens, consultoría y supervisión. Si el retorno no llega rápido, el ahorro laboral puede quedar parcialmente absorbido por el coste tecnológico.

Eso no significa que las empresas vayan a “volver atrás” y abandonar la IA. Es poco probable. La tecnología es demasiado útil y está avanzando demasiado rápido. Pero sí puede cambiar la narrativa. El siguiente ciclo no premiará a quien diga que usa más IA, sino a quien demuestre que la usa mejor: menos llamadas innecesarias a modelos caros, más automatización medible, más selección de modelos por tarea y más control sobre costes.

Los trabajadores eficientes vuelven así al centro del debate. Un profesional que sabe cuándo usar IA, cuándo no usarla, cómo pedirle algo con precisión, cómo validar resultados y cómo integrarla en un flujo real puede valer más que una docena de automatizaciones mal gobernadas. La ventaja no está en sustituir criterio humano por tokens, sino en combinar ambos de forma disciplinada.

Del entusiasmo al control de costes

La factura de la Inteligencia Artificial obligará a las empresas a madurar. Igual que ocurrió con la nube pública, primero llegó la adopción acelerada y después la preocupación por la factura. Muchas organizaciones vivieron una etapa de “sube todo a cloud” antes de crear prácticas FinOps para medir consumo, asignar costes y corregir excesos. Con la IA está ocurriendo algo parecido: empieza la era del AI FinOps.

Eso implica presupuestos por equipo, límites de uso, elección de modelos según coste y calidad, auditoría de agentes, caché de respuestas, prompts más cortos, modelos pequeños para tareas simples y escalado a modelos más caros solo cuando haga falta. También exige medir resultados: horas ahorradas, errores reducidos, clientes atendidos, código aceptado, incidencias resueltas o ingresos generados.

Las empresas que no hagan esa medición pueden acabar en una zona peligrosa: menos empleados, más herramientas, más gasto variable y una productividad difícil de demostrar. Las que lo hagan bien podrán usar IA para ampliar capacidades sin convertir cada flujo de trabajo en una máquina de quemar tokens.

La idea de “talento sobre tokens” no es una defensa nostálgica del trabajo humano frente a la tecnología. Es una lectura económica. Los modelos necesitan dirección, contexto, datos limpios, criterios de calidad y límites. Sin eso, generan volumen. Con eso, generan valor. Y en un entorno donde ejecutar modelos cuesta cada vez más dinero, el talento que sabe convertir IA en resultados medibles será más importante, no menos.

Preguntas frecuentes

¿Por qué se dice que la IA puede ser más cara que los empleados?
Porque en equipos muy intensivos en IA, como algunos grupos de NVIDIA, el gasto en cómputo puede superar el coste salarial. No es representativo de todas las empresas, pero muestra que la factura de tokens y GPU puede crecer muy rápido.

¿Qué cambia con la facturación por tokens?
Que las empresas pagan según uso real: prompts, respuestas, contexto, caché y llamadas de agentes. Las interacciones largas o repetidas cuestan más, y los agentes pueden consumir mucho presupuesto si no tienen límites.

¿La IA está demostrando mejoras claras de productividad?
Depende del caso. Un estudio del NBER con casi 6.000 directivos concluyó que más del 80 % de las empresas no había visto impacto en empleo o productividad en los últimos tres años, aunque muchas esperan mejoras futuras.

¿Qué pueden hacer las empresas para controlar el gasto en IA?
Medir uso y resultados, limitar agentes, usar modelos pequeños cuando baste, aplicar presupuestos por equipo, revisar prompts, auditar automatizaciones y formar a empleados para usar la IA con criterio.