Startups como PolyAI, ElevenLabs y gigantes como OpenAI han dado vida a una nueva generación de asistentes virtuales capaces de mantener conversaciones realistas por teléfono. El 75 % de los nuevos centros de contacto adoptarán estas tecnologías antes de 2028, según Gartner.
La inteligencia artificial ya no solo contesta correos o chatea desde una ventana en la web. Ahora te llama, te escucha, te responde e incluso hace sugerencias, como lo haría cualquier agente humano al teléfono. El futuro de la atención al cliente está llegando más rápido de lo previsto, y la voz de la IA ya suena en múltiples sectores: salud, seguros, restauración y juegos de azar.
La consultora Gartner estima que el 75 % de los nuevos centros de contacto incorporarán tecnologías de IA generativa—incluyendo agentes de voz—antes de 2028. Una predicción que está respaldada por la velocidad con la que empresas y startups están adoptando modelos de voz basados en inteligencia artificial.
De IVR a inteligencia contextual: una evolución acelerada
Durante décadas, los sistemas de respuesta de voz interactiva (IVR) han dominado los call centers. Esos sistemas pedían al usuario «pulse 1 para ventas» o «marque 2 para soporte», y respondían con frases rígidas y prediseñadas. Hoy, eso empieza a parecer cosa del pasado.
La nueva generación de agentes de voz impulsados por modelos de lenguaje como GPT-4o (OpenAI) o Claude (Anthropic) no solo escuchan y hablan, sino que razonan, contextualizan y actúan en tiempo real. Según Belle Lin (WSJ), modelos como OpenAI Whisper o los desarrollos de Deepgram y Assembly AI están marcando un nuevo estándar para el reconocimiento de voz y la síntesis conversacional.
“Estos agentes son interrumpibles, hacen sugerencias lógicas, y apenas presentan latencia”, explica Tom Coshow, analista en Gartner. “Es un cambio que esperábamos para dentro de uno o dos años, pero que ya está ocurriendo”.
Startups a la cabeza de la revolución por voz
El boom tecnológico viene acompañado por un auge inversor sin precedentes. Según datos de CB Insights, la financiación de startups dedicadas a la voz con IA pasó de 315 millones de dólares en 2022 a más de 2.100 millones en 2024. Entre las protagonistas están:
- PolyAI, especializada en agentes que gestionan reservas, reclamaciones y soporte al cliente por voz con un enfoque empresarial.
- Regal, cuya IA ya realiza tareas de ventas automatizadas por teléfono.
- ElevenLabs, conocida por sus voces sintéticas ultra realistas para múltiples idiomas y tonos emocionales.
- Cartesia, centrada en mejorar la naturalidad y la personalización de las conversaciones.
Casos de uso reales: seguros, casinos y restaurantes
eHealth, una aseguradora de salud digital en EE. UU., ya utiliza agentes de voz con IA para realizar filtros iniciales en llamadas de nuevos clientes o cuando su personal humano está ocupado. Su director digital, Ketan Babaria, explicó al Wall Street Journal que los usuarios apenas notan la diferencia con una voz humana.
En el sector del ocio, Fertitta Entertainment—propietaria de los casinos Golden Nugget y las cadenas de restaurantes Landry’s—ha integrado IA en su sistema telefónico de atención al cliente. Para evitar los riesgos de desinformación generada por la IA (también conocidas como “alucinaciones”), sus agentes están estrictamente limitados al contenido de su base de datos.
“No les permitimos desviarse del guion. Usan solo nuestro conocimiento validado”, afirmó Brian Jeppesen, director de operaciones del centro de llamadas de Fertitta.
¿Pueden reemplazar por completo a los humanos?
Aunque estas tecnologías avanzan a pasos agigantados, las empresas reconocen que siempre habrá necesidad de un toque humano, especialmente en interacciones de alto valor o emocionalmente sensibles.
“No es el fin del centro de contacto humano, pero sí su transformación”, asegura Coshow.
De momento, muchas compañías siguen priorizando el uso de asistentes por chat y animan a los usuarios a resolver dudas en línea, aunque el cambio hacia la voz ya es imparable.
Transparencia, privacidad y confianza
Uno de los desafíos éticos clave es la transparencia. Por ello, empresas como eHealth informan al usuario desde el inicio de la llamada de que están hablando con un “agente virtual”. Esta práctica, según expertos, es esencial para mantener la confianza del consumidor y cumplir con regulaciones de protección de datos.
Conclusión: ¿estás hablando con una IA sin saberlo?
La revolución de la voz con IA ya está en marcha, y muchos consumidores probablemente han interactuado con un agente virtual sin percatarse. Las voces sintéticas actuales son tan realistas que distinguir entre una persona real y una IA se ha vuelto extremadamente difícil.
A medida que estas herramientas se expanden y perfeccionan, el teléfono dejará de ser un canal exclusivamente humano. En su lugar, veremos una colaboración cada vez más sofisticada entre humanos y máquinas, donde la eficiencia y la personalización marcarán la diferencia.
Fuentes utilizadas:
- WSJ: “AI Voice Agents Are Ready to Take Your Call” (Belle Lin, mayo 2025)
- CB Insights: Informe sobre inversión en startups de voz con IA (2024)
- Gartner: Previsión de adopción de IA en centros de contacto (2025–2028)
- Sitios oficiales de PolyAI, ElevenLabs y OpenAI