La adopción de la inteligencia artificial en las empresas avanza a gran velocidad, pero la base sobre la que debería sustentarse —los datos— aún está lejos de estar preparada. Un nuevo informe global elaborado por Harvard Business Review Analytic Services en colaboración con Cloudera revela que la mayoría de las organizaciones todavía enfrenta serios problemas para preparar y gestionar los datos necesarios para aplicar inteligencia artificial a gran escala.
El estudio, titulado Taming the Complexity of AI Data Readiness, analizó las respuestas de más de 230 profesionales implicados en decisiones de datos e inteligencia artificial dentro de sus organizaciones. Sus conclusiones muestran una brecha cada vez más evidente entre la ambición empresarial por adoptar inteligencia artificial y la realidad técnica necesaria para hacerlo con éxito.
La inteligencia artificial avanza más rápido que los datos
Según el informe, apenas el 7 % de las empresas afirma que sus datos están completamente preparados para implementar inteligencia artificial. Otro 15 % considera que están “casi preparados”, mientras que la mayoría —un 51 %— reconoce que sus datos solo están parcialmente listos para este tipo de iniciativas.
El panorama se vuelve más preocupante cuando se observa que un 27 % de las organizaciones admite que sus datos no están preparados o apenas lo están para proyectos de inteligencia artificial.
Esta situación refleja un problema estructural en muchas empresas modernas: aunque la inversión en inteligencia artificial crece rápidamente, las infraestructuras de datos y los procesos de gobernanza no evolucionan al mismo ritmo.
Los datos empresariales suelen estar dispersos en múltiples sistemas, departamentos y formatos. Esa fragmentación dificulta su integración y su análisis, especialmente cuando se pretende alimentar modelos avanzados de inteligencia artificial.
Los principales obstáculos para preparar datos para IA
El informe identifica varios problemas recurrentes que frenan la preparación de datos para proyectos de inteligencia artificial.
El más relevante es la existencia de silos de datos o la dificultad para integrar múltiples fuentes, mencionado por el 56 % de los encuestados. En muchas organizaciones, la información sigue almacenada en sistemas aislados que no comparten estándares ni arquitecturas comunes.
A este problema se suma la falta de una estrategia clara de datos, señalada por el 44 % de los participantes, lo que impide definir procesos coherentes de gestión, calidad y gobernanza de la información.
Otros obstáculos importantes incluyen:
- Problemas de calidad o sesgos en los datos (41 %)
- Restricciones regulatorias en el uso de datos (34 %)
- Incompatibilidades entre formatos o tipos de datos
- Falta de infraestructura o herramientas adecuadas
En la práctica, esto significa que muchas empresas acumulan enormes volúmenes de información, pero no pueden utilizarlos eficazmente para generar valor.
La calidad del dato se convierte en una prioridad estratégica
El informe revela que el 73 % de las organizaciones reconoce que debería priorizar más la calidad de los datos para inteligencia artificial. Curiosamente, ese mismo porcentaje admite que la preparación y procesamiento de datos para IA sigue siendo una tarea compleja y costosa.
Los expertos señalan que el problema no es nuevo. Durante años, las empresas han acumulado datos sin desarrollar estrategias sólidas para gestionarlos. La llegada de la inteligencia artificial ha hecho visible una debilidad estructural que antes pasaba más desapercibida.
Como explica el informe, disponer de grandes volúmenes de datos no garantiza su utilidad. Si la información contiene errores, inconsistencias o sesgos, los modelos de inteligencia artificial producirán resultados poco fiables.
Esto no solo afecta al rendimiento de los algoritmos, sino también a la confianza en las decisiones empresariales basadas en esos sistemas.
Estrategias de datos para la inteligencia artificial aún en desarrollo
Otro dato relevante del estudio es que solo el 23 % de las organizaciones cuenta actualmente con una estrategia de datos consolidada para inteligencia artificial, mientras que un 53 % está trabajando en desarrollarla.
Las empresas que ya están diseñando este tipo de estrategias señalan tres elementos clave:
- Protección de datos sensibles y privacidad (59 %)
- Calidad y consistencia del dato (46 %)
- Gobernanza y control de datos (41 %)
La seguridad y la privacidad se han convertido en prioridades especialmente importantes en entornos regulados o en regiones con normativas estrictas sobre protección de datos.
Además, muchas organizaciones mantienen información crítica en infraestructuras locales debido a cuestiones de soberanía, seguridad o costes, lo que añade complejidad a los proyectos de inteligencia artificial.
El papel del cloud y los entornos híbridos
El estudio también muestra cómo las arquitecturas tecnológicas están evolucionando para adaptarse a estos desafíos.
Actualmente, el 51 % de las empresas utiliza la nube como principal entorno de almacenamiento de datos para inteligencia artificial, mientras que un 28 % combina infraestructuras cloud y sistemas locales.
En los próximos 12 meses, el 77 % de las organizaciones prevé aumentar su almacenamiento en la nube para datos relacionados con inteligencia artificial, lo que refleja la creciente importancia de estas plataformas.
Sin embargo, el informe destaca que cada vez más empresas buscan soluciones híbridas que permitan ejecutar algoritmos de inteligencia artificial donde residen los datos, en lugar de trasladar grandes volúmenes de información entre sistemas.
Este enfoque reduce la latencia, mejora la seguridad y evita los costes asociados al movimiento masivo de datos.
La IA agéntica podría ayudar a resolver el problema
Una de las tendencias emergentes señaladas en el informe es el uso de inteligencia artificial agéntica, sistemas capaces de ejecutar tareas de forma autónoma y tomar decisiones dentro de procesos empresariales.
Según el estudio:
- El 65 % de los encuestados cree que muchos procesos empresariales serán aumentados o reemplazados por IA agéntica en los próximos dos años
- El 47 % considera que estos sistemas podrían ayudar a resolver problemas de calidad de datos
Estos agentes inteligentes podrían automatizar tareas como la limpieza de datos, la detección de inconsistencias o la supervisión continua de pipelines de datos.
Si estas tecnologías evolucionan como se espera, podrían reducir significativamente el esfuerzo manual necesario para preparar datos para inteligencia artificial.
Un cambio de mentalidad en las empresas
Más allá de la tecnología, el informe apunta a un cambio cultural dentro de las organizaciones.
Durante años, muchas empresas consideraron la gestión de datos como un coste operativo. Hoy, cada vez más líderes empresariales empiezan a verla como un activo estratégico fundamental para competir en la economía digital.
La inteligencia artificial está acelerando ese cambio de mentalidad. Sin datos fiables, estructurados y gobernados, incluso los modelos más avanzados son incapaces de generar valor real.
Por ello, el verdadero reto de la inteligencia artificial en la empresa no es solo desarrollar algoritmos más potentes, sino construir infraestructuras de datos capaces de sostenerlos.
Preguntas frecuentes sobre la preparación de datos para inteligencia artificial
¿Por qué los datos son tan importantes para la inteligencia artificial en las empresas?
Los modelos de inteligencia artificial aprenden a partir de los datos. Si los datos son incompletos, inconsistentes o contienen errores, los resultados generados por la IA también serán poco fiables. Por eso la calidad, la gobernanza y la accesibilidad del dato son factores clave para el éxito de cualquier proyecto de inteligencia artificial empresarial.
¿Cuáles son los principales problemas que tienen las empresas al preparar datos para IA?
Los mayores desafíos incluyen la existencia de silos de datos, la dificultad para integrar múltiples fuentes de información, la falta de una estrategia clara de datos, problemas de calidad o sesgos en la información y las restricciones regulatorias en el uso de determinados datos.
¿Cómo ayudan las arquitecturas cloud e híbridas a la inteligencia artificial?
Las infraestructuras cloud permiten escalar el almacenamiento y el procesamiento de datos de forma flexible. Además, los entornos híbridos permiten ejecutar algoritmos de inteligencia artificial cerca de los datos, lo que reduce la latencia, mejora la seguridad y evita mover grandes volúmenes de información entre sistemas.
¿Qué es la inteligencia artificial agéntica y cómo puede mejorar la gestión de datos?
La inteligencia artificial agéntica se refiere a sistemas capaces de actuar de forma autónoma para resolver tareas complejas. En el ámbito de los datos, estos agentes pueden automatizar procesos como la limpieza de datos, la detección de errores o la supervisión de pipelines de datos, facilitando así la preparación de información para proyectos de inteligencia artificial.
vía: cloudera








