Nvidia refuerza su ecosistema de IA con la compra de Gretel y apuesta por los datos sintéticos

La tecnológica adquiere la startup especializada en generación de datos sintéticos por más de 320 millones de dólares y se posiciona en el centro del nuevo paradigma del entrenamiento de modelos de inteligencia artificial.

En una jugada estratégica que marca un antes y un después en el entrenamiento de modelos de inteligencia artificial, Nvidia ha adquirido Gretel, una startup especializada en generación de datos sintéticos, por más de 320 millones de dólares. El movimiento refuerza la posición de la compañía como líder no solo en hardware, sino también en el ecosistema completo de desarrollo y entrenamiento de IA, especialmente en sectores sensibles como la salud, las finanzas o la automoción, donde el acceso a datos reales está cada vez más restringido por regulaciones y preocupaciones de privacidad.

Privacidad, escalabilidad y diversidad: las ventajas del dato artificial

Los datos sintéticos ofrecen una alternativa viable y cada vez más atractiva frente a los datos reales. Se trata de información generada artificialmente que replica patrones y características estadísticas de datos reales, pero sin comprometer la privacidad de las personas. Para Nvidia, se trata de una pieza clave para resolver uno de los mayores cuellos de botella de la inteligencia artificial: el acceso a datos de calidad a gran escala.

Entre las ventajas más relevantes destacan su alta escalabilidad, la posibilidad de controlar y reducir sesgos, el menor coste frente a los datos reales y, sobre todo, la protección de la privacidad, un aspecto fundamental en sectores regulados. Gretel, en particular, se ha especializado en datos tabulares y secuenciales, y su tecnología permite generar conjuntos de datos anonimizados y equilibrados, especialmente útiles para entrenar modelos en contextos clínicos, financieros o gubernamentales.

Un cambio de modelo en el entrenamiento de la IA

Gretel fue fundada en 2019 por Alex Watson, John Myers y Ali Golshan, y hasta la adquisición había recaudado más de 67 millones de dólares en capital de riesgo. Su enfoque se basa en el principio de “privacidad desde el diseño”, mediante técnicas como la privacidad diferencial y el ajuste fino de modelos open source para la generación de datasets sintéticos seguros.

Para Nvidia, la compra de Gretel se alinea con otras iniciativas clave como Omniverse Replicator, Nemotron o su inversión en modelos generativos. La compañía busca crear una infraestructura integral que permita generar, entrenar y desplegar modelos de IA de forma más rápida, eficiente y ética.

Durante su intervención en el CES 2025, Jensen Huang, CEO de Nvidia, destacó que la compañía apuesta por combinar potencia de cálculo, eficiencia algorítmica y calidad de datos para liderar el futuro del desarrollo de inteligencia artificial.

¿Pueden los datos sintéticos sustituir por completo a los reales?

Aunque su potencial es enorme, los expertos coinciden en que no deben verse como un reemplazo absoluto, sino como parte de una estrategia híbrida. Modelos entrenados exclusivamente con datos sintéticos corren el riesgo de sufrir fenómenos como el “colapso del modelo”, donde la calidad y la capacidad de generalización se degradan por falta de diversidad real.

Por ello, voces autorizadas del sector, como Sam Altman (OpenAI) o Dario Amodei (Anthropic), promueven enfoques que combinan datos humanos y sintéticos de forma dinámica, ajustando las proporciones según las necesidades del modelo.

La tendencia: motores de datos infinitos y evaluación ética

La adquisición de Gretel encaja en una estrategia más amplia del sector: desarrollar motores generativos de datos infinitos, complementados con métricas de evaluación de calidad, marcos éticos y mecanismos de validación de sesgos. En este nuevo escenario, Nvidia no solo vende GPUs: se consolida como el proveedor integral de infraestructura para el entrenamiento seguro y escalable de la IA.

Mientras otras compañías como Meta, Microsoft, Amazon y Google también avanzan en el uso de datos sintéticos para entrenar sus modelos, la apuesta de Nvidia por Gretel revela un interés por liderar el cambio de paradigma. Un futuro donde el dato ya no será solo escaso y valioso, sino también generable, controlable y cada vez más estratégico.

vía: HRS

Scroll al inicio