ChatGPT y las GPUs de NVIDIA: ¿Entrenar tu propio modelo desde casa por 36.000 euros al mes?

La inteligencia artificial ha experimentado un avance significativo en los últimos años, siendo ChatGPT de OpenAI un ejemplo destacado. Entrenar modelos como ChatGPT requiere una gran cantidad de recursos y potencia de procesamiento, algo que hasta ahora parecía estar al alcance únicamente de las grandes empresas. Microsoft, por ejemplo, invirtió cientos de millones de dólares en adquirir tarjetas gráficas NVIDIA A100 para entrenar a ChatGPT e integrarlo en su buscador Bing.

Sin embargo, NVIDIA ha anunciado recientemente su nuevo servicio llamado DGX Cloud, que permite a los clientes alquilar versiones virtuales de sus servidores DGX. Cada servidor cuenta con ocho tarjetas gráficas NVIDIA H100 o A100 y 640 GB de memoria. Dependiendo de las necesidades del cliente, el servicio puede escalar hasta 32.000 GPUs. Eso sí, el coste de la opción básica, que incluye ocho GPUs de alto rendimiento, es bastante elevado: aproximadamente 36.000 euros al mes.

Entrenar modelos de inteligencia artificial de gran envergadura es costoso. Google, por ejemplo, invirtió entre 9 y 23 millones de dólares para entrenar su modelo PaLM, con 540.000 millones de parámetros. Meta, por otro lado, entrenó su modelo LLaMA durante 21 días en 2.048 GPUs NVIDIA A100, con un coste estimado de unos cuatro millones de dólares.

A pesar del alto precio, el servicio DGX Cloud de NVIDIA ofrece la posibilidad de que cualquier entidad con los recursos suficientes, sin necesidad de ser una empresa del tamaño de Microsoft, pueda crear y entrenar su propio modelo de ChatGPT. La empresa MosaicML, especializada en este campo, ha presentado un proceso que permite desarrollar un chatbot similar a GPT-3 por menos de 500.000 dólares.

Esta inversión en entrenamiento de modelos de inteligencia artificial está provocando un cambio en el modelo de negocio de empresas como OpenAI, que pasan de ser organizaciones sin ánimo de lucro a compañías que buscan rentabilizar su tecnología. Con el lanzamiento de GPT-4 y su API, se espera que los ingresos de OpenAI aumenten significativamente.

En resumen, aunque el entrenamiento de modelos de inteligencia artificial como ChatGPT sigue siendo costoso, el nuevo servicio de NVIDIA DGX Cloud facilita a un público más amplio el acceso a la tecnología necesaria para desarrollar sus propios modelos. Esto podría impulsar aún más la innovación en el ámbito de la inteligencia artificial y permitir a más empresas y organizaciones beneficiarse de sus avances.

Últimos artículos

Scroll al inicio