DeepSeek revoluciona la Inteligencia Artificial con su modelo V3-0324, capaz de ejecutarse localmente en un Mac Studio M3

La compañía DeepSeek ha dado un golpe sobre la mesa en el mundo de la Inteligencia Artificial con la presentación de su modelo V3-0324, un avance que ha sorprendido tanto por su potencia como por su capacidad de funcionar localmente en un dispositivo de consumo avanzado, como el Mac Studio M3.

Un modelo gigantesco de 685.000 millones de parámetros

Aunque DeepSeek ha presentado esta actualización como menor, las cifras hablan por sí solas: el modelo V3-0324 cuenta con 685.000 millones de parámetros, convirtiéndose en uno de los modelos de lenguaje más grandes disponibles en código abierto. Bajo licencia MIT, este modelo queda accesible tanto para desarrolladores individuales como para grandes empresas, fomentando la innovación y la colaboración en la comunidad IA sin restricciones.

comparativa parametros ia

Sin ruido mediático, pero con resultados sorprendentes

A diferencia de otros gigantes tecnológicos que acompañan sus lanzamientos con amplias campañas publicitarias y documentos técnicos, DeepSeek ha optado por una estrategia discreta. La publicación del modelo ha llegado acompañada únicamente por el peso del archivo y un README en blanco. Sin embargo, este enfoque minimalista ha puesto de manifiesto que lo importante es la tecnología, no el espectáculo.

El medio especializado VentureBeat ha destacado este lanzamiento como una rareza en un mercado donde el marketing suele ir de la mano de los avances tecnológicos, valorando el enfoque “contenido sobre ruido” adoptado por DeepSeek.

Demostración local: un hito en accesibilidad

El verdadero impacto del modelo ha llegado con la demostración realizada por el desarrollador @Awnihannun en X (anteriormente Twitter). En su publicación, mostró cómo el modelo DeepSeek V3-0324 puede ejecutarse de forma local en un Mac Studio M3 Ultra con 512 GB de memoria RAM, alcanzando una velocidad de generación de 20 tokens por segundo.

La prueba se realizó utilizando la biblioteca Python de código abierto MLX-LM, especialmente diseñada para generar texto y afinar modelos sobre hardware Apple con arquitectura M. Esta demostración ha sido calificada por la comunidad como “un salto inesperado hacia la democratización de los modelos de gran escala”.

Acceso a modelos gigantes desde el escritorio

El hecho de que un modelo con 685.000 millones de parámetros pueda funcionar sin necesidad de un centro de datos dedicado, y hacerlo desde un equipo de escritorio (aunque de alta gama), abre la puerta a un futuro donde desarrolladores e investigadores podrán experimentar y utilizar modelos extremadamente potentes sin depender de plataformas cloud o grandes infraestructuras.

Aunque el Mac Studio M3 Ultra utilizado en la demostración tiene un precio que supera los 9.400 dólares, lo que lo sitúa fuera del alcance del consumidor medio, el avance es un indicador de hacia dónde se dirige el sector: la ejecución local de modelos masivos podría llegar a equipos más asequibles en los próximos años.

Superando a Claude 3.5 Sonnet

Las pruebas realizadas por desarrolladores independientes sugieren que el modelo DeepSeek V3-0324 supera en capacidad y rendimiento al conocido Claude 3.5 Sonnet de Anthropic, lo que sitúa a DeepSeek en la vanguardia de los modelos de lenguaje abiertos.

Un paso hacia la accesibilidad masiva

La aparición de modelos de lenguaje de esta envergadura en entornos locales no solo implica ahorro de costes en infraestructuras cloud, sino que además abre oportunidades para nuevas aplicaciones, especialmente en ámbitos donde la privacidad de los datos es clave y no es posible depender de servidores externos.

¿El inicio de una nueva era IA?

Este avance tecnológico, lejos de ser solo un hito puntual, podría marcar el comienzo de una tendencia donde gigantescos modelos de lenguaje comiencen a estar al alcance de universidades, startups y desarrolladores autónomos sin necesidad de costosas plataformas cloud.

En un panorama en el que cada vez más compañías apuestan por modelos cerrados y pagos, DeepSeek apuesta por el código abierto y la libertad de uso, posicionándose como uno de los actores más disruptivos del sector.

El modelo DeepSeek V3-0324 no solo es una demostración de fuerza tecnológica, sino también una muestra de hacia dónde podría avanzar la Inteligencia Artificial en los próximos años: potencia masiva, accesibilidad y libertad para innovar desde cualquier escritorio.

Scroll al inicio