Machine Learning

La IA local deja de ser una rareza: modelos abiertos, privacidad y costes bajo control

Durante años la inteligencia artificial generativa se ha entendido como un servicio remoto: se abre una web, se paga una suscripción o una API, se envía el texto a un proveedor y se espera la respuesta. Ese modelo seguirá siendo dominante para muchos usos, sobre todo cuando se necesita el modelo más potente disponible, soporte empresarial o una ventana de

MCP: los 20 servidores que convierten a Claude en algo más que un chatbot

Durante mucho tiempo, usar un modelo de inteligencia artificial para programar ha significado copiar un error de la terminal, pegarlo en el chat, esperar una respuesta y volver al IDE para probar el cambio. Ese flujo funciona para dudas puntuales, pero se queda corto cuando el problema exige leer un repositorio, consultar una base de datos, abrir una issue, revisar

Gemma 4 acelera hasta 3x en vLLM con MTP y decodificación especulativa

Google ha lanzado drafters MTP para la familia Gemma 4, una mejora pensada para reducir la latencia de inferencia sin cambiar la calidad final de las respuestas. La promesa es muy atractiva para quienes despliegan modelos abiertos en local, estaciones de trabajo o servidores propios: hasta tres veces más velocidad en determinadas configuraciones, manteniendo el mismo modelo principal como verificador

ACE-1 coloca a Taiwán en el mapa de los modelos soberanos de IA

La carrera por la Inteligencia Artificial soberana ya no se mide solo por quién fabrica los chips más avanzados o quién tiene más centros de datos. También se juega en algo menos visible, pero igual de importante: si los modelos entienden bien una lengua, una cultura, unas leyes y una forma concreta de usar el conocimiento. En Taiwán, ese debate

Anthropic dispara la capacidad de Claude con un acuerdo de cómputo con SpaceX

Anthropic ha anunciado un acuerdo con SpaceX que le dará acceso a toda la capacidad de cómputo del centro de datos Colossus 1, una instalación que la compañía cifra en más de 300 megavatios y más de 220.000 GPU NVIDIA disponibles en el plazo de un mes. El movimiento llega acompañado de una subida inmediata de los límites de uso

Donald Knuth cambia el tono sobre la IA tras un hallazgo de Claude

Donald Knuth, una de las figuras más influyentes de la informática moderna, ha publicado una breve nota con un arranque poco habitual en su estilo: “Shock! Shock!”. El motivo era que Claude Opus 4.6, un modelo de razonamiento de Anthropic, había encontrado una solución para un problema abierto de teoría de grafos en el que Knuth llevaba varias semanas trabajando

Bonsai 8B desafía la lógica de los LLM: 8.200 millones de parámetros en 1,15 GB

Durante años, la industria de los modelos de lenguaje ha repetido casi el mismo mantra: si se quiere más capacidad, hacen falta más parámetros, más memoria y más hardware. Por eso el lanzamiento de Bonsai 8B, el nuevo modelo de PrismML, ha llamado tanto la atención. La startup, nacida a partir de investigación vinculada a Caltech, asegura haber metido 8.190

Conceptual abstract editorial illustration of a chinese AI company funding round: stylized open-source neural network laye...

DeepSeek estudia una megaronda en China que la valoraría en 44.000 millones

DeepSeek vuelve al primer plano financiero del sector de la inteligencia artificial, y esta vez no por un modelo nuevo. Varios medios chinos aseguran que la compañía prepara una ampliacion de capital de 50.000 millones de yuanes, con una valoracion pre-money de 300.000 millones de yuanes, unos 44.000 millones de dolares al cambio actual. La cifra, si se confirma, situaría

Scroll al inicio