Machine Learning

Nvidia y Mistral lanzan un modelo de lenguaje compacto para portátiles: El Mistral-NeMo-Minitron 8B

En un avance significativo para la inteligencia artificial accesible desde dispositivos personales, Nvidia y Mistral han presentado el Mistral-NeMo-Minitron 8B, un modelo de lenguaje compacto diseñado para funcionar eficientemente en laptops y PCs. Esta innovación busca resolver el desafío de la sobrecarga de computación al mismo tiempo que proporciona una alta precisión en las tareas de procesamiento del lenguaje. Optimización

Microsoft lanza Phi-3.5-MoE: Un modelo de IA compacto que supera a los más grandes en desempeño

Microsoft ha presentado su último avance en inteligencia artificial, el modelo Phi-3.5-MoE, que promete revolucionar el campo de la IA al combinar un diseño compacto con una capacidad de razonamiento comparable a modelos mucho más grandes. Esta innovadora tecnología no solo destaca por su eficiencia, sino también por su capacidad para superar a competidores conocidos en pruebas de rendimiento. Un

OpenAI permite a empresas personalizar GPT-4o con sus propios datos

OpenAI ha dado un paso significativo hacia la personalización de su modelo de lenguaje más avanzado, GPT-4o, permitiendo ahora a los clientes empresariales adaptar el modelo a sus necesidades específicas utilizando sus propios datos. Esta nueva capacidad de ajuste fino está diseñada para ayudar a las empresas a desarrollar modelos que puedan realizar tareas concretas y ajustarse a casos de

Nous Research lanza Hermes 3: El modelo de IA de código abierto más avanzado hasta la fecha

Nous Research ha presentado Hermes 3, su último modelo de inteligencia artificial de código abierto que promete revolucionar el campo con sus mejoras significativas en el manejo de tareas de rol, funciones agenciales, llamadas a funciones, conversaciones multivuelta y coherencia en contextos largos. Hermes 3, disponible en tres versiones (8B, 70B y 405B), destaca especialmente con el modelo de 405B

Grok-2 y Grok-2 Mini: xAI quiere superar a OpenAI

La última novedad en el ámbito de los modelos de lenguaje es la beta de Grok-2, presentada por xAI. Este lanzamiento marca un avance significativo respecto a su predecesor, Grok-1.5, y introduce dos versiones del nuevo modelo: Grok-2 y Grok-2 Mini. La versión beta de estos modelos ya está disponible para los usuarios de la plataforma 𝕏, y se espera

¿Qué es el LSLM?

El LSLM es un sistema de inteligencia artificial diseñado para manejar simultáneamente la entrada y salida de audio en tiempo real. A diferencia de los modelos de lenguaje tradicionales, que operan en un modo de conversación por turnos, el LSLM permite un flujo de comunicación continuo y bidireccional. Esto se traduce en conversaciones más naturales, donde la IA puede interrumpir,

Desarrollan un Modelo de Lenguaje que permite conversaciones en tiempo real

Investigadores en inteligencia artificial han desarrollado un innovador modelo de lenguaje, el Listening-While-Speaking Language Model (LSLM), que puede escuchar y hablar simultáneamente, avanzando significativamente en las conversaciones interactivas basadas en voz en tiempo real. El modelo, denominado Listening-while-Speaking Language Model (LSLM), habilita el modelado full-duplex en modelos interactivos de lenguaje hablado. Este sistema utiliza un decodificador basado en tokens únicamente

Google lanza tres nuevos modelos de IA seguros y abiertos

Google ha presentado tres nuevos modelos de inteligencia artificial: Gemma 2 2B, ShieldGemma y Gemma Scope, los cuales, a diferencia de los modelos «cerrados» Gemini de Google, son «abiertos», proporcionando a los desarrolladores acceso a su código fuente. Aunque están diseñados para diferentes aplicaciones, todos comparten un enfoque común en la seguridad y forman parte de la familia de modelos

Meta lanza Llama 3.1: Su modelo de IA más capaz hasta la fecha

Meta continúa su compromiso con la accesibilidad abierta en inteligencia artificial con el lanzamiento de su nuevo modelo, Llama 3.1. Este modelo amplía la longitud de contexto a 128K, añade soporte en ocho idiomas y presenta Llama 3.1 405B, el primer modelo de IA de código abierto a nivel de frontera. Innovaciones de Llama 3.1 Llama 3.1 405B destaca por

Nvidia lanza modelos de IA de código abierto para revolucionar la generación de datos sintéticos

Nvidia ha presentado Nemotron-4 340B, una familia de modelos de lenguaje de código abierto diseñados para generar datos sintéticos de alta calidad y crear aplicaciones de inteligencia artificial (IA) poderosas en diversas industrias. Estos modelos prometen transformar la forma en que se entrenan los modelos de lenguaje de gran escala (LLM). La familia Nemotron-4 340B incluye tres modelos principales: Base,

Scroll al inicio