Machine Learning

FreeLLM: Modelos de lenguaje de código abierto para evaluar la censura y sesgos

Un nuevo proyecto personal en el ámbito de los modelos de lenguaje está generando expectación en la comunidad de inteligencia artificial. FreeLLM, iniciativa completamente abierta y desarrollada por un investigador independiente, se propone desafiar las limitaciones tradicionales de los modelos de lenguaje, centrándose en la evaluación de censura y sesgos. El fundador de FreeLLM (Twitter X), que prefiere mantener su

Hugging Face y Google Cloud lanzan contenedores de aprendizaje para transformar el desarrollo de IA

En un avance significativo para el desarrollo de inteligencia artificial, Hugging Face y Google Cloud han anunciado una colaboración estratégica que promete revolucionar la forma en que se construyen modelos de IA en la nube. La asociación ha dado lugar al lanzamiento de una nueva colección de Contenedores de Aprendizaje Profundo (DLCs) que ofrecen entornos preconfigurados y optimizados para trabajar

Nvidia y Mistral lanzan un modelo de lenguaje compacto para portátiles: El Mistral-NeMo-Minitron 8B

En un avance significativo para la inteligencia artificial accesible desde dispositivos personales, Nvidia y Mistral han presentado el Mistral-NeMo-Minitron 8B, un modelo de lenguaje compacto diseñado para funcionar eficientemente en laptops y PCs. Esta innovación busca resolver el desafío de la sobrecarga de computación al mismo tiempo que proporciona una alta precisión en las tareas de procesamiento del lenguaje. Optimización

Microsoft lanza Phi-3.5-MoE: Un modelo de IA compacto que supera a los más grandes en desempeño

Microsoft ha presentado su último avance en inteligencia artificial, el modelo Phi-3.5-MoE, que promete revolucionar el campo de la IA al combinar un diseño compacto con una capacidad de razonamiento comparable a modelos mucho más grandes. Esta innovadora tecnología no solo destaca por su eficiencia, sino también por su capacidad para superar a competidores conocidos en pruebas de rendimiento. Un

OpenAI permite a empresas personalizar GPT-4o con sus propios datos

OpenAI ha dado un paso significativo hacia la personalización de su modelo de lenguaje más avanzado, GPT-4o, permitiendo ahora a los clientes empresariales adaptar el modelo a sus necesidades específicas utilizando sus propios datos. Esta nueva capacidad de ajuste fino está diseñada para ayudar a las empresas a desarrollar modelos que puedan realizar tareas concretas y ajustarse a casos de

Nous Research lanza Hermes 3: El modelo de IA de código abierto más avanzado hasta la fecha

Nous Research ha presentado Hermes 3, su último modelo de inteligencia artificial de código abierto que promete revolucionar el campo con sus mejoras significativas en el manejo de tareas de rol, funciones agenciales, llamadas a funciones, conversaciones multivuelta y coherencia en contextos largos. Hermes 3, disponible en tres versiones (8B, 70B y 405B), destaca especialmente con el modelo de 405B

Grok-2 y Grok-2 Mini: xAI quiere superar a OpenAI

La última novedad en el ámbito de los modelos de lenguaje es la beta de Grok-2, presentada por xAI. Este lanzamiento marca un avance significativo respecto a su predecesor, Grok-1.5, y introduce dos versiones del nuevo modelo: Grok-2 y Grok-2 Mini. La versión beta de estos modelos ya está disponible para los usuarios de la plataforma 𝕏, y se espera

¿Qué es el LSLM?

El LSLM es un sistema de inteligencia artificial diseñado para manejar simultáneamente la entrada y salida de audio en tiempo real. A diferencia de los modelos de lenguaje tradicionales, que operan en un modo de conversación por turnos, el LSLM permite un flujo de comunicación continuo y bidireccional. Esto se traduce en conversaciones más naturales, donde la IA puede interrumpir,

Desarrollan un Modelo de Lenguaje que permite conversaciones en tiempo real

Investigadores en inteligencia artificial han desarrollado un innovador modelo de lenguaje, el Listening-While-Speaking Language Model (LSLM), que puede escuchar y hablar simultáneamente, avanzando significativamente en las conversaciones interactivas basadas en voz en tiempo real. El modelo, denominado Listening-while-Speaking Language Model (LSLM), habilita el modelado full-duplex en modelos interactivos de lenguaje hablado. Este sistema utiliza un decodificador basado en tokens únicamente

Google lanza tres nuevos modelos de IA seguros y abiertos

Google ha presentado tres nuevos modelos de inteligencia artificial: Gemma 2 2B, ShieldGemma y Gemma Scope, los cuales, a diferencia de los modelos «cerrados» Gemini de Google, son «abiertos», proporcionando a los desarrolladores acceso a su código fuente. Aunque están diseñados para diferentes aplicaciones, todos comparten un enfoque común en la seguridad y forman parte de la familia de modelos

Scroll al inicio