Machine Learning

¿Qué es el LSLM?

El LSLM es un sistema de inteligencia artificial diseñado para manejar simultáneamente la entrada y salida de audio en tiempo real. A diferencia de los modelos de lenguaje tradicionales, que operan en un modo de conversación por turnos, el LSLM permite un flujo de comunicación continuo y bidireccional. Esto se traduce en conversaciones más naturales, donde la IA puede interrumpir,

Desarrollan un Modelo de Lenguaje que permite conversaciones en tiempo real

Investigadores en inteligencia artificial han desarrollado un innovador modelo de lenguaje, el Listening-While-Speaking Language Model (LSLM), que puede escuchar y hablar simultáneamente, avanzando significativamente en las conversaciones interactivas basadas en voz en tiempo real. El modelo, denominado Listening-while-Speaking Language Model (LSLM), habilita el modelado full-duplex en modelos interactivos de lenguaje hablado. Este sistema utiliza un decodificador basado en tokens únicamente

Google lanza tres nuevos modelos de IA seguros y abiertos

Google ha presentado tres nuevos modelos de inteligencia artificial: Gemma 2 2B, ShieldGemma y Gemma Scope, los cuales, a diferencia de los modelos «cerrados» Gemini de Google, son «abiertos», proporcionando a los desarrolladores acceso a su código fuente. Aunque están diseñados para diferentes aplicaciones, todos comparten un enfoque común en la seguridad y forman parte de la familia de modelos

Meta lanza Llama 3.1: Su modelo de IA más capaz hasta la fecha

Meta continúa su compromiso con la accesibilidad abierta en inteligencia artificial con el lanzamiento de su nuevo modelo, Llama 3.1. Este modelo amplía la longitud de contexto a 128K, añade soporte en ocho idiomas y presenta Llama 3.1 405B, el primer modelo de IA de código abierto a nivel de frontera. Innovaciones de Llama 3.1 Llama 3.1 405B destaca por

Nvidia lanza modelos de IA de código abierto para revolucionar la generación de datos sintéticos

Nvidia ha presentado Nemotron-4 340B, una familia de modelos de lenguaje de código abierto diseñados para generar datos sintéticos de alta calidad y crear aplicaciones de inteligencia artificial (IA) poderosas en diversas industrias. Estos modelos prometen transformar la forma en que se entrenan los modelos de lenguaje de gran escala (LLM). La familia Nemotron-4 340B incluye tres modelos principales: Base,

DeepSeek Coder V2: El modelo de código open-source que supera a GPT-4 Turbo

La startup china de inteligencia artificial DeepSeek ha anunciado el lanzamiento de DeepSeek Coder V2, un modelo de lenguaje de código open-source que ha superado a los modelos cerrados más avanzados, incluyendo a GPT-4 Turbo, Claude 3 Opus y Gemini 1.5 Pro. DeepSeek, que ya había llamado la atención con un competidor de ChatGPT entrenado con 2 billones de tokens

Comparativa de modelos GPT-4, GPT-4 turbo y GPT-4o

GPT-4o es el último modelo lanzado por OpenAI y con este se amplia su gama de modelos de inteligencia artificial dentro de la serie GPT-4. Cada uno está diseñado para diferentes necesidades y tareas específicas. Si te preguntas cuál es el adecuado para ti, aquí te lo explicamos de manera clara y sencilla. ¿Qué es GPT-4? GPT-4 es el modelo

Un algoritmo revolucionario permite a un modelo de IA pequeño igualar a GPT-4 en matemáticas

Investigadores del Laboratorio de IA de Shanghai han desarrollado un innovador algoritmo denominado MCT Self-Refine, que ha permitido a un modelo de inteligencia artificial relativamente pequeño, con solo 8 mil millones de parámetros, alcanzar el rendimiento de GPT-4 en problemas matemáticos complejos. Un Avance Sorprendente en IA El algoritmo MCT Self-Refine combina un modelo LLaMa de 8B parámetros con la

IA entrenada con fotos de menores sin permiso de los padres: Un problema real y grave

Un reciente informe de Human Rights Watch ha puesto de manifiesto una alarmante situación: las imágenes de niños menores están siendo utilizadas para entrenar modelos de inteligencia artificial sin el permiso de sus padres. Esta práctica plantea graves preocupaciones sobre la privacidad y la ética en el uso de la tecnología, subrayando la necesidad de ser extremadamente cautelosos al compartir

La IA muestra destrezas en la selección de acciones, según un estudio

Un reciente estudio de la Universidad de Chicago ha revelado que los modelos de lenguaje de gran escala (LLM) como GPT-4 pueden realizar análisis de estados financieros y superar a los analistas humanos en la predicción de la dirección de las ganancias futuras. Este estudio no solo demuestra que la IA está a punto de alterar drásticamente la industria financiera,

Scroll al inicio