Apps y webs IA

olmOCR: un toolkit de código abierto para procesar millones de PDFs con modelos de lenguaje

El Allen Institute for AI lanza olmOCR, una potente herramienta que transforma documentos PDF complejos en datos estructurados para entrenamiento de modelos LLM, integrando OCR, filtrado, visualización y procesamiento masivo en clúster. El procesamiento de documentos en formato PDF sigue siendo uno de los mayores desafíos en la creación de datasets para modelos de lenguaje. olmOCR, desarrollado por el equipo

Dia: el modelo TTS open source para generar diálogos ultrarrealistas en una sola pasada

Dia es un modelo de texto a voz (TTS) desarrollado por Nari Labs con 1.600 millones de parámetros, diseñado específicamente para generar diálogos humanos con un realismo excepcional. A diferencia de los modelos tradicionales que generan voz frase a frase o requieren múltiples pasos, Dia produce conversaciones completas en una única inferencia, incluyendo expresiones no verbales como risas o suspiros,

Suna: el agente de inteligencia artificial open source que actúa por ti

La herramienta de código abierto que automatiza tareas complejas como buscar información, gestionar archivos o desplegar sitios web, todo desde una conversación. En plena era de la inteligencia artificial generativa, donde ChatGPT, Claude y Gemini lideran los focos mediáticos, un nuevo actor irrumpe con una propuesta radicalmente distinta: Suna, un agente de IA generalista, autoalojado y 100 % open source,

Arquitecturas agénticas: así se construyen los sistemas inteligentes del futuro

Los agentes de IA no son magia. Son software. Y como cualquier sistema software serio, necesitan arquitectura. Si estás desarrollando copilotos, asistentes autónomos, analistas automáticos o flujos de trabajo asincrónicos, no basta con un buen prompt: necesitas una arquitectura agéntica sólida. Redacción IA & Software | Mayo 2025 En la era de la Inteligencia Artificial generativa, el enfoque basado en

Chainlit: crea aplicaciones conversacionales en Python en minutos

Chainlit es una herramienta de código abierto que permite construir interfaces conversacionales basadas en LLMs de forma rápida, personalizable y lista para producción, todo desde Python. En la creciente ola de herramientas para desarrolladores de aplicaciones de Inteligencia Artificial generativa, Chainlit destaca por su simplicidad, flexibilidad y enfoque Pythonic. Creada por Literal AI, esta herramienta permite desarrollar y probar aplicaciones

JetBrains libera Mellum como código abierto: un modelo de IA especializado en programación ya disponible en Hugging Face

El nuevo modelo de lenguaje de JetBrains se enfoca en la completación de código, con soporte multilenguaje y una apuesta clara por la especialización y la eficiencia JetBrains, la reconocida compañía detrás de populares entornos de desarrollo como IntelliJ IDEA, PyCharm o WebStorm, ha dado un paso relevante en el mundo de la inteligencia artificial con la liberación de Mellum,

Las mejores alternativas libres y de código abierto a Siri en Linux

Siri, el asistente por voz desarrollado por Apple, es una herramienta ampliamente conocida dentro del ecosistema de dispositivos de la marca. Ofrece funciones de búsqueda, control por voz, integración con apps y automatización, pero también está totalmente cerrado: no puede utilizarse fuera de los productos de Apple ni está disponible para sistemas operativos como Linux. Para quienes valoran la libertad

DeepSeek-Prover-V2: Inteligencia artificial para resolver teoremas con Lean 4

DeepSeek-Prover-V2 es el último avance de la iniciativa open source DeepSeek-AI, enfocado en el razonamiento matemático formal. Este modelo de lenguaje de gran tamaño (LLM), entrenado con técnicas de refuerzo y descomposición de subobjetivos, promete transformar la resolución automatizada de teoremas mediante código en Lean 4, el lenguaje de pruebas formales que gana tracción en entornos académicos y matemáticos. Una

Apple desarrolla una nueva versión de Xcode con la IA de Claude, el modelo de Anthropic

La compañía de Cupertino apuesta por la inteligencia artificial generativa para revolucionar la programación con ayuda de Anthropic. Apple estaría preparando una profunda transformación en su entorno de desarrollo Xcode mediante la integración de Claude, el modelo de inteligencia artificial creado por Anthropic. Según información revelada por Mark Gurman (Bloomberg), ambas compañías están colaborando en el desarrollo de una nueva

Speakr: la alternativa autoalojada para transcripción, resumen y consulta de audios

Una solución open source basada en Flask y Vue que permite gestionar grabaciones de voz, obtener transcripciones precisas, generar resúmenes con IA y consultar su contenido mediante chat, todo desde tu propio servidor. La proliferación de herramientas de transcripción asistida por inteligencia artificial ha cambiado drásticamente la forma en que gestionamos reuniones, entrevistas y notas de voz. Sin embargo, muchas

Scroll al inicio