Una solución open source basada en Flask y Vue que permite gestionar grabaciones de voz, obtener transcripciones precisas, generar resúmenes con IA y consultar su contenido mediante chat, todo desde tu propio servidor.
La proliferación de herramientas de transcripción asistida por inteligencia artificial ha cambiado drásticamente la forma en que gestionamos reuniones, entrevistas y notas de voz. Sin embargo, muchas de estas soluciones dependen de servicios en la nube que implican ceder datos sensibles a terceros. Aquí es donde entra Speakr, una herramienta autoalojada y de código abierto que permite a cualquier organización o usuario gestionar su propio sistema privado de transcripción y resumen de audios.
¿Qué es Speakr?
Speakr es una aplicación web desarrollada con Python (Flask) en el backend y Vue.js en el frontend. Su objetivo es sencillo: facilitar la subida de archivos de audio, transcribirlos usando modelos compatibles con la API de OpenAI (como Whisper, incluso versiones autoalojadas), generar títulos y resúmenes, y permitir al usuario interactuar con el contenido a través de una interfaz de chat basada en modelos de lenguaje (LLM).
Todo esto se gestiona desde una interfaz moderna y segura, con almacenamiento local (SQLite + archivos en disco) y soporte multiusuario.
Comparativa con otras soluciones
Característica | Speakr (Self-Hosted) | Otter.ai (Cloud) | Whisper API (OpenAI) |
---|---|---|---|
Alojamiento | Local / propio servidor | Nube (Otter) | Nube (OpenAI) |
Privacidad de datos | Total control local | Depende de la política | Datos viajan a OpenAI |
Transcripción con Whisper | Compatible (local/remoto) | No | Sí |
Resumen de contenido | Sí (OpenRouter o local) | Sí | No |
Chat con transcripción | Sí | Parcial (solo búsqueda) | No |
Interfaz gráfica (UI) | Web moderna + Dark Mode | Aplicación web / móvil | No |
Multiusuario | Sí, con gestión de roles | Limitado | No |
Licencia | AGPLv3 / Comercial opcional | Propietaria | Propietaria |
Costo | Gratis (autoalojado) | Suscripción mensual | Pago por minuto |
Ventajas clave para sysadmins y entornos empresariales
- Autoalojamiento completo: Ideal para organizaciones que requieren cumplimiento normativo o privacidad avanzada.
- Modular y extensible: El uso de APIs compatibles permite personalizar los modelos LLM y STT utilizados.
- Interacción contextual: Los usuarios pueden consultar el contenido transcrito con preguntas directas, como “¿cuándo se mencionó el presupuesto?”.
- Admin dashboard: Herramientas para gestionar usuarios, estadísticas y grabaciones desde un panel dedicado.
- Instalación automatizada en Linux: Incluye script setup.sh para entornos systemd, facilitando despliegue en servidores on-premise o VPS.
Arquitectura y requisitos
Stack tecnológico:
- Backend: Python 3.8+ con Flask, Gunicorn, SQLAlchemy
- Frontend: Vue.js, Tailwind CSS, Jinja2
- DB por defecto: SQLite (puede sustituirse)
- API IA: Compatible con OpenRouter, OpenAI o instancias locales
- Almacenamiento: Local, bajo estructura
/uploads
yinstance/transcriptions.db
Requisitos:
- Linux con acceso sudo
- Python + venv
- API keys para endpoints de transcripción y LLM
- 2 GB RAM o más recomendados
Casos de uso
- Equipos legales que deseen conservar grabaciones de audiencias o reuniones con total confidencialidad.
- Docencia e investigación para indexar clases, conferencias o entrevistas.
- Nómadas digitales y periodistas que prefieren control total de sus fuentes y materiales.
- Empresas que busquen una solución interna de gestión de audios que no dependa de servicios externos.
Conclusión
Speakr representa una solución potente, flexible y respetuosa con la privacidad en un entorno dominado por plataformas centralizadas. Su diseño modular, su enfoque open source y su compatibilidad con tecnologías como Whisper y OpenRouter lo convierten en una opción ideal para administradores de sistemas, desarrolladores y equipos que buscan una alternativa real y profesional a las soluciones comerciales en la nube.
Si lo que buscas es mantener el control total de tus datos sin renunciar a las ventajas de la inteligencia artificial, Speakr es una de las mejores opciones disponibles hoy en día en el ecosistema self-hosted.