Nuevo Modelo SAM Revoluciona la Edición de Audio

En un avance tecnológico significativo, se presenta SAM Audio, un modelo de inteligencia artificial de última generación diseñado para segmentar sonidos, proporcionando una capacidad única que podría revolucionar el mundo del audio y la edición de video. Este innovador sistema permite a los usuarios aislar audio de mezclas complejas con solo realizar clics o escribir instrucciones breves, abordando así una de las limitaciones más comunes en la edición de sonido profesional.

Imagínese grabar un concierto de su banda favorita y poder aislar la guitarra o las voces con un simple clic, o eliminar el ruido del tráfico de un vídeo grabado al aire libre. La magia tras esta tecnología reside en su capacidad para separar cualquier sonido usando indicaciones textuales, visuales y temporales, una innovación que democratiza el acceso a herramientas de edición de audio de calidad profesional.

Hasta ahora, el panorama de la segmentación y edición de audio era un campo fragmentado, compuesto por herramientas destinadas a usos específicos. SAM Audio unifica estas necesidades al ser el primer modelo que integra distintos usos de manera intuitiva, reflejando cómo la gente interactúa naturalmente con los sonidos. Entre sus capacidades, destacan tres tipos de indicaciones: las instrucciones textuales, que permiten al usuario extraer sonidos específicos al escribir términos como «ladrido de perro» o «voz cantora»; las instrucciones visuales, donde se puede hacer clic sobre una persona u objeto en un vídeo para aislar su audio; y las segmentaciones temporales, un método pionero en la industria que permite marcar segmentos de tiempo en los que ocurre el audio objetivo.

Con estas herramientas, tanto conjuntos de audio como escenarios del mundo real son manejados con precisión y sofisticación. Las aplicaciones de SAM Audio son diversas, abarcando desde la música y el podcasting hasta la televisión, el cine, la investigación científica y la accesibilidad, impactando de manera potencial y positiva a una amplia gama de industrias.

SAM Audio está disponible para ser probado por los usuarios en el Segment Anything Playground, una plataforma diseñada para experimentar con los últimos modelos de la colección Segment Anything. Desde hoy, las personas pueden seleccionar de una colección de activos de audio y video o cargar los suyos propios para explorar las capacidades de este modelo de IA, que también está disponible para su descarga.

La inclusión de SAM Audio en la colección Segment Anything representa un paso adelante en la comodidad y accesibilidad de edición de audio, cimentando su posición como el modelo más competitivo y completo en la separación de audio del mercado.
Fuente: Zona de prensa de Meta.

Scroll al inicio