Abriendo la Próxima Frontera en la IA

Elena Digital López

Durante la reciente cumbre de NYC AIAI, Joseph Nelson, CEO y cofundador de Roboflow, puso de relieve un aspecto crucial en el campo de la inteligencia artificial: la visión. En un contexto donde los avances en modelos de lenguaje son el foco de atención, Nelson destacó que la comprensión visual es igualmente vital para construir sistemas inteligentes capaces de operar en el mundo real.

Nelson demostró cómo la IA visual está transformando diversas industrias, desde la reactivación instantánea en eventos deportivos como Wimbledon hasta el control de calidad en fábricas de vehículos eléctricos. Con una comunidad de un millón de desarrolladores, Roboflow está impulsando la creación de aplicaciones de IA visual tanto a nivel de producción como en proyectos de código abierto, señalando una implementación a gran escala de la comprensión visual.

En su presentación, Nelson abordó tres temas principales sobre la IA visual: los casos extremos de visión por computadora que limitan la comprensión del mundo real; el futuro de los modelos visuales, donde se debate si predominará un único modelo o una colección de modelos más pequeños y especializados; y la importancia de la IA visual en tiempo real al borde, crucial para una implementación efectiva.

Nelson señaló que la visión es un sentido primario en los seres humanos, y que dotar a los sistemas de software de percepciones visuales permite responder preguntas concretas, como la cantidad de personas en un espacio o si un producto está correctamente fabricado.

Roboflow se ha consolidado como un actor clave al ofrecer herramientas y plataformas que facilitan la construcción y despliegue de IA visual. Nelson reveló que más de la mitad de las empresas Fortune 100 utilizan Roboflow, especialmente en sectores dependientes de la precisión en el mundo físico.

Con una mirada hacia el futuro, Nelson destacó el compromiso de Roboflow con el código abierto, esencial para avanzar en la comprensión visual. La empresa proporciona el paquete Supervision, que ayuda a los desarrolladores a integrar detecciones en sistemas más amplios, y cuenta con una serie de herramientas de código abierto para simplificar el proceso de la IA visual.

En términos de implementación, Roboflow apoya a grandes empresas como Rivian, que ha mejorado la calidad del producto con sus modelos, y ha hecho avances significativos en aplicaciones como los quioscos de autoescaneo de Walmart, que utilizan cámaras para detectar productos en los carritos.

Nelson finalizó su intervención subrayando que para cumplir su promesa en el mundo real, la IA debe ser capaz de ver y comprender ese mundo. La comprensión visual es una línea de acción crítica en el desarrollo de la inteligencia visual, donde los desarrolladores juegan un papel esencial en la evolución de esta tecnología.

Scroll al inicio