El Futuro del Progreso: Inteligencia Artificial de Código Abierto

En los primeros días de la computación de alto rendimiento, las principales empresas tecnológicas invirtieron considerablemente en el desarrollo de sus propias versiones cerradas de Unix. En ese momento, parecía imposible que otro enfoque pudiera desarrollar un software tan avanzado. Sin embargo, con el tiempo, Linux de código abierto ganó popularidad, inicialmente porque permitía a los desarrolladores modificar su código a su antojo y era más asequible. Con el tiempo, Linux se volvió más avanzado, más seguro y tuvo un ecosistema más amplio que soportaba más capacidades que cualquier Unix cerrado. Hoy en día, Linux es el estándar de la industria para la computación en la nube y los sistemas operativos que ejecutan la mayoría de los dispositivos móviles.

Creo que la inteligencia artificial (IA) se desarrollará de manera similar. Hoy en día, varias empresas tecnológicas están desarrollando modelos cerrados líderes. Pero el código abierto está cerrando rápidamente esa brecha. El año pasado, Llama 2 solo era comparable a una generación de modelos más antigua. Este año, Llama 3 es competitivo con los modelos más avanzados y está liderando en algunas áreas. A partir del próximo año, esperamos que los futuros modelos de Llama se conviertan en los más avanzados de la industria. Sin embargo, incluso antes de eso, Llama ya lidera en términos de apertura, capacidad de modificación y eficiencia de costos.

Hoy estamos dando los siguientes pasos para que la IA de código abierto se convierta en el estándar de la industria. Estamos lanzando Llama 3.1 405B, el primer modelo de IA de código abierto de nivel de frontera, así como los nuevos y mejorados modelos Llama 3.1 70B y 8B. Además de tener una relación costo/rendimiento significativamente mejor en comparación con los modelos cerrados, el hecho de que el modelo 405B sea abierto lo convierte en la mejor opción para ajustar y destilar modelos más pequeños.

Más allá de lanzar estos modelos, estamos trabajando con diversas empresas para hacer crecer el ecosistema en general. Amazon, Databricks y NVIDIA están lanzando suites completas de servicios para apoyar a los desarrolladores en el ajuste y la destilación de sus propios modelos. Innovadores como Groq han construido servicios de inferencia de baja latencia y bajo costo para todos los nuevos modelos. Los modelos estarán disponibles en todas las nubes principales, incluidas AWS, Azure, Google, Oracle y más. Empresas como Scale.AI, Dell, Deloitte y otras están listas para ayudar a las empresas a adoptar Llama y entrenar modelos personalizados con sus propios datos. A medida que la comunidad crezca y más empresas desarrollen nuevos servicios, colectivamente podremos hacer de Llama el estándar de la industria y llevar los beneficios de la IA a todos.

Meta está comprometida con la IA de código abierto. Destacaré por qué creo que el código abierto es la mejor pila de desarrollo para usted, por qué la liberación de código abierto de Llama es buena para Meta y por qué la IA de código abierto es buena para el mundo y, por lo tanto, una plataforma que estará presente a largo plazo.

Cuando hablo con desarrolladores, CEOs y funcionarios gubernamentales en todo el mundo, generalmente escucho varios temas:

– Necesitamos entrenar, ajustar y destilar nuestros propios modelos. Cada organización tiene diferentes necesidades que se satisfacen mejor con modelos de diferentes tamaños entrenados o ajustados con sus datos específicos.
– Necesitamos controlar nuestro propio destino y no depender de un proveedor cerrado. Muchas organizaciones no quieren depender de modelos que no pueden operar y controlar ellas mismas.
– Necesitamos proteger nuestros datos. Muchas organizaciones manejan datos sensibles que necesitan asegurar y no pueden enviar a modelos cerrados a través de APIs en la nube.
– Necesitamos un modelo que sea eficiente y asequible de operar. Los desarrolladores pueden ejecutar inferencias en Llama 3.1 405B en su propia infraestructura a aproximadamente el 50% del costo de usar modelos cerrados como GPT-4o.
– Queremos invertir en el ecosistema que va a ser el estándar a largo plazo. Mucha gente ve que el código abierto avanza a un ritmo más rápido que los modelos cerrados y quiere construir sus sistemas sobre la arquitectura que les dará la mayor ventaja a largo plazo.

El modelo de negocio de Meta se centra en construir las mejores experiencias y servicios para la gente. Para hacerlo, debemos asegurarnos de tener siempre acceso a la mejor tecnología y no quedar bloqueados en el ecosistema cerrado de un competidor.

Una de mis experiencias formativas ha sido construir nuestros servicios limitados por lo que Apple nos permite desarrollar en sus plataformas. Entre la forma en que gravan a los desarrolladores y las reglas arbitrarias que aplican, está claro que Meta y muchas otras empresas podrían desarrollar servicios mucho mejores si pudiéramos construir las mejores versiones de nuestros productos y los competidores no pudieran restringir lo que podemos desarrollar. Por razones filosóficas, creo firmemente en construir ecosistemas abiertos en IA y AR/VR para la próxima generación de computación.

La IA tiene más potencial que cualquier otra tecnología moderna para aumentar la productividad humana, la creatividad y la calidad de vida, y para acelerar el crecimiento económico mientras desbloquea avances en la investigación médica y científica. El código abierto garantizará que más personas en todo el mundo tengan acceso a los beneficios y oportunidades de la IA, que el poder no se concentre en manos de unos pocos y que la tecnología pueda desplegarse de manera más equitativa y segura en la sociedad.

Muchos se preocupan por la seguridad de los modelos de IA de código abierto. Mi opinión es que serán más seguros que las alternativas. Los gobiernos concluirán que el código abierto promueve un mundo más próspero y seguro.

Nuestro proceso de seguridad incluye pruebas rigurosas para evaluar si nuestros modelos son capaces de causar daños significativos, con el objetivo de mitigar los riesgos antes del lanzamiento. Desde que los modelos son abiertos, cualquiera puede probarlos por sí mismo. Debemos recordar que estos modelos se entrenan con información ya disponible en internet, por lo que el punto de partida al considerar daños debe ser si un modelo puede facilitar más daños que la información que puede obtenerse rápidamente de Google u otros resultados de búsqueda.

En el futuro, actores malintencionados podrían usar la inteligencia de los modelos de IA para fabricar nuevos daños a partir de la información disponible en internet. En ese momento, el equilibrio de poder será crucial para la seguridad de la IA. Vivir en un mundo donde la IA está ampliamente desplegada permitirá que actores más grandes puedan controlar a actores malintencionados menores. Si todos tienen acceso a generaciones similares de modelos, entonces los gobiernos e instituciones con más recursos de computación podrán controlar a los actores malintencionados con menos recursos.

La próxima pregunta es cómo los EE.UU. y las naciones democráticas deberían manejar la amenaza de estados con grandes recursos como China. La ventaja de Estados Unidos es la innovación descentralizada y abierta. Creo que nuestra mejor estrategia es construir un ecosistema abierto y robusto y trabajar estrechamente con nuestro gobierno y aliados para asegurar que puedan aprovechar mejor los últimos avances.

La conclusión es que la IA de código abierto representa la mejor oportunidad del mundo para aprovechar esta tecnología y crear la mayor oportunidad económica y seguridad para todos.

Con los modelos Llama anteriores, Meta los desarrolló para nosotros y luego los lanzó, pero no nos enfocamos mucho en construir un ecosistema más amplio. Estamos tomando un enfoque diferente con este lanzamiento. Estamos formando equipos internamente para permitir que tantos desarrolladores y socios como sea posible usen Llama, y estamos construyendo activamente asociaciones para que más empresas en el ecosistema puedan ofrecer funcionalidades únicas a sus clientes.

Creo que el lanzamiento de Llama 3.1 será un punto de inflexión en la industria donde la mayoría de los desarrolladores comenzarán a usar principalmente el código abierto, y espero que ese enfoque solo crezca a partir de aquí. Los invitamos a unirse a nosotros en este viaje para llevar los beneficios de la IA a todos en el mundo. Puede acceder a los modelos ahora en llama.meta.com.

MZ
Fuente: Zona de prensa de Meta.

Scroll al inicio