En la última década, hemos presenciado avances sorprendentes en el campo de la Inteligencia Artificial (IA), muchos de ellos liderados por Google. El innovador trabajo de Google en modelos fundamentales se ha convertido en el pilar de la industria y los productos impulsados por IA que miles de millones de personas utilizan diariamente. A medida que avanzamos de manera responsable en estas tecnologías, vemos un gran potencial para su aplicación en áreas tan diversas como la atención sanitaria y la creatividad humana.
Con el paso de los años, hemos aprendido que al escalar las redes neuronales, surgen capacidades sorprendentes y fascinantes. Sin embargo, nuestra investigación ha revelado que no es tan sencillo como pensar que «más grande es mejor». La creatividad en la investigación es fundamental para construir grandes modelos. Los avances más recientes en la arquitectura y el entrenamiento de modelos nos han enseñado cómo aprovechar la multimodalidad, la importancia de incluir la retroalimentación humana en el proceso y cómo construir modelos más eficientes que nunca. Estos son componentes fundamentales mientras seguimos avanzando en el estado del arte en IA y desarrollando modelos que aporten beneficios reales a las personas en su vida cotidiana.
Hoy, nos complace presentar PaLM 2, nuestra próxima generación de modelos de lenguaje. PaLM 2 es un modelo de lenguaje de vanguardia con capacidades mejoradas de multilingüismo, razonamiento y codificación.
PaLM 2 ha sido entrenado de manera intensiva en textos multilingües, abarcando más de 100 idiomas. Esto ha mejorado de manera significativa su habilidad para entender, generar y traducir textos matizados, incluyendo modismos, poemas y acertijos, en una amplia variedad de idiomas, un problema notoriamente difícil de resolver. Además, PaLM 2 ha demostrado superar los exámenes avanzados de competencia lingüística a nivel de «maestría».
Además de su multilingüismo, el conjunto de datos amplio y diverso de PaLM 2, que incluye artículos científicos y páginas web con expresiones matemáticas, le permite mostrar mejoras en lógica, razonamiento de sentido común y matemáticas.
En el ámbito de la codificación, PaLM 2 fue pre-entrenado en una gran cantidad de conjuntos de datos de código fuente de acceso público. Esto significa que es capaz de trabajar con lenguajes de programación populares como Python y JavaScript, pero también puede generar código especializado en lenguajes como Prolog, Fortran y Verilog.
Pero PaLM 2 no es solo más capaz, sino también más rápido y más eficiente que los modelos anteriores. Además, viene en una variedad de tamaños para adaptarse a una amplia gama de casos de uso. PaLM 2 estará disponible en cuatro tamaños, desde el más pequeño al más grande: Gecko, Otter, Bison y Unicorn. Gecko es tan ligero que puede funcionar en dispositivos móviles y es lo suficientemente rápido para aplicaciones interactivas, incluso sin conexión a Internet.
Durante el evento I/O de hoy, se anunciaron más de 25 nuevos productos y características impulsados por PaLM 2. Esto significa que PaLM 2 está llevando las capacidades más avanzadas de IA directamente a los productos de Google y a las personas, incluyendo consumidores, desarrolladores y empresas de todos los tamaños alrededor del mundo. Algunos ejemplos incluyen:
Las capacidades multilingües mejoradas de PaLM 2 están permitiendo a Google expandir Bard a nuevos idiomas, comenzando hoy. Además, está potenciando la reciente actualización de codificación anunciada por la empresa.
Las características de Workspace, diseñadas para ayudar a los usuarios a escribir en Gmail y Google Docs, y a organizarse en Google Sheets, están aprovechando las capacidades de PaLM 2 a una velocidad que ayuda a las personas a trabajar de manera más eficiente.
Med-PaLM 2, entrenado por los equipos de investigación en salud de Google, puede responder preguntas y resumir información de una variedad de textos médicos densos. Logra resultados de vanguardia en competencia médica y fue el primer modelo de lenguaje grande en rendir al nivel de «experto» en preguntas al estilo del Examen de Licencia Médica de EE. UU. Google está añadiendo capacidades multimodales a Med-PaLM 2 para sintetizar información como radiografías y mamografías, con el objetivo de mejorar eventualmente los resultados de los pacientes. Med-PaLM 2 se abrirá a un pequeño grupo de clientes de Cloud para obtener comentarios a finales de este verano para identificar casos de uso seguros y útiles.
Sec-PaLM, una versión especializada de PaLM 2 entrenada en casos de uso de seguridad, es un potencial salto para el análisis de ciberseguridad. Disponible a través de Google Cloud, utiliza IA para ayudar a analizar y explicar el comportamiento de scripts potencialmente maliciosos, y detectar mejor qué scripts son realmente amenazas para las personas y las organizaciones en un tiempo sin precedentes.
Desde marzo, Google ha estado mostrando la API de PaLM a un pequeño grupo de desarrolladores. A partir de hoy, los desarrolladores pueden inscribirse para usar el modelo PaLM 2, o los clientes pueden usar el modelo en Vertex AI con privacidad, seguridad y gobernanza a nivel empresarial. PaLM 2 también está impulsando Duet AI para Google Cloud, un colaborador de IA generativo diseñado para ayudar a los usuarios a aprender, construir y operar más rápido que nunca.
Mirando hacia el futuro de la IA
PaLM 2 muestra el impacto de modelos altamente capaces de diversos tamaños y velocidades, y cómo los modelos de IA versátiles pueden proporcionar beneficios reales para todos. Al mismo tiempo que se comprometen a lanzar las herramientas de IA más útiles y responsables hoy, en Google también están trabajando para crear los mejores modelos base para la empresa.
Los equipos de investigación de Brain y DeepMind de Google han logrado muchos hitos en la IA durante la última década, y ahora se están uniendo en una sola unidad para continuar acelerando su progreso. Google DeepMind, respaldado por los recursos computacionales de Google, no solo aportará nuevas capacidades increíbles a los productos que las personas usan todos los días, sino que también abrirá el camino de manera responsable para la próxima generación de modelos de IA.
Ya están trabajando en Gemini, el próximo modelo que se está creando desde cero para ser multimodal, altamente eficiente en la integración de herramientas y API, y diseñado para permitir futuras innovaciones, como la memoria y la planificación. Gemini aún se encuentra en fase de entrenamiento, pero ya está exhibiendo capacidades multimodales nunca antes vistas en modelos anteriores. Una vez que esté ajustado y rigurosamente probado para la seguridad, Gemini estará disponible en varios tamaños y capacidades, al igual que PaLM 2, para asegurar que pueda ser desplegado en diferentes productos, aplicaciones y dispositivos para el beneficio de todos.
Este avance subraya el compromiso de Google con la innovación y la mejora continua en el campo de la inteligencia artificial. Al continuar desarrollando y refinando sus modelos, Google se esfuerza por mantenerse a la vanguardia de la tecnología de IA, brindando soluciones más inteligentes y eficientes para todos. A medida que el mundo se vuelve cada vez más digital y conectado, la contribución de Google a la IA seguirá desempeñando un papel crucial en la configuración de nuestro futuro tecnológico.