PaLM 2, el nuevo LLM de Google con Med-PaLM 2 y Sec-PaLM

Google presentó PaLM 2 el 10 de mayo de 2023 en su conferencia Google I/O, como la nueva generación de modelo de lenguaje grande (LLM) que sustituye al PaLM original. El modelo refina tres capacidades concretas: multilingüismo con cobertura de más de 100 idiomas, razonamiento lógico y matemático, y generación de código en lenguajes tanto populares como especializados. A diferencia de las presentaciones anteriores, Google no apuesta esta vez por hacer el modelo más grande, sino más útil y eficiente en distintos contextos de uso.

Cuatro tamaños: desde móvil hasta servidor

PaLM 2 llega en cuatro variantes de tamaño: Gecko, Otter, Bison y Unicorn, de menor a mayor. El más relevante desde el punto de vista de distribución es Gecko: es lo suficientemente ligero para ejecutarse en dispositivos móviles y funciona sin conexión a Internet, algo que abre la puerta a aplicaciones de IA en entornos sin conectividad fiable. Bison y Unicorn están orientados a cargas de trabajo en servidor y casos de uso empresarial.

Google ha formado a PaLM 2 en un conjunto de datos que incluye textos en más de 100 idiomas, expresiones matemáticas y artículos científicos. Los resultados reportados indican que supera los exámenes de competencia lingüística avanzada (nivel de maestría) en varios idiomas y mejora la capacidad de traducir modismos y juegos de palabras que los modelos anteriores resolvian con dificultad.

En cuanto a la codificación, PaLM 2 fue entrenado en repositorios de código de acceso público. Puede trabajar con Python y JavaScript, pero también con Prolog, Fortran y Verilog, lenguajes científicos y de simulación que rara vez aparecen en los conjuntos de datos de entrenamiento de modelos generalistas. La misma arquitectura alimenta ya las mejoras de codificación de Bard, que se expandió a 180 países el mismo día que este anuncio.

Med-PaLM 2 y Sec-PaLM: variantes para medicina y ciberseguridad

El anuncio más llamativo es Med-PaLM 2, una versión ajustada para entornos médicos que el equipo de investigación en salud de Google ha entrenado sobre textos clínicos. Med-PaLM 2 fue el primer LLM en alcanzar el nivel de «experto» en preguntas al estilo del Examen de Licencia Médica de EE. UU. (USMLE). La siguiente fase incluye capacidades multimodales para analizar radiografías y mamografías. Google anunció que Med-PaLM 2 se abrirá a un grupo reducido de clientes de Google Cloud a finales del verano de 2023 para identificar casos de uso seguros.

Sec-PaLM es la variante orientada a ciberseguridad. Disponible a través de Google Cloud, analiza scripts potencialmente maliciosos y los clasifica según si representan una amenaza real. Google no aportó datos de precisión en el anuncio, aunque describió el modelo como un avance para los equipos de seguridad que necesitan priorizar alertas en tiempo real.

25 productos nuevos y acceso para desarrolladores

En Google I/O se anunciaron más de 25 productos o características basados en PaLM 2, desde las herramientas de redacción en Gmail y Google Docs hasta Duet AI para Google Cloud, un asistente de IA generativa orientado a desarrolladores y equipos de operaciones. Los desarrolladores pueden acceder al modelo via API directa o a través de Vertex AI, que añade controles de privacidad y gobernanza a nivel empresarial.

Este tipo de integración de IA en el trabajo diario sigue siendo un reto real para la mayoría de organizaciones. El artículo sobre la trampa que impide convertir la IA en resultados reales analiza por qué muchas empresas no logran pasar del piloto a la adopción efectiva, un problema que herramientas como Duet AI intentan atacar desde la capa de infraestructura.

Google DeepMind y el próximo modelo: Gemini

Junto con PaLM 2, Google anunció la fusión de Google Brain y DeepMind en una sola unidad: Google DeepMind. La empresa ya tiene en entrenamiento el siguiente modelo, Gemini, diseñado desde cero para ser multimodal y con soporte nativo de herramientas y API. En el momento del anuncio, Gemini se describió como capaz de mostrar capacidades multimodales «núnca antes vistas en modelos anteriores», aunque sin benchmarks publicados ni fecha de lanzamiento concreta.

Preguntas frecuentes sobre PaLM 2

¿Cuáles son los cuatro tamaños de PaLM 2?

Gecko, Otter, Bison y Unicorn, de menor a mayor. Gecko puede ejecutarse en móviles sin conexión; Unicorn está pensado para los casos de uso más exigentes en servidor.

¿Qué es Med-PaLM 2 y a quién va dirigido?

Med-PaLM 2 es una variante de PaLM 2 ajustada para entornos médicos. El primer LLM en superar el nivel de experto en el USMLE. Google lo abrió a un grupo reducido de clientes de Google Cloud para pruebas a finales del verano de 2023.

¿Qué lenguajes de programación soporta PaLM 2?

Además de Python y JavaScript, PaLM 2 puede generar código en Prolog, Fortran y Verilog, lenguajes usados en investigación científica y diseño de hardware.

¿Cómo pueden acceder los desarrolladores a PaLM 2?

A través de la API de PaLM directa o mediante Vertex AI en Google Cloud, que incluye controles de privacidad, seguridad y gobernanza a nivel empresarial.

¿Cuál es la diferencia entre Sec-PaLM y los sistemas de detección de amenazas tradicionales?

Sec-PaLM usa un LLM entrenado en casos de ciberseguridad para analizar y explicar scripts potencialmente maliciosos, en lugar de depender solo de firmas o patrones predefinidos. Google no publicó datos de precisión comparativos en el anuncio de lanzamiento.

Scroll al inicio