Amazon ha revelado una serie de innovaciones para sus clientes de SageMaker AI, con la introducción de dos nuevas plantillas de interfaz de usuario: Text Ranking y Question and Answer. Estas herramientas están diseñadas para optimizar la eficacia de los modelos de lenguaje al proporcionar comentarios estructurados y específicos por parte de los usuarios.
La plantilla Text Ranking permite a los anotadores humanos evaluar múltiples respuestas generadas por modelos de lenguaje grandes (LLM) de acuerdo con criterios específicos como la relevancia, claridad y precisión. Este proceso de retroalimentación es esencial para afinar los modelos mediante la técnica de Reinforcement Learning from Human Feedback (RLHF), asegurando que las respuestas del modelo se ajusten mejor a las preferencias humanas.
Por otro lado, la plantilla Question and Answer facilita la creación de preguntas y respuestas de alta calidad a partir de textos proporcionados. Estos pares de datos funcionan como ejemplos para el Supervised Fine-Tuning (SFT), enseñando a los modelos a responder correctamente ante entradas similares.
Los usuarios pueden configurar estas plantillas accediendo a la consola de SageMaker AI, donde se ha añadido una nueva categoría de Generative AI en el tipo de tarea. Desde allí, pueden crear trabajos de etiquetado especificando los detalles del manifiesto de entrada y la ruta de salida para los resultados.
En cuanto al funcionamiento, la plantilla Text Ranking requiere un archivo JSON que describe el contenido a clasificar, permitiendo una evaluación más organizada. Las respuestas anotadas se almacenan en un bucket de S3 determinado por el usuario, lo cual facilita un proceso de evaluación continuo del modelo.
La plantilla Question and Answer, por su parte, ayuda a los anotadores a generar preguntas y respuestas relevantes a partir de textos. Esta función incluye un sistema de coincidencia codificada por colores que mejora la identificación rápida de las secciones relevantes del texto.
Además de la interfaz gráfica, se ha lanzado una API de Creación de Trabajos de Etiquetado, que permite una configuración programática de trabajos de clasificación. Esto ofrece a los usuarios más flexibilidad y la capacidad de integrar estas herramientas en flujos de trabajo ya existentes.
Con estas nuevas funcionalidades, Amazon SageMaker AI busca empoderar a sus usuarios para que puedan crear conjuntos de datos de alta calidad de manera más eficiente, facilitando la mejora continua en el entrenamiento y evaluación de modelos de lenguaje que se ajusten mejor a las necesidades y preferencias del usuario.