Los desarrolladores de aplicaciones de inteligencia artificial a menudo enfrentan el desafío de convertir datos no estructurados en formatos que faciliten la comunicación entre máquinas. La salida estructurada es crucial para permitir que los resultados generados sean consumidos y procesados de manera eficiente por otros sistemas. Este proceso es vital en tareas como la extracción de información de documentos, la creación de asistentes basados en APIs y el desarrollo de agentes automatizados.
Para mejorar la fiabilidad de las herramientas que generan estas salidas, Amazon ha lanzado una innovación llamada decodificación restringida. Esta técnica aprovecha los modelos de base Amazon Nova para extraer datos ajustándose a esquemas complejos, reduciendo los errores en el uso de herramientas en un 95%.
Al implementar salidas estructuradas, existen dos métodos principales que los desarrolladores pueden emplear: la modificación del aviso del sistema y el uso de configuraciones de herramientas. En un escenario de soporte al cliente, por ejemplo, se podría pedir al modelo que produzca una respuesta en formato JSON, detallando tanto la respuesta como el sentimiento del usuario. Para ello, se ajustaría el aviso del sistema para reflejar la estructura esperada.
El segundo método implica proporcionar al modelo un API, una función de código o un esquema a través de una solicitud. Este enfoque es especialmente útil para aplicaciones que requieren salidas precisas y estructuradas, permitiendo definir un esquema específico que el modelo debe seguir.
Aunque estos enfoques son efectivos, la salida sigue siendo no determinística, lo que deja espacio para errores. Se ha observado que la precisión disminuye conforme el esquema se vuelve más complejo. Para mitigar esto, la decodificación restringida utiliza una gramática que limita los posibles tokens a generar en cada paso, diferenciándose de técnicas pasadas al modificar los tokens seleccionables por el modelo.
Un aspecto crucial en el uso de las salidas estructuradas con Amazon Nova es el establecimiento de configuraciones de herramientas que definan claramente el esquema de salida. Esto garantiza que el modelo comprenda y complete adecuadamente los campos requeridos.
Una vez establecida la configuración, puede enviarse junto con la receta a través de la API Conversar. Junto a esta, la decodificación restringida posibilita que el modelo genere un esquema JSON completo y complejo adecuado para la aplicación.
Esta evolución en la generación de salidas estructuradas con Amazon Nova es una herramienta valiosa para los desarrolladores, permitiéndoles construir sistemas de inteligencia artificial más confiables y eficientes.