General
25/07/2024

OpenAI introduce un nuevo enfoque de seguridad basado en recompensas por reglas

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

OpenAI ha desarrollado una innovadora metodología para mejorar la seguridad de sus modelos de inteligencia artificial, denominada Recompensas Basadas en Reglas (RBRs, por sus siglas en inglés). Este nuevo enfoque permite alinear el comportamiento de los modelos con estándares y políticas de seguridad específicas sin la intervención humana.

Un Cambio en la Evaluación de la IA

Anteriormente, la evaluación de las respuestas de los modelos de IA se realizaba mediante la puntuación humana, donde las respuestas eran valoradas según su precisión o preferencia. Este método resultaba ser costoso, consumía mucho tiempo y era susceptible a la subjetividad.

Eficiencia y Objetividad con RBRs

Con la introducción de las RBRs, los equipos de seguridad pueden establecer reglas claras para el modelo, y la propia IA puntuará sus respuestas según el grado de alineación con estas reglas. Este enfoque es más eficiente y elimina la subjetividad inherente a la evaluación humana.

Resultados Prometedores en las Pruebas

Durante las pruebas, los modelos de IA entrenados con RBRs mostraron una mejor adherencia a los estándares de seguridad y una reducción en las instancias de negarse incorrectamente a responder a un prompt, en comparación con aquellos entrenados mediante retroalimentación dirigida por humanos.

Desafíos y Consideraciones

Aunque las RBRs representan un avance significativo para asegurar que los modelos de IA se mantengan alineados con los protocolos de seguridad deseados—creando así modelos más seguros—OpenAI ha reconocido que este método, si bien puede reducir el tiempo de entrenamiento, los costos, la supervisión humana y la subjetividad, también podría incrementar el sesgo. Por lo tanto, los equipos de seguridad deben diseñar las RBRs con cuidado para «asegurar la equidad y la precisión» y considerar usarlas en conjunto con el enfoque tradicional basado en retroalimentación humana.

Este desarrollo subraya el compromiso de OpenAI con la innovación continua en la seguridad de la inteligencia artificial, buscando siempre mejorar la eficiencia y la objetividad en el entrenamiento de sus modelos.

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Alan Sonny

Escribo sobre inteligencia artificial, robótica y tecnología y sigo la actualidad y notas del sector.

OpenAI introduce un nuevo enfoque de seguridad basado en recompensas por reglas

Un Cambio en la Evaluación de la IA

Eficiencia y Objetividad con RBRs

Resultados Prometedores en las Pruebas

Desafíos y Consideraciones

Alan Sonny

Últimos artículos

Tesla presenta a Optimus: el robot humanoide capaz de navegar terrenos difíciles

China apunta a superar a Tesla con su avance en robots humanoides

Tesla revoluciona la visión de los robots autónomos con un nuevo sistema basado en IA

Accionistas de Tesla demandan a Elon Musk por desviar recursos a su startup xAI

Elon Musk redefine a Tesla: Más que autos, una empresa de IA y robótica

Artículos relacionados

Evitando Estafas de Inversión y Pago en Línea

Inteligencia Artificial y Startups: Apoyo en Quemas Controladas y Alertas Tempranas para Prevenir Incendios Forestales

LM Studio Acelera Modelos de Lenguaje con GPUs GeForce RTX

JetBrains libera Mellum como código abierto: un modelo de IA especializado en programación ya disponible en Hugging Face

Las mejores alternativas libres y de código abierto a Siri en Linux

OpenAI lanza «OpenAI for Countries»: una apuesta estratégica para expandir la infraestructura de inteligencia artificial bajo valores democráticos

Arquitectos De Plataformas De IA: Uniendo Visión Empresarial Y Ejecución Técnica Según Rama Akkiraju De NVIDIA

Meta Intensifica Esfuerzos Contra Estafas de Inversión y Pagos en India

DECORACIÓN

TECNOLOGÍA

LIFESTYLE

MIX

MEDIOS LOCALES

OpenAI introduce un nuevo enfoque de seguridad basado en recompensas por reglas

Un Cambio en la Evaluación de la IA

Eficiencia y Objetividad con RBRs

Resultados Prometedores en las Pruebas

Desafíos y Consideraciones

Alan Sonny

Últimos artículos

Artículos relacionados

DECORACIÓN

TECNOLOGÍA

LIFESTYLE

MIX

MEDIOS LOCALES

Comienza a escribir y presiona Intro para buscar