General, Infraestructura
26/03/2023

Anthropic presenta a Claude, un asistente de IA revolucionario para competir con ChatGPT

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Anthropic, una startup de inteligencia artificial fundada por ex empleados de OpenAI, ha comenzado discretamente a probar un nuevo asistente de inteligencia artificial similar a ChatGPT, llamado Claude. El equipo de Anthropic nos permitió acceder al asistente, y gracias a las actualizaciones en las políticas de redes sociales de la empresa, ahora podemos compartir algunos de nuestros hallazgos preliminares en la comparación entre Claude y ChatGPT.

Para mostrar las diferencias entre ambos asistentes, se les pidió a ChatGPT y Claude que se presentaran utilizando el mismo mensaje. Claude demostró un conocimiento detallado sobre su identidad, sus creadores y los principios éticos que guiaron su diseño. Más adelante veremos cómo este conocimiento le ayuda a responder preguntas complejas sobre sí mismo y a entender los límites de sus capacidades.

Aunque Claude no profundiza en los detalles técnicos de su implementación, un documento de investigación de Anthropic sobre inteligencia artificial constitucional describe AnthropicLM v4-s3, un modelo pre-entrenado de 52 mil millones de parámetros. Este modelo autorregresivo se entrenó sin supervisión en un gran corpus de texto, de forma similar al GPT-3 de OpenAI. Anthropic nos informa que Claude es un modelo más grande con opciones arquitectónicas similares a las del estudio publicado.

Realizamos experimentos para determinar el tamaño de la ventana de contexto disponible de Claude, es decir, la cantidad máxima de texto que puede procesar de una sola vez. Según nuestras pruebas (no mostradas) y confirmado por Anthropic, Claude puede recordar información a lo largo de 8,000 tokens, más que cualquier modelo de OpenAI conocido públicamente, aunque esta habilidad no fue confiable en nuestras pruebas.

En cuanto a la inteligencia artificial constitucional, tanto Claude como ChatGPT utilizan aprendizaje por refuerzo (RL) para entrenar un modelo de preferencia sobre sus salidas, y las generaciones preferidas se utilizan para ajustes posteriores. Sin embargo, el método utilizado para desarrollar estos modelos de preferencia difiere, ya que Anthropic favorece un enfoque que denominan inteligencia artificial constitucional.

Tanto ChatGPT como la versión más reciente de GPT-3 (text-davinci-003) emplean un proceso llamado aprendizaje por refuerzo a partir de retroalimentación humana (RLHF). RLHF entrena un modelo de aprendizaje por refuerzo basado en clasificaciones de calidad proporcionadas por humanos: los humanos clasifican las salidas generadas a partir del mismo mensaje, y el modelo aprende estas preferencias para aplicarlas a otras generaciones a mayor escala.

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Alan Sonny

Escribo sobre inteligencia artificial, robótica y tecnología y sigo la actualidad y notas del sector.

Últimos artículos

Tesla presenta a Optimus: el robot humanoide capaz de navegar terrenos difíciles

China apunta a superar a Tesla con su avance en robots humanoides

Tesla revoluciona la visión de los robots autónomos con un nuevo sistema basado en IA

Accionistas de Tesla demandan a Elon Musk por desviar recursos a su startup xAI

Elon Musk redefine a Tesla: Más que autos, una empresa de IA y robótica

Artículos relacionados

Elena Digital López

Evaluación de Aplicaciones de IA Generativa con Métricas Personalizadas en Amazon Bedrock

Ganando la Lucha Contra el Comerciante de Spyware NSO

Tu Equipo de Servicio Tiene un Nuevo Compañero: Un Supergenio de 15 Mil Millones de Parámetros de ServiceNow y NVIDIA

Apple desarrolla una nueva versión de Xcode con la IA de Claude, el modelo de Anthropic

Phi-4: los modelos pequeños de Microsoft que desafían a los gigantes de la Inteligencia Artificial

Speakr: la alternativa autoalojada para transcripción, resumen y consulta de audios

Expertos de NVIDIA Comparten 5 Consejos Clave para Destacar en el Mercado Laboral de IA

Elena Digital López

Acelera tus Decisiones Basadas en Datos con AWS Trusted Advisor y Amazon Q Business