General, Infraestructura
26/03/2023

Anthropic presenta a Claude, un asistente de IA revolucionario para competir con ChatGPT

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Anthropic, una startup de inteligencia artificial fundada por ex empleados de OpenAI, ha comenzado discretamente a probar un nuevo asistente de inteligencia artificial similar a ChatGPT, llamado Claude. El equipo de Anthropic nos permitió acceder al asistente, y gracias a las actualizaciones en las políticas de redes sociales de la empresa, ahora podemos compartir algunos de nuestros hallazgos preliminares en la comparación entre Claude y ChatGPT.

Para mostrar las diferencias entre ambos asistentes, se les pidió a ChatGPT y Claude que se presentaran utilizando el mismo mensaje. Claude demostró un conocimiento detallado sobre su identidad, sus creadores y los principios éticos que guiaron su diseño. Más adelante veremos cómo este conocimiento le ayuda a responder preguntas complejas sobre sí mismo y a entender los límites de sus capacidades.

Aunque Claude no profundiza en los detalles técnicos de su implementación, un documento de investigación de Anthropic sobre inteligencia artificial constitucional describe AnthropicLM v4-s3, un modelo pre-entrenado de 52 mil millones de parámetros. Este modelo autorregresivo se entrenó sin supervisión en un gran corpus de texto, de forma similar al GPT-3 de OpenAI. Anthropic nos informa que Claude es un modelo más grande con opciones arquitectónicas similares a las del estudio publicado.

Realizamos experimentos para determinar el tamaño de la ventana de contexto disponible de Claude, es decir, la cantidad máxima de texto que puede procesar de una sola vez. Según nuestras pruebas (no mostradas) y confirmado por Anthropic, Claude puede recordar información a lo largo de 8,000 tokens, más que cualquier modelo de OpenAI conocido públicamente, aunque esta habilidad no fue confiable en nuestras pruebas.

En cuanto a la inteligencia artificial constitucional, tanto Claude como ChatGPT utilizan aprendizaje por refuerzo (RL) para entrenar un modelo de preferencia sobre sus salidas, y las generaciones preferidas se utilizan para ajustes posteriores. Sin embargo, el método utilizado para desarrollar estos modelos de preferencia difiere, ya que Anthropic favorece un enfoque que denominan inteligencia artificial constitucional.

Tanto ChatGPT como la versión más reciente de GPT-3 (text-davinci-003) emplean un proceso llamado aprendizaje por refuerzo a partir de retroalimentación humana (RLHF). RLHF entrena un modelo de aprendizaje por refuerzo basado en clasificaciones de calidad proporcionadas por humanos: los humanos clasifican las salidas generadas a partir del mismo mensaje, y el modelo aprende estas preferencias para aplicarlas a otras generaciones a mayor escala.

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Alan Sonny

Escribo sobre inteligencia artificial, robótica y tecnología y sigo la actualidad y notas del sector.

Últimos artículos

Tesla desmantela su equipo Dojo y abandona el desarrollo de chips propios de IA para apoyarse en NVIDIA y Samsung

Tesla presenta a Optimus: el robot humanoide capaz de navegar terrenos difíciles

Tesla presenta el Robotaxi: el futuro del transporte autónomo a precio accesible

China apunta a superar a Tesla con su avance en robots humanoides

Tesla revoluciona la visión de los robots autónomos con un nuevo sistema basado en IA

Artículos relacionados

Microsoft, NVIDIA y Anthropic sellan una alianza multimillonaria para dominar la nube de la IA

Inteligencia artificial y computación cuántica: la alianza que puede transformar el mundo… y también ponerlo en jaque

Microsoft presenta Agent 365, la “torre de control” para gestionar legiones de agentes de IA en la empresa

Elena Digital López

Cómo Amazon Utiliza Agentes de IA para Apoyar la Evaluación de Cumplimiento de Miles de Millones de Transacciones Diarias

NVIDIA Anuncia Resultados Financieros del Tercer Trimestre Fiscal 2026

Elena Digital López

Anuncio del Enfoque Responsable de IA de AWS Well-Architected

Gemini 3: el nuevo modelo de Google que quiere marcar un antes y un después en la IA de uso general

Integración De Tecnologías Avanzadas De NVIDIA Y Microsoft Para Superfábricas De IA, Ciberseguridad Y IA Física