Por qué Claude se llama Claude: Shannon, lenguaje y la vieja historia de la IA

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

El nombre de Claude, el asistente de Inteligencia Artificial de Anthropic, parece sencillo a primera vista. Podría ser solo una forma de dar calidez humana a un modelo de lenguaje, igual que otras compañías han elegido nombres propios para sus asistentes digitales. Pero en el mundo de la IA casi nada se nombra por accidente. La explicación más extendida es que Claude sería un homenaje a Claude Shannon, el matemático e ingeniero que convirtió la información en una magnitud medible y que anticipó, décadas antes de los LLM, una parte esencial de la lógica estadística del lenguaje.

Anthropic no ha construido una gran campaña pública alrededor del origen del nombre, así que conviene no presentarlo como una confirmación corporativa cerrada. La conexión, aun así, es demasiado fuerte para pasarla por alto. Shannon no inventó los grandes modelos de lenguaje actuales, ni los transformers, ni el aprendizaje profundo. Pero sin su trabajo sería difícil entender el edificio intelectual sobre el que se apoya buena parte de la Inteligencia Artificial moderna: bits, entropía, comunicación, probabilidad, ruido, predicción y estructura estadística.

Claude Shannon, el científico que convirtió la información en matemáticas

Claude Elwood Shannon nació en 1916 y se convirtió en una de esas figuras que explican mejor el siglo XX que muchas biografías políticas. En 1937, con solo 21 años, presentó una tesis de máster en el MIT que demostró cómo el álgebra de Boole podía aplicarse a circuitos eléctricos con relés. La idea puede parecer elemental vista desde un ordenador moderno, pero fue decisiva: los circuitos podían representar operaciones lógicas mediante estados binarios, abierto o cerrado, verdadero o falso, uno o cero.

No fue el único responsable de la electrónica digital, pero sí dio una base matemática fundamental al diseño de circuitos lógicos. Cada chip moderno, cada procesador, cada memoria y cada acelerador de IA vive en un mundo que Shannon ayudó a ordenar. La computación digital no nació de una sola persona, pero pocas contribuciones fueron tan limpias, tan tempranas y tan influyentes.

Después llegó Bell Labs, uno de los laboratorios más importantes de la historia tecnológica. Allí nacieron avances como el transistor, Unix, el lenguaje C, el láser o las células solares. Shannon encajaba en ese ambiente de investigación abierta y libertad intelectual. Era matemático, ingeniero, criptógrafo, jugador, inventor y un personaje famoso por sus excentricidades: recorría los pasillos en monociclo, hacía malabares y construía máquinas que parecían juguetes, aunque encerraban ideas profundas.

Su gran obra llegó en 1948 con A Mathematical Theory of Communication. En aquel artículo, Shannon definió un marco para medir la información y la incertidumbre. Formalizó conceptos como la entropía de una fuente de información y trabajó con unidades binarias cuando la base logarítmica era 2, es decir, bits por símbolo o por segundo. La teoría de la información no explicaba el significado de los mensajes, sino las condiciones matemáticas para transmitirlos, comprimirlos y protegerlos frente al ruido.

Esa distinción es importante para entender su relación con la IA. Shannon no estaba interesado en si una frase era bella, verdadera o persuasiva. Le interesaba cuánta incertidumbre quedaba antes de conocer el siguiente símbolo, cuánta información transportaba una señal y cuáles eran los límites de la comunicación. Esa forma de mirar el lenguaje desde la probabilidad, no desde la intención, anticipa una parte del mundo actual de los modelos generativos.

Predecir la siguiente letra antes de predecir el siguiente token

La conexión más directa con los LLM aparece en 1951, cuando Shannon publicó Prediction and Entropy of Printed English. En ese trabajo estudió la estructura estadística del inglés escrito mediante experimentos de predicción. El planteamiento era muy simple: mostrar parte de un texto y pedir a una persona que adivinara cuál sería la siguiente letra.

Visto desde 2026, el paralelismo resulta irresistible. Un LLM moderno predice tokens, no letras sueltas. Lo hace con redes neuronales gigantes, cantidades enormes de datos, entrenamiento distribuido, GPUs, técnicas de alineamiento y mecanismos de atención. Shannon trabajaba con textos impresos, papel, cálculo probabilístico y experimentos humanos. Pero el fondo de la pregunta era familiar: dado un contexto, ¿qué viene después?

Ahí está la razón por la que Claude Shannon aparece una y otra vez cuando se intenta explicar la genealogía de la Inteligencia Artificial generativa. Los modelos actuales no se limitan a “adivinar palabras”, porque su funcionamiento interno y sus capacidades emergentes son mucho más complejos que esa caricatura. Pero la predicción estadística del lenguaje sigue estando en el centro del entrenamiento de los grandes modelos. Shannon no construyó Claude, ChatGPT o Gemini. Sí ayudó a formular el lenguaje matemático que hizo posible pensar la comunicación como una fuente probabilística.

Esa es también la belleza del posible homenaje de Anthropic. Llamar Claude a un modelo de lenguaje no sería solo elegir un nombre amable. Sería recordar al científico que demostró que los mensajes podían analizarse con herramientas matemáticas y que la incertidumbre del lenguaje no era un misterio inabordable, sino un fenómeno medible.

El MiniVac 601, el ordenador educativo de Shannon

La figura de Shannon suele presentarse desde la teoría, pero su faceta más material es igual de interesante para una historia sobre IA. En 1961 diseñó el MiniVac 601, un kit educativo de ordenador digital electromecánico comercializado por Scientific Development Corporation. Era una máquina basada en relés eléctricos que funcionaban como interruptores lógicos y también como almacenamiento temporal.

El MiniVac 601 tenía una matriz binaria de entrada y salida de seis bits, con interruptores, botones, lámparas indicadoras y un dial rotatorio de 16 posiciones que podía servir para introducir números, generar salidas o actuar como señal de reloj. Se programaba conectando cables manualmente en un panel. No era un ordenador personal en el sentido moderno, ni un microordenador, porque todavía no existían los microchips tal como los entendemos hoy. Era una máquina didáctica para ver la lógica digital funcionando físicamente.

Su valor histórico está precisamente ahí. El MiniVac permitía observar el pensamiento computacional paso a paso: un relé cambiaba de estado, una luz se encendía, una conexión modificaba el circuito, una decisión binaria llevaba a otra. Podía resolver juegos sencillos como el tres en raya o simular sistemas de control como un ascensor básico. En una época de mainframes inaccesibles para la mayoría, Shannon intentó convertir los principios de la computación en algo manipulable.

Este detalle conecta muy bien con la IA actual. Hoy hablamos de modelos con cientos de miles de millones de parámetros, entrenamientos opacos y razonamiento difícil de interpretar. El MiniVac era justo lo contrario: una máquina lenta, visible y ruidosa, donde cada paso podía seguirse con los ojos y los oídos. Un simulador moderno del MiniVac lo describe como una forma de ver a un ordenador “pensar” lo bastante despacio como para entender cada movimiento.

Esa tensión entre lo visible y lo opaco acompaña a toda la historia de la Inteligencia Artificial. Shannon trabajó en un mundo donde la lógica se podía tocar. Los LLM viven en una escala donde el comportamiento emerge de millones de operaciones imposibles de seguir manualmente. Pero ambos pertenecen a la misma tradición: traducir problemas humanos, como comunicarse, jugar, razonar o decidir, a estructuras formales que una máquina puede procesar.

Haiku, Sonnet, Opus y la coherencia del naming de Anthropic

El posible homenaje a Shannon encaja además con la forma en que Anthropic ha bautizado sus modelos. La familia Claude ha usado nombres como Haiku, Sonnet y Opus para diferenciar variantes según capacidad, velocidad y coste. No son siglas frías ni códigos de laboratorio. Son nombres literarios que sugieren tamaño, estructura y ambición.

Haiku remite al poema breve japonés, concentrado y ligero. Anthropic lo usa para modelos rápidos y eficientes. Sonnet alude al soneto, una forma poética más elaborada, asociada a modelos intermedios con buen equilibrio entre capacidad y coste. Opus significa obra, composición de mayor entidad, y queda reservado para los modelos más potentes dentro de esa línea. En la documentación actual de Anthropic, Opus, Sonnet y Haiku siguen apareciendo como familias diferenciadas por capacidad, latencia, contexto y precio.

Esa coherencia ha llevado a algunas personas a pensar que Claude podría hacer referencia a Claude Debussy, especialmente por la cercanía del apellido artístico y por nombres como Sonnet u Opus. La interpretación es comprensible desde el terreno cultural. Debussy, además, encajaría con una línea de nombres musicales y poéticos. Pero si el producto es un modelo de lenguaje de una compañía de IA, la lectura Shannon pesa mucho más.

La propia combinación de nombres es reveladora. Claude como homenaje probable a la teoría de la información; Haiku, Sonnet y Opus como guiños a la producción lingüística y artística; modelos diseñados para escribir, programar, razonar y trabajar con lenguaje. El resultado es una marca con una capa técnica y otra humanista. No solo vende capacidad computacional. También sugiere una relación con la creatividad, la comunicación y la cultura escrita.

Esa estrategia de nombres contrasta con la tendencia de buena parte del sector, donde abundan siglas, números, familias opacas y versiones difíciles de recordar. Anthropic ha elegido nombres que hacen que sus modelos parezcan menos herramientas industriales y más colaboradores. Esa decisión tiene efectos de producto, de marketing y de percepción pública.

Un nombre que cuenta una historia de la IA

La pregunta por el nombre de Claude sirve para algo más que una curiosidad de SEO. Permite contar la historia larga de la Inteligencia Artificial generativa sin caer en la idea de que todo empezó con los chatbots modernos. Antes de los LLM hubo teoría de la información. Antes de los tokens hubo caracteres, entropía y modelos probabilísticos del inglés. Antes de las GPUs hubo relés, cables, interruptores y máquinas educativas como el MiniVac 601.

También ayuda a corregir una simplificación habitual. Los modelos de lenguaje actuales no son magia, aunque a veces lo parezcan. Funcionan sobre décadas de matemáticas, informática, lingüística computacional, estadística, hardware y diseño de sistemas. Cuando un asistente como Claude responde a una pregunta, detrás hay una cadena histórica que va de Boole a Shannon, de Bell Labs a los centros de datos, del relé al chip especializado y de la letra al token.

Anthropic no necesita confirmar todos los matices del nombre para que la lectura resulte poderosa. Claude Shannon representa exactamente el tipo de figura que un laboratorio de Inteligencia Artificial querría invocar: alguien que unió teoría y máquina, abstracción y juguete, matemáticas y comunicación. Un científico que podía escribir uno de los artículos más importantes del siglo XX y, años después, diseñar un ordenador educativo con luces, relés y cables.

Por eso la hipótesis Shannon es tan atractiva. Porque convierte el nombre Claude en algo más que una marca. Lo conecta con la pregunta que sigue moviendo a la IA: hasta qué punto puede una máquina anticipar, comprimir, generar o interpretar patrones del mundo humano. Shannon no vivió para ver los grandes modelos de lenguaje actuales, pero sí dejó una de las ideas que los hacen comprensibles: el lenguaje tiene incertidumbre, estructura y probabilidad. Y una parte de esa estructura se puede calcular.

Preguntas frecuentes

¿Anthropic ha confirmado que Claude se llama así por Claude Shannon?

No hay una gran explicación oficial ampliamente difundida por Anthropic sobre el origen del nombre. La hipótesis más extendida es que Claude homenajea a Claude Shannon, por su papel en la teoría de la información y la historia de la computación.

¿Qué tiene que ver Claude Shannon con los modelos de lenguaje?

Shannon estudió la información, la entropía y la predicción del lenguaje escrito. En 1951 publicó un trabajo sobre la entropía del inglés basado en adivinar la siguiente letra de un texto, una intuición lejana pero muy reconocible en la lógica de predicción de los LLM actuales.

¿Qué era el MiniVac 601?

El MiniVac 601 fue un kit educativo de ordenador digital electromecánico diseñado por Claude Shannon y vendido desde 1961 por Scientific Development Corporation. Usaba relés, interruptores, luces y cables para enseñar lógica digital y principios de computación.

¿Por qué Anthropic usa nombres como Haiku, Sonnet y Opus?

Anthropic usa esos nombres para diferenciar modelos de Claude por tamaño, coste y capacidad. Haiku representa modelos ligeros y rápidos, Sonnet un equilibrio intermedio y Opus las versiones más capaces.