Donald Knuth cambia el tono sobre la IA tras un hallazgo de Claude

Donald Knuth, una de las figuras más influyentes de la informática moderna, ha publicado una breve nota con un arranque poco habitual en su estilo: “Shock! Shock!”. El motivo era que Claude Opus 4.6, un modelo de razonamiento de Anthropic, había encontrado una solución para un problema abierto de teoría de grafos en el que Knuth llevaba varias semanas trabajando mientras preparaba material para un futuro volumen de The Art of Computer Programming.

La historia no debe leerse como un episodio de sustitución automática del matemático por la máquina. Es más interesante que eso. Claude no entregó una demostración formal completa lista para imprenta en el primer intento, ni trabajó sin dirección humana. El problema fue planteado por Filip Stappers, amigo de Knuth, que además guio al modelo y le obligó a documentar cada exploración. Después, Knuth leyó el resultado, reconstruyó la prueba rigurosa y redactó la nota titulada Claude’s Cycles. Aun así, el episodio tiene una fuerza simbólica evidente: uno de los grandes maestros de los algoritmos ha reconocido públicamente que tendrá que revisar sus opiniones sobre la IA generativa.

Un problema de ciclos hamiltonianos dirigido

El problema surgió en el contexto de los ciclos hamiltonianos dirigidos, un área de la combinatoria y la teoría de grafos. En términos sencillos, Knuth estudiaba un grafo dirigido construido sobre una especie de cubo modular de tamaño m × m × m. Cada vértice tiene tres posibles salidas, correspondientes a incrementar una de sus tres coordenadas. La pregunta era si todos esos arcos podían descomponerse en tres grandes ciclos dirigidos, cada uno de longitud , para todos los valores de m mayores que 2.

Knuth había resuelto el caso m = 3. Stappers, por su parte, había encontrado soluciones experimentales para valores entre 4 y 16, lo que hacía pensar que la conjetura era plausible. Pero faltaba una construcción general. Claude, tras una larga secuencia de exploraciones, encontró una regla concreta que funcionaba para todos los valores impares probados. Stappers la verificó para todos los impares entre 3 y 101, y Knuth elaboró después la demostración.

El proceso tuvo 31 exploraciones y, según relata Knuth, el éxito para los valores impares llegó aproximadamente una hora después de comenzar la sesión. No fue un camino lineal. Claude probó enfoques que no funcionaron, hizo búsquedas por fuerza bruta demasiado lentas, exploró patrones serpentinos, analizó fibras del grafo, utilizó búsqueda local, recocido simulado y reformulaciones algebraicas. La solución apareció cuando el modelo dejó de intentar una búsqueda puramente experimental y encontró una estructura más matemática.

Elemento claveQué ocurrió
Autor de la notaDonald E. Knuth, Universidad de Stanford
Título del documentoClaude’s Cycles
Modelo citadoClaude Opus 4.6
Persona que planteó el problema al modeloFilip Stappers
Número de exploraciones hasta el hallazgo impar31
Tiempo aproximado hasta la solución imparEn torno a 1 hora
Resultado inicialConstrucción válida para valores impares de m
Trabajo humano posteriorKnuth redactó la prueba formal
Desarrollo posteriorOtros trabajos abordaron los casos pares y formalizaciones

Lo que realmente hizo Claude

La parte más relevante no es que Claude “adivinara” una respuesta, sino el tipo de trabajo que realizó. Reformuló el problema, probó patrones, generó código, descartó hipótesis y fue acumulando información hasta detectar una regla. Knuth destaca que el modelo reconoció estructuras propias de grafos de Cayley, propuso patrones tipo código Gray modular y acabó llegando a una construcción que podía verificarse computacionalmente.

También hubo tropiezos. Stappers contó a Knuth que la sesión no fue especialmente fluida: Claude se detenía por errores aleatorios, perdía resultados anteriores y tenía que ser recordado una y otra vez de que debía documentar cuidadosamente su progreso. Esta parte es importante porque evita convertir el caso en propaganda tecnológica. El avance fue notable, pero necesitó supervisión, insistencia y criterio humano.

El hallazgo inicial tampoco cerraba todo el problema. La construcción de Claude resolvía el caso de los valores impares de m. En la primera parte de la nota, Knuth explica que los valores pares seguían abiertos, aunque el propio documento revisado incluye después una serie de postscripts con nuevos avances: programas generados con otros modelos, una prueba para casos pares a partir de GPT-5.4 Pro y trabajos posteriores de otros investigadores. El relato, por tanto, muestra una forma de investigación cada vez más híbrida, en la que humanos y modelos colaboran, corrigen, verifican y amplían resultados.

Knuth, los LLM y una señal cultural para la informática

La reacción de Knuth tiene un peso especial porque no procede de un entusiasta acrítico de la IA. Su obra The Art of Computer Programming ha marcado generaciones de informáticos, matemáticos, ingenieros y programadores. Durante décadas, Knuth ha sido sinónimo de rigor, precisión algorítmica y atención extrema al detalle. Que un investigador de ese perfil escriba que debe revisar sus opiniones sobre la IA generativa no convierte a los LLM en matemáticos infalibles, pero sí marca un cambio de tono.

El caso recuerda que la utilidad de estos modelos no está solo en responder preguntas fáciles o redactar textos. En determinados contextos, pueden actuar como exploradores de espacios enormes de posibilidades. No sustituyen la prueba matemática, pero pueden encontrar patrones, generar conjeturas, proponer construcciones y producir código experimental que acelere la investigación.

Esa función puede ser especialmente valiosa en problemas combinatorios, donde muchas soluciones requieren mezclar intuición, búsqueda computacional y prueba formal. Un modelo puede equivocarse, pero también puede recorrer caminos que un humano quizá no probaría, o hacerlo con una velocidad difícil de igualar.

Entre el entusiasmo y la prudencia

La historia de Claude’s Cycles también deja una advertencia. En matemáticas, una solución computacional no basta si no va acompañada de una demostración. Claude encontró una construcción, pero Knuth necesitó escribir la prueba. Más tarde, la comunidad de Lean formalizó parte del trabajo, reforzando la confianza en la corrección. La verificación sigue siendo esencial.

Además, el propio desarrollo del caso muestra que los modelos pueden atascarse, perder contexto o invertir tiempo en optimizaciones poco útiles. En la fase de los casos pares, Claude llegó a bloquearse, según el relato de Stappers, y fue necesario recurrir a otros enfoques y herramientas. La IA generativa no elimina la dificultad de la investigación; cambia la forma de enfrentarse a ella.

Aun así, el episodio es difícil de ignorar. No se trata de un ejemplo menor publicado en una red social, sino de una nota firmada por Donald Knuth y alojada en su página de Stanford. El tono es casi celebratorio, pero no ingenuo. Knuth reconoce el avance, explica el proceso, aporta la prueba y documenta los límites.

La conclusión más razonable es que los LLM empiezan a convertirse en compañeros de investigación para problemas donde la exploración, la programación experimental y la formulación de patrones son importantes. No hacen desaparecer al matemático, pero pueden cambiar su flujo de trabajo.

Para la informática, el mensaje es claro: si incluso Knuth, a los 88 años, se permite reconsiderar su postura ante la IA generativa después de ver un resultado concreto, el debate ya no puede quedarse en la caricatura de “sirve para todo” o “no sirve para nada”. La pregunta relevante pasa a ser otra: en qué tipo de problemas, con qué supervisión y bajo qué mecanismos de verificación estos modelos pueden aportar valor real.

Preguntas frecuentes

¿Qué problema resolvió Claude en la nota de Donald Knuth?

Claude encontró una construcción general para descomponer los arcos de un grafo dirigido tridimensional modular en tres ciclos hamiltonianos dirigidos, inicialmente para valores impares de m. El problema formaba parte del trabajo de Knuth sobre ciclos hamiltonianos para un futuro volumen de The Art of Computer Programming.

¿Claude escribió la prueba matemática completa?

No en el hallazgo inicial. Claude encontró una construcción y generó programas que permitían verificarla en casos concretos. Donald Knuth leyó el resultado y redactó la prueba formal para la construcción impar. Posteriormente, otros investigadores y modelos contribuyeron a desarrollos adicionales, incluyendo los casos pares.

¿Por qué es importante que Donald Knuth haya publicado esta historia?

Porque Knuth es una autoridad histórica en informática y algoritmos. Su reconocimiento de que este resultado le obliga a revisar sus opiniones sobre la IA generativa tiene un valor simbólico importante, especialmente porque viene acompañado de una explicación técnica rigurosa y no de una simple opinión.

¿Significa esto que la IA puede resolver cualquier problema matemático abierto?

No. El caso muestra que los modelos pueden ser útiles para explorar, programar, encontrar patrones y proponer construcciones, pero siguen necesitando supervisión humana y verificación formal. Muchos problemas matemáticos siguen estando muy lejos de las capacidades actuales de los LLM.

Scroll al inicio