La nueva función de bloqueo total de rastreadores por inteligencia artificial busca frenar el uso no autorizado de contenido para entrenar modelos y dar voz a los creadores.
Cloudflare, uno de los gigantes silenciosos que sustentan buena parte del tráfico de Internet, acaba de tomar una postura firme frente a una de las mayores controversias tecnológicas del momento: el acceso indiscriminado de bots de inteligencia artificial al contenido web.
Con un simple clic, los propietarios de sitios protegidos por Cloudflare —desde grandes medios hasta pequeños blogs— pueden ahora bloquear automáticamente todos los rastreadores de IA, incluidos aquellos que ocultan su identidad. Y lo mejor: la función está disponible incluso para usuarios del plan gratuito.
Un movimiento en defensa de los creadores
El auge de la IA generativa ha desatado una carrera por conseguir datos con los que entrenar modelos. Desde Reddit, que ha licenciado su contenido a Google por 60 millones de dólares anuales, hasta empresas como Perplexity, que han sido acusadas de camuflar sus rastreos como si fueran visitas legítimas, el valor del contenido original nunca ha sido tan alto… ni tan vulnerable.
«Los creadores publican su trabajo con esfuerzo, esperando visitas, reconocimiento o monetización. Pero en muchos casos, ese contenido acaba alimentando modelos de IA que devuelven respuestas a millones de usuarios sin mencionar la fuente ni aportar tráfico», explica un portavoz de Cloudflare.
La realidad de los bots de IA: quiénes son y qué hacen
Cloudflare ha compartido datos sobre los bots más activos en su red, destacando nombres como Bytespider (de ByteDance/TikTok), GPTBot (OpenAI), ClaudeBot (Anthropic) y Amazonbot. Entre todos ellos, han accedido a más del 40 % de los sitios web que usan Cloudflare como escudo.
Pero lo más preocupante es que, según los datos de junio de 2025, solo un 3 % de los sitios han tomado medidas activas para bloquearlos. Muchos editores simplemente no sabían que estaban siendo rastreados o cómo evitarlo.
Ahora, Cloudflare simplifica la respuesta con un botón: en el panel de usuario, bajo Seguridad > Bots, se puede activar el bloqueo de «AI Scrapers and Crawlers», y la empresa irá actualizando automáticamente la lista con nuevos rastreadores detectados.
Contra la trampa: detectar bots que se hacen pasar por humanos
Uno de los aspectos más destacables de la iniciativa de Cloudflare es su enfoque en la detección de rastreadores maliciosos que falsifican su identidad. Es decir, aquellos que se hacen pasar por navegadores legítimos.
Gracias a su modelo de aprendizaje automático entrenado con los más de 57 millones de peticiones que procesa por segundo, Cloudflare afirma poder identificar con precisión este tráfico engañoso, incluso cuando los bots cambian su “user agent”.
«Los agentes falsos ya no son un problema. Nuestros modelos no se basan solo en la etiqueta, sino en el comportamiento de la conexión», explican desde la compañía. Así, muchos sitios que ya usaban reglas de firewall para bloquear bots con puntuación baja (por debajo de 30) ya estaban frenando este tipo de accesos sin saberlo.
Una Internet donde el contenido vuelve a tener dueño
Más allá del bloqueo, Cloudflare también está trabajando en soluciones que permitan monetizar el acceso de los bots de IA, como un modelo de «pago por rastreo» (Pay to Crawl). De momento, solo algunos grandes editores participan, entre ellos Associated Press, The Atlantic, Stack Overflow o Quora, pero la iniciativa busca sentar un precedente: si una IA quiere entrenarse con contenido de calidad, deberá pedir permiso y pagar por ello.
Y esto no es solo una cuestión económica, sino de justicia en la era digital. Como declaró Matthew Prince, CEO de Cloudflare, durante el evento Axios Live:
“El contenido original es lo que hace de Internet uno de los mayores inventos del siglo pasado, y tenemos que unirnos para protegerlo.”
¿El principio de una Internet más justa?
La medida de Cloudflare llega en un momento clave: el uso de IA está desplazando el tráfico que antes recibían los sitios web. Cada vez más usuarios consultan directamente a herramientas como ChatGPT o Gemini, sin pasar por los buscadores ni visitar las fuentes. Esto erosiona la visibilidad, la monetización y la sostenibilidad de miles de medios y creadores independientes.
Con este paso, Cloudflare no solo protege a sus clientes, sino que abre el debate sobre el modelo de acceso al conocimiento en la era de la IA. ¿Deben las grandes tecnológicas tener acceso libre a todo el contenido público? ¿Debería haber límites, licencias o contraprestaciones?
Lo que está claro es que la relación entre inteligencia artificial e Internet está en plena transformación, y movimientos como este pueden marcar un antes y un después.
Fuente: Noticias Revista Cloud