Los avances en inteligencia artificial como ChatGPT de OpenAI han permitido el desarrollo de aplicaciones, servicios y plugins para generar contenidos automáticamente y crear sitios web, entre otras utilidades. Sin embargo, estos sistemas extraen información de miles de sitios web, lo que puede generar problemas relacionados con la autoridad, la confiabilidad y la originalidad de los contenidos.
La falta de reconocimiento de las fuentes originales por parte de ChatGPT puede generar problemas de autoridad y tráfico a los sitios que crearon el contenido original. Esto podría llevar a la desaparición de verdaderas fuentes de información y opiniones y a una proliferación de contenido repetitivo, sin valor, sin contraste y sin opinión en la red.
Para evitar que ChatGPT rastree el contenido de tu sitio web, puedes añadir una directriz en tu archivo robots.txt que impida el acceso al agente de usuario ChatGPT:
User-agent: OpenAI
Disallow: /
User-agent: ChatGPT-User
Disallow: /
User-agent: ChatGPT
Disallow: /
También puedes permitir el acceso de ChatGPT a ciertos directorios específicos de tu sitio web:
User-agent: ChatGPT-User
Disallow: Allow: /category/noticias/ Allow: /tag/spain/
Además, puedes bloquear el acceso de ChatGPT y OpenAI mediante reglas en el archivo .htaccess:
# Bloquear ChatGPT y todo OpenAI
RewriteEngine on RewriteCond %{HTTP_USER_AGENT} ChatGPT [OR]
RewriteCond %{HTTP_USER_AGENT} ChatGPT-User [OR]
RewriteCond %{HTTP_USER_AGENT} OpenAI RewriteRule .* - [F]
O en el archivo de configuración de NGINX:
# Bloquear ChatGPT y todo OpenAI
if ($http_user_agent ~* (ChatGPT|ChatGPT-User|OpenAI)) { return 403; }
Es importante mencionar que algunas aplicaciones y bots pueden ignorar estas reglas, pero implementar estos códigos en tu sitio web mostrará tu disconformidad con el uso indiscriminado e irrespetuoso de la información por parte de ChatGPT y ayudará a proteger tu contenido original.