ChatGPT y ciberseguridad: ¿hasta dónde llega el riesgo?

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

El lanzamiento de GPT-4 en marzo de 2023 reactivó un viejo debate en los equipos de seguridad: ¿pasa a ser ChatGPT una herramienta seria para los atacantes? El modelo de OpenAI, más rápido y con respuestas mucho más cuidadas que la versión anterior, despertó tanto entusiasmo como recelo. La industria del cibercrimen se subió enseguida al carro y empezó a probarlo para redactar correos, generar fragmentos de código y automatizar conversaciones. La pregunta de fondo era otra: ¿realmente cambia el equilibrio entre atacante y defensor?

La respuesta, vista en perspectiva, es matizada. ChatGPT bajó la barrera de entrada para tareas de escritura, pero no inventó vectores nuevos ni esquivó los controles que ya estaban en el mercado. Donde sí ha movido la aguja es en volumen y verosimilitud. Y eso ha empujado a OpenAI, Microsoft, Google y al resto de fabricantes a reforzar sus propias defensas alrededor de los modelos.

Phishing escrito por IA: más limpio, no más letal

El primer temor fue el más obvio. Si un modelo de lenguaje grande (LLM, por sus siglas en inglés) escribe textos sin faltas de ortografía, los correos de phishing dejarían de delatarse por sus errores. Esa intuición pesaba en titulares y en informes de marketing, pero choca con el modo real en que opera la mayoría de campañas masivas.

Ryan Kalember, vicepresidente ejecutivo de estrategia de ciberseguridad en Proofpoint, lo describía sin filtros en aquel momento: «Hoy por hoy, esa preocupación está exagerada. Muchos correos de phishing no buscan la perfección; se redactan deliberadamente con errores para filtrar a los usuarios menos atentos, que son los que acaban picando». La regla del 80/20 sigue funcionando: a los atacantes les compensa más optimizar el clic que el estilo.

Hay otro detalle técnico. Un correo bien escrito no engaña a un sistema antiphishing moderno, porque la decisión no se toma leyendo el texto. Los filtros analizan cabeceras, reputación del remitente, adjuntos, URLs y comportamiento posterior. ChatGPT puede mejorar el envoltorio, pero no toca la infraestructura del ataque. Esa fue, además, la primera lectura compartida por buena parte de la industria en cuanto se calmó la histeria.

Malware «hecho» con un chatbot: el listón sigue alto

El segundo escenario que circuló por foros de seguridad era más jugoso: usar el chatbot para escribir malware funcional. Hubo demos curiosas, scripts de prueba y bastante ruido en redes. La realidad operativa fue mucho más aburrida.

«El malware producido con ayuda de ChatGPT no esquiva los EDR (Endpoint Detection and Response) ni infecta equipos con más eficacia que las herramientas que ya usan los grupos profesionales», resumía Kalember. Un atacante real necesita algo repetible, fácil de actualizar y barato de mantener. El chatbot no rota infraestructura, no compra dominios, no firma binarios ni administra paneles de control. Cuando un grupo invierte en una operación, lo último que quiere es depender de una caja negra que un día responde y otro filtra la petición.

Distribuir malware tampoco se automatiza con un prompt. Hace falta logística: vendedores de accesos, mulas, hostings desechables, panel de afiliados, soporte 24/7 a clientes en foros rusos o vietnamitas. Eso lo construyen personas y cuesta años. ChatGPT no compite con esa cadena; en todo caso, redacta el correo del afiliado o traduce un manual.

Lo que sí ha cambiado de 2023 a hoy

Tres años después, la foto se ha movido en cosas que en marzo de 2023 todavía eran teoría. Los modelos son más capaces, más baratos y, sobre todo, encajan en agentes que sí pueden encadenar acciones. Ahí es donde aparecen los riesgos nuevos.

Ingeniería social conversacional. Estafas tipo «cerdo carnicero» o falso soporte técnico se sostienen ahora con bots capaces de mantener una conversación en castellano natural durante días.
Inyección de prompts y agentes. Vectores como GeminiJack o ataques contra Microsoft Copilot demuestran que el problema no es escribir mejor el correo, sino convencer al modelo de la víctima para que actúe contra ella.
Volumen. Lo que antes requería un equipo de redactores, ahora lo asume una API por unos céntimos por mil tokens. El suelo de calidad sube y el coste por intento baja.
Contramedidas. El propio sector ha reaccionado: Proofpoint ha vuelto a tirar de la manta sobre los riesgos específicos de los LLM y OpenAI ha lanzado una capa de seguridad avanzada para cuentas de ChatGPT con perfil expuesto.

El balance europeo tampoco invita al optimismo: el auge de la IA ha multiplicado los ciberataques en Europa, según los datos consolidados de 2025. Y los informes de previsiones para 2026 ya hablan abiertamente de ciberarmas de IA agéntica y un ransomware 3.0 que sí podría dar problemas serios. En el plano defensivo, fabricantes como Microsoft están metiendo agentes de IA dentro del SOC: Security Copilot ha sumado nuevos agentes para automatizar respuesta a incidentes.

Cómo encaja todo esto en una empresa media

Si la organización ya tenía higiene básica (filtro antiphishing serio, MFA en cuentas críticas, EDR moderno, formación trimestral), ChatGPT no obliga a tirar la estrategia. Sí merece la pena ajustar tres cosas: la formación al usuario debe asumir que los correos van a estar bien escritos; las simulaciones internas tienen que subir el listón; y las políticas de uso de IA generativa necesitan dejar claro qué datos no se pegan en un chat público. El que ignore este último punto está regalando información a un proveedor sin saberlo.

El veredicto de aquel debate de 2023, leído desde 2026, queda claro: ChatGPT no fue el game-changer ofensivo que algunos vendían, ni la amenaza terminal que otros pintaban. Subió un punto el listón en redacción y ha empujado al sector a tomarse en serio cómo se integran los modelos en producto. La amenaza real no era un chatbot, sino lo que vendría detrás.

Preguntas frecuentes

¿ChatGPT puede escribir un correo de phishing convincente?

Puede mejorar la redacción y la traducción a varios idiomas, sí. Pero un correo bien escrito no basta para superar un filtro moderno: se evalúan reputación del dominio, cabeceras, adjuntos y URLs. El texto es solo una parte pequeña del problema.

¿Sirve ChatGPT para crear malware?

Para fragmentos sencillos, sí. Para malware operativo capaz de evadir EDR, persistir en la red y comunicarse con C2 propios, no aporta nada que un grupo profesional no tenga ya en su arsenal. Sus filtros además bloquean buena parte de las peticiones explícitas.

¿Hay riesgos nuevos por usar ChatGPT en la empresa?

El principal es la fuga de información: contratos, código, datos personales o secretos industriales pegados en el chat sin reparar en que pasan por servidores de un tercero. Hay que sumar los ataques por inyección de prompts cuando el modelo se conecta a herramientas y datos internos.

¿Qué medidas mínimas debería adoptar un equipo de seguridad?

Política clara de uso de IA generativa, formación al usuario asumiendo correos sin faltas, simulaciones de phishing más exigentes, MFA en cuentas críticas y revisión de qué datos se exponen al integrar LLM en flujos internos.

¿Esta amenaza ha crecido desde 2023?

El abuso ha aumentado en volumen y verosimilitud, pero el cambio cualitativo viene por los agentes de IA y los ataques contra ellos, no por el chatbot público. Los proveedores ya están moviendo ficha con capas de seguridad específicas para cuentas y modelos.