Última horaMAY 26, 2026EXPOSICIÓN DE DATOS

Investigadores de Google documentaron 11 ataques reales a agentes de IA. ChatGPT. Claude. Copilot. Cursor. Cada uno de ellos violó el mismo principio, y nadie estaba mirando.

Investigadores de Google, la UC San Diego y la Universidad de Wisconsin mapearon once ataques del mundo real a agentes de IA y encontraron algo constante: cada uno de ellos violó el mismo principio de seguridad: el flujo seguro de información. No es una falla del modelo. No es un jailbreak. Es una falla de sistemas.

Los ataques incluyeron la exfiltración de datos desde la app de ChatGPT para macOS, una falla de exfiltración en Claude Code, una vulnerabilidad de exfiltración en Microsoft Copilot y el ataque AgentFlayer a Cursor, desencadenado por un ticket malicioso de Jira. En cada caso, un agente de IA con acceso a herramientas empresariales, memoria, APIs y navegadores fue comprometido, no porque el modelo fuera peligroso, sino porque los sistemas a su alrededor nunca se construyeron para contenerlo.

La conclusión de los investigadores es contundente: las empresas no pueden asegurar a los agentes de IA haciendo más robustos los modelos subyacentes. La seguridad debe imponerse a nivel del sistema. 'El modelo de IA que impulsa al agente debe tratarse como un componente no confiable', escribieron. La comparación: un sistema operativo trata a cada proceso como no confiable. Los sistemas de IA deberían hacer lo mismo.

No lo hacen. Once casos documentados lo prueban. Ninguna supervisión humana detectó ninguno de estos ataques en tiempo real. Ningún humano los detuvo. Los datos salieron del edificio a velocidad de máquina.

HOFFICIALHITL Score

HITL Score26/100

Por qué esto te importa a tiSin tecnicismos — solo lo que significa▸

Investigadores de Google y de dos universidades examinaron los 'asistentes' de IA que las empresas ahora conectan a su correo, sus archivos y sus navegadores web, y encontraron once ataques del mundo real, que golpearon a los grandes nombres en los que la gente confía. Se supone que el asistente es un trabajador útil. En cambio, los atacantes descubrieron que podían deslizarle instrucciones secretas y sacarlo por la puerta llevándose datos privados de la empresa.

El hallazgo contundente: no puedes arreglar esto haciendo a la IA más 'inteligente'. El verdadero problema es que a estos ayudantes les entregaron las llaves de todo —memoria, cuentas, herramientas— y nadie construyó una jaula a su alrededor. Los investigadores dicen que a la IA habría que tratarla como a un desconocido no confiable. Ahora mismo se la trata como a un empleado de confianza.

Entonces, ¿cómo te afecta a ti? Tu banco, tu médico y tu empleador están todos corriendo para conectar estos asistentes a sistemas que contienen tu información. Si un correo o un documento con trampa puede secuestrar en silencio a ese ayudante, tus datos privados pueden salir del edificio a velocidad de máquina, y ningún humano siquiera nota que se van caminando.

🖤 Explicado por Babycakes.

Leer la fuente completa →

Fuente: CSO ONLINE / ARXIV