¿Por qué un documento malicioso puede exfiltrar silenciosamente todo lo que mi asistente sabe sobre mí?

Oportunidad

En junio de 2025, Aim Security reveló EchoLeak, la primera inyección de prompt sin clic documentada que provocó una exfiltración de datos real en un sistema de IA en producción. Un único correo electrónico malicioso hizo que Microsoft Copilot transmitiera datos sensibles de forma silenciosa sin ninguna interacción del usuario. El problema estructural es que los asistentes de IA con memoria persistente y acceso a llamadas de herramientas combinan dos propiedades peligrosas. Acumulan contexto personal y pueden ser inducidos a seguir instrucciones incrustadas en contenido no confiable. Cada nuevo documento, correo electrónico o página web que el asistente lee es una superficie de instrucción potencial. No existe ningún límite de aislamiento entre la memoria que el usuario confía al asistente y las instrucciones que este sigue desde contenido externo, y las propuestas actuales de sandboxing abordan las llamadas a herramientas, pero no el acceso de lectura a la memoria.

Por qué importa

La memoria personal de IA convierte cada documento malicioso en un ataque de robo de expediente dirigido, una nueva clase de ataque sin defensas maduras.

Cómo evalúo la oportunidad

La Puntuación de Oportunidad es mi propia lectura, no una medición: cuánto duele, con qué frecuencia aparece y qué tan poco existe para resolverlo hoy. Un valor más alto significa que creo que vale más la pena construirlo.

Gravedad10/10

Cuánto dolor causa cuando aparece.

Frecuencia7/10

Con qué frecuencia la gente se topa con ello.

Espacio en blanco8/10

Qué tan pocas herramientas buenas existen para ello hoy.

Más problemas que vale la pena resolver

¿Por qué toda aplicación de IA me olvida en el momento en que cierro la pestaña?

¿Por qué aprender una nueva área sigue dependiendo de saber qué preguntar?

¿Por qué una persona sin experiencia no puede verificar lo que una IA acaba de decirle?

¿Por qué probamos los modelos en benchmarks pero los lanzamos a producción guiándonos por la intuición?

¿Por qué los agentes de IA no tienen memoria de sus propios errores?

¿Por qué no puedo auditar en qué fue entrenado realmente un modelo?

← Todos los problemas que vale la pena resolver Sobre Anurag →