Why can someone watching my encrypted LLM traffic still infer what I asked?

Oportunidade

Whisper Leak, disclosed in late 2025, demonstrated that analyzing packet timing and size patterns in encrypted streaming LLM responses classifies prompt topics with greater than 98% precision across 28 major providers. Some providers including OpenAI and Mistral deployed fixes, but those mitigations address token-length patterns only. A separate attack exploits speculative decoding: the number of tokens accepted per decoding step varies with output content, and that signal leaks through even padded connections because padding does not eliminate the acceptance-rate fluctuation. Proposed defenses such as token batching reduce attack accuracy by 50% but do not eliminate it, and random padding imposes up to 8.7x payload overhead with residual leakage. No provider has shipped a complete mitigation for the speculative decoding variant.

Por que importa

Any user querying a streaming LLM from a network that logs traffic is leaking the topic of their query regardless of TLS encryption, including users who believe they are communicating privately with a medical, legal, or financial assistant.

Como avalio a oportunidade

A Pontuação de Oportunidade é minha própria leitura, não uma medição: o quanto dói, com que frequência aparece e o quanto pouco existe para resolvê-lo hoje. Quanto maior, mais vale a pena construir, na minha opinião.

Gravidade8/10

O quanto de dor causa quando aparece.

Frequência8/10

Com que frequência as pessoas realmente se deparam com isso.

Lacuna8/10

O quanto pouco de boas ferramentas existe para isso hoje.

Mais problemas que merecem ser resolvidos

Por que todo aplicativo de IA me esquece no momento em que fecho a aba?

Por que aprender uma nova área ainda depende de saber o que perguntar?

Por que uma pessoa sem especialização não consegue verificar o que uma IA acabou de dizer?

Por que testamos modelos em benchmarks mas os lançamos em produção no achismo?

Por que agentes de IA não têm memória dos próprios erros?

Por que não consigo auditar em que um modelo foi realmente treinado?

← Todos os problemas que merecem ser resolvidos Sobre Anurag →