Em 2023, a Samsung proibiu o uso de ChatGPT após funcionários colarem código-fonte proprietário no assistente. Em 2024, um levantamento da Cyberhaven mostrou que 11% dos dados colados em ferramentas de IA generativa eram considerados confidenciais pelas próprias políticas das empresas. Em 2025, o número cresceu — e a maioria das organizações ainda não tem visibilidade sobre o que sai.
Isso é Shadow AI: o uso de ferramentas de IA generativa externas com dados corporativos reais, fora de qualquer processo de aprovação ou monitoramento.
Por que isso acontece
A pressão por produtividade é real. Um analista que precisa resumir um contrato de 80 páginas sabe que o ChatGPT faz isso em 30 segundos. Um desenvolvedor que precisa depurar um código legado sabe que o Claude entende o contexto melhor do que a documentação interna.
A alternativa — esperar pela aprovação de uma ferramenta de IA corporativa, passar pelo processo de segurança, aguardar o rollout — pode levar meses. O trabalho precisa ser feito hoje.
O problema não é intenção maliciosa. A esmagadora maioria dos incidentes de Shadow AI é cometida por funcionários produtivos tentando fazer seu trabalho melhor. O risco é sistêmico, não comportamental.
O que realmente sai nos prompts
Dados de pesquisa mostram que os tipos de conteúdo mais frequentemente colados em ferramentas de IA pública incluem:
- Contratos e acordos — para resumo, análise de cláusulas, comparação
- Código-fonte — para depuração, refatoração, explicação
- E-mails e comunicações internas — para rascunho de respostas, análise de tom
- Dados financeiros — para análise de variações, projeções, relatórios
- Dados de clientes — para análise de padrões, preparação de apresentações
- Documentos de RH — para políticas, avaliações, feedback estruturado
Cada um desses tipos contém, potencialmente, dados pessoais (LGPD), segredos comerciais, informações reguladas ou dados de clientes sob contrato.
O que acontece com os dados nos modelos externos
Quando um funcionário cola um dado no ChatGPT ou Claude, o comportamento real depende de como a ferramenta foi acessada:
| Acesso | Política de dados |
|---|---|
| ChatGPT.com (conta pessoal) | OpenAI pode usar para treinamento por padrão |
| ChatGPT.com (conta Teams/Enterprise) | Não usado para treinamento, mas armazenado nos servidores OpenAI |
| API da OpenAI | Não armazenado para treinamento |
| Claude.ai (plano pessoal) | Anthropic pode usar para treinamento |
| Claude.ai (Team/Enterprise) | Não usado para treinamento |
Na prática, a maioria dos funcionários usa a conta pessoal gratuita — sem qualquer garantia sobre armazenamento ou uso dos dados.
Por que bloquear por URL não funciona
A resposta mais comum de equipes de segurança ao Shadow AI é bloquear o acesso a chat.openai.com, claude.ai e similares via proxy ou CASB.
Essa abordagem tem três problemas sérios:
1. Proliferação de interfaces Existem dezenas de interfaces que acessam os mesmos modelos via API. Bloquear a URL oficial não bloqueia o modelo. Ferramentas como Cursor, Copilot no VS Code, extensões de browser, plugins do Notion e integrações do Slack acessam GPT-4 ou Claude sem passar pelas URLs que as equipes de segurança monitoram.
2. Dispositivos pessoais O trabalho remoto significa que parte da atividade ocorre em dispositivos fora do controle corporativo. O CASB não inspeciona o iPhone pessoal com o ChatGPT aberto na mesa de trabalho.
3. Falsa sensação de controle Organizações que bloqueiam as URLs principais frequentemente acreditam que o problema está resolvido. Os funcionários encontram alternativas; o monitoramento não acompanha.
O que realmente resolve: controle por conteúdo, não por URL
A abordagem efetiva contra Shadow AI não é bloquear ferramentas — é detectar quando dados sensíveis saem da organização, independentemente de como.
Isso requer:
Classificação ativa dos dados Você só pode monitorar a saída de dados sensíveis se souber o que é sensível. Classificação contínua — não pontual — é o pré-requisito.
DLP orientado a conteúdo Soluções de DLP modernas detectam quando dados classificados estão sendo copiados para a área de transferência, independente do destino. Isso funciona mesmo se a ferramenta de destino não for conhecida.
Monitoramento de endpoint Para dados que saem via cópia/cola fora do browser corporativo, o monitoramento precisa estar no endpoint.
Política de uso aceitável com dentes técnicos Uma política que diz “não use ChatGPT com dados da empresa” sem mecanismos de detecção é apenas um documento de compliance — não um controle de segurança.
O cenário LGPD
No Brasil, o uso de dados pessoais de clientes, funcionários ou parceiros em ferramentas de IA externa levanta questões específicas sob a LGPD:
- O titular foi informado de que seus dados poderiam ser enviados a um processador externo de IA?
- Existe base legal para esse tratamento?
- O controlador tem evidência de onde os dados foram e em quais sistemas foram processados?
A ANPD ainda está desenvolvendo orientações específicas sobre IA, mas o princípio da finalidade e da necessidade já se aplicam. Dados de clientes colados no ChatGPT para uma finalidade operacional interna provavelmente extrapolam o escopo do consentimento original.
O que fazer agora, em três passos
Passo 1: Diagnóstico real de uso Antes de bloquear, entenda o que está acontecendo. Ferramentas de DLP com visibilidade de endpoint conseguem mapear quais tipos de dados estão sendo copiados e para onde. Esse diagnóstico costuma revelar padrões que surprendem até as equipes de segurança mais experientes.
Passo 2: Ofereça alternativa aprovada A causa raiz do Shadow AI é a falta de ferramentas aprovadas que atendam à necessidade de produtividade. Organizações que implantam Microsoft 365 Copilot (com as devidas precauções de permissão) ou uma instância corporativa de um assistente de IA reduzem dramaticamente o Shadow AI — porque removem a necessidade de usar ferramentas externas.
Passo 3: Monitore output, não só input No longo prazo, o controle de Shadow AI se funde com o controle de IA corporativa: qualquer sistema de IA com acesso a dados corporativos — interno ou externo — precisa ter seu output monitorado. O que o modelo gerou a partir dos seus dados também é dado da sua empresa.
Conclusão
Shadow AI não é um problema de comportamento. É um problema de infraestrutura: as organizações ainda não têm os controles para governar o uso de IA generativa com a mesma maturidade com que governam outros vetores de risco.
A boa notícia é que os mecanismos existem. A classificação de dados, o DLP orientado a conteúdo e a oferta de alternativas aprovadas resolvem a maior parte do problema. O passo inicial é ter visibilidade — e admitir que o bloqueio por URL não é visibilidade.
“Você não pode governar o que não vê. E bloquear uma URL não é ver.”
O diagnóstico DSPM avalia seu nível de visibilidade sobre Shadow AI e outros riscos de IA generativa no ambiente.