IA Generativa

IA generativa na empresa com segurança: guia prático para 2026

A IA generativa mudou o que é possível na empresa. Também mudou o risco. Este guia mostra como capturar o valor sem entregar dados sensíveis para um provedor público.

Equipe de Engenharia · Escala Sistemas18 de novembro de 202612 min de leitura

Rack de servidor local em um escritório iluminado, próximo a uma mesa com caderno aberto

Todo diretor de tecnologia que conheci em 2026 está passando pela mesma cena: alguém do time colou um contrato no ChatGPT para "só resumir", outro alguém subiu um trecho da folha de pagamento para "conferir cálculo", e um estagiário bem intencionado colou o código-fonte de um módulo interno para "melhorar a função". Nenhum agiu de má fé. Todos entregaram dado estratégico para uma API pública.

IA generativa não é o problema. O problema é adotar IA generativa sem uma decisão de arquitetura clara. Sem essa decisão, cada colaborador cria a própria política, e ela costuma ser: usar a ferramenta grátis que funciona. É assim que vazamento acontece hoje.

Este texto mostra como uma empresa séria implementa IA generativa em produção: quais dados podem ir para nuvem pública, quais precisam ficar dentro de casa, como escrever uma política de uso que a equipe respeite e como escolher entre modelo aberto rodando local, provedor com contrato empresarial ou uma arquitetura híbrida.

Os três riscos reais (e por que o CFO deveria ouvir)

Não vou falar de risco genérico. Vou nomear três que já custaram dinheiro a empresas brasileiras no último ano:

Vazamento de dado estratégico. Prompt colado em ferramenta pública pode ser usado para treinar o modelo, para debug do provedor, ou simplesmente ficar armazenado em log. Uma vez fora, não volta. Empresas de M&A já foram descobertas negociando aquisição porque o texto do memorando apareceu em resposta a outro usuário.
Custo por token descontrolado. Uma equipe de 30 pessoas usando GPT-4 no dia a dia chega fácil a R$ 40 mil/mês em conta em dólar. Sem governança, esse número dobra em 90 dias.
Exposição a LGPD. Dado pessoal enviado para provedor sediado fora do Brasil, sem base legal e sem contrato de operador, é violação direta do artigo 33. Multa pode chegar a 2% do faturamento, com teto de R$ 50 milhões por infração.

O erro mais comum que vi em 2026

Diretoria acha que "banimos o ChatGPT no firewall" resolve. Não resolve. Colaborador usa 4G do celular, cola print, ou paga R$ 100 do próprio bolso para ter a ferramenta. Bloqueio sem alternativa vira sombra de TI (shadow IT).

A matriz de decisão: o que vai para nuvem pública, o que fica em casa

A pergunta certa não é "usamos IA ou não". É: este dado específico pode sair da empresa? Divida os dados em três camadas.

Camada	Exemplos	Onde pode processar
Público	Texto de marketing, blog, FAQ público, código open source	Qualquer provedor. Sem restrição.
Interno	Ata de reunião, documentação de processo, e-mail comercial genérico	Provedor com contrato empresarial (OpenAI Enterprise, Anthropic Business, Azure OpenAI) e cláusula de não uso para treino.
Restrito	Contrato, folha, código-fonte proprietário, dado de cliente, PII	IA local (LLM open source rodando na sua infraestrutura) ou nuvem privada dedicada.

A partir dessa matriz, você tem uma política aplicável. Não é "não use IA". É "use a IA certa para cada tipo de dado". Isso a equipe entende e cumpre.

Arquitetura recomendada em 2026: híbrida

A arquitetura que mais tem entregado resultado é híbrida. Um único ponto de entrada (proxy interno) roteia cada requisição para o backend certo baseado no tipo de dado e no caso de uso.

Camada 1 (gateway interno): centraliza autenticação, logging, filtro de PII e roteamento. Escrito em Node ou Python, roda em VM ou container próprio.
Camada 2 (modelos): uma instância local rodando Llama 3.3, Mistral ou Qwen 2.5 para dado restrito; uma conta empresarial em OpenAI ou Anthropic para dado interno; e cache Redis na frente para responder o que já foi respondido.
Camada 3 (dados): banco vetorial (Qdrant, pgvector) para RAG (retrieval-augmented generation) sobre a base de conhecimento interna, também em infraestrutura própria.

Essa arquitetura tem duas vantagens não óbvias: você troca o modelo sem trocar o código da aplicação, e você mede o custo real por caso de uso, o que permite otimizar em vez de só apagar incêndio de fatura.

Política de uso: quatro páginas, não quarenta

Política de segurança de 40 páginas ninguém lê. A que funciona tem no máximo quatro e responde quatro perguntas:

Que ferramentas de IA estão aprovadas para uso profissional (e como acessar).
Que tipos de dado nunca podem ser colados em ferramenta externa.
Como pedir aprovação para um caso de uso novo.
Quem contatar quando tiver dúvida (nome, e-mail, canal no Slack).

Complemente com um treinamento de 30 minutos, gravado, obrigatório para todo colaborador que trabalha com dado sensível. Refresque anualmente. Isso, na prática, previne mais vazamento do que qualquer firewall.

Casos de uso que se pagam em 90 dias

Não invente. Comece pelos casos que já se provaram em outras empresas do seu porte:

Resumo de reunião a partir de gravação, com transcrição interna. Devolve 3 a 5 horas por semana por gestor.
Assistente de conhecimento interno (RAG sobre wiki, PDFs, procedimentos). Corta tempo de onboarding de novo colaborador em 40%.
Classificação e triagem de e-mail e ticket, com roteamento automático para a fila certa.
Geração de primeiro rascunho de proposta comercial, contrato modelo, resposta padrão. Aumenta produtividade do comercial em 20 a 30%.
Análise de contrato, com extração de cláusulas de risco e prazos. Rodando local, funciona para o jurídico sem quebrar sigilo.

Nota do engenheiro

Priorize casos com métrica clara antes/depois. "Melhorou" não é ROI. "Fechou proposta em 2 horas em vez de 2 dias" é ROI. Coloque medição no dia zero.

Quando IA local vira obrigação, não escolha

IA local (LLM open source rodando na sua infraestrutura ou em nuvem privada) deixa de ser luxo e vira obrigação quando pelo menos um dos três é verdade:

Você processa dado de saúde, financeiro pessoal ou jurídico com regularidade.
Seu setor tem regulação específica (Banco Central, ANS, CVM) que exige controle de residência do dado.
Você atende cliente que exige, contratualmente, que o dado dele não trafegue por API pública.

Boa notícia: um servidor com uma GPU de nível médio (RTX 4090 ou uma A6000 usada) roda Llama 3.3 70B quantizado com qualidade comparável a GPT-4 para a maioria dos casos internos, com custo mensal (energia + amortização) na casa de R$ 800 a R$ 1.500. Isso se paga em menos de 60 dias comparado à conta em dólar.

Checklist prático

Classifique os dados da empresa em três camadas (público, interno, restrito).
Publique uma política de uso de IA em quatro páginas e faça treinamento de 30 minutos.
Contrate provedor empresarial com cláusula de não uso para treino para dado interno.
Prove um caso de uso com IA local (RAG interno) antes de expandir.
Monte um gateway interno que centralize logging, filtro de PII e custo por caso de uso.
Reveja a política a cada seis meses. IA muda rápido, sua política precisa acompanhar.

Perguntas frequentes

IA local substitui totalmente APIs públicas?+

Não precisa substituir. O modelo híbrido é o mais eficiente: local para dado restrito, provedor empresarial para dado interno. A escolha por caso de uso, não uma decisão binária.

Qual o investimento inicial em IA local?+

Para uma empresa de 50 a 200 colaboradores, entre R$ 40 e R$ 120 mil no primeiro ano (hardware, integração, treinamento). Payback típico entre 6 e 12 meses.

Modelo local tem a mesma qualidade do GPT-4?+

Para tarefas internas específicas (RAG sobre base própria, resumo, classificação), sim. Para raciocínio de fronteira em domínio muito aberto, ainda perde. A boa notícia é que essa distância diminui a cada trimestre.

Como fica LGPD se o modelo local aprende com dados nossos?+

Modelos que você roda internamente não "aprendem" no uso normal (inferência é read-only). Se você fizer fine-tuning, o dado usado precisa ter base legal e o modelo resultante precisa entrar no seu inventário de tratamento.

Preciso de time interno para operar IA local?+

Não necessariamente. É perfeitamente viável terceirizar operação (MLOps as a service) com um parceiro técnico, mantendo a infraestrutura na sua conta de nuvem ou no seu datacenter.

Quer usar IA generativa sem colocar a empresa em risco?

Fazemos o diagnóstico da sua stack, mapeamos onde IA gera valor real e propomos uma arquitetura em conformidade com LGPD, com custo previsível e sem lock-in.

Solicitar diagnóstico

Continue lendo

IA Local

Por que empresas estão migrando do ChatGPT público para IA interna

LGPD

LGPD para empresas: guia prático de adequação sem paralisar a operação

Agentes de IA

Como criar um agente de IA empresarial em 6 passos (sem virar POC eterno)