Medina Osório Advogados - O BANCO NACIONAL DE DADOS DO CNMP NA ERA DA COMPLEXIDADE INVESTIGATIVA: FUNDAMENTOS CONSTITUCIONAIS, ESTATÍSTICOS E ALGORÍTMICOS DA RASTREABILIDADE PENAL

Resumo
Este ensaio examina a necessidade institucional de um Banco Nacional de Dados sob governança do Conselho Nacional do Ministério Público (CNMP), concebido como infraestrutura de rastreabilidade, coerência e autocrítica na persecução penal. Sustenta-se que a titularidade privativa da ação penal pública, o controle externo da atividade policial e o poder investigatório do Ministério Público, quando interpretados no contexto da Era Digital, pressupõem condições materiais de inteligibilidade que não se realizam sem bases estruturadas, padronização semântica e auditabilidade sistêmica. Na investigação orientada por dados, a eficiência e a integridade do sistema de justiça penal dependem de metodologia uniforme de coleta, normalização, resolução de identidade e registro de trilhas decisórias e de acesso. O artigo demonstra — a partir de evidências comparadas extraídas da literatura especializada nacional e internacional — que o cenário brasileiro atual é marcado por fragmentação severa: vinte e sete sistemas distintos de estatísticas criminais, ausência de padrão semântico nacional, recusa de estados em compartilhar microdados e episódios documentados de vulnerabilidade dos bancos de dados a atores criminosos. Propõe-se, assim, um modelo de "unidade informacional" do Ministério Público, que não substitui bancos nacionais do Executivo (nem pretende absorver bancos estaduais), mas organiza o núcleo de dados do MP e estabelece interoperabilidade governada com sistemas externos, conforme padrões de qualidade, segurança e governança algorítmica. A proposta é contextualizada à luz da Lei Geral de Proteção de Dados (LGPD — Lei 13.709/2018), da Resolução CNMP 318/2025 (BDP/MP), da Portaria MJSP 1.123/2026 (Sinic) e dos marcos normativos internacionais relevantes.
Palavras-chave: Banco nacional de dados — CNMP — Ministério Público — Controle externo — Estatística — Inteligência artificial — Auditabilidade — Rastreabilidade — LGPD — Proteção de dados.
Abstract
This essay discusses the institutional need for a National Data Repository governed by Brazil's National Council of the Public Prosecutor's Office (CNMP), conceived as infrastructure for traceability, coherence, and institutional self-critique in criminal prosecution. It argues that the Prosecutor's exclusive authority to bring public criminal actions, its external oversight of police activity, and its investigative powers, when interpreted in the Digital Age, require material conditions of intelligibility that cannot be achieved without structured databases, semantic standardization, and systemic auditability. In data-driven investigations, efficiency and integrity depend on uniform methodologies of collection, normalization, entity resolution, and robust trails for access and decision-making. Drawing on comparative evidence from national and international specialized literature, the paper demonstrates that the current Brazilian landscape is characterized by severe fragmentation — twenty-seven distinct criminal statistics systems, absence of national semantic standards, states refusing to share microdata, and documented episodes of database vulnerability to criminal actors. The paper proposes an informational unity model for the Public Prosecutor's Office, which does not replace Executive-branch national databases nor absorb state police databases, but organizes the Prosecutor's own core data and enables governed interoperability with external systems under quality, security, and AI governance standards. The proposal is contextualized in light of Brazil's General Data Protection Law (LGPD — Law 13,709/2018), CNMP Resolution 318/2025 (BDP/MP), Ministry of Justice Ordinance 1,123/2026 (Sinic), and relevant international normative frameworks.
Keywords: National data repository — CNMP — Public Prosecutor — External oversight — Statistics — Artificial intelligence — Auditability — Traceability — Data protection — LGPD.
Sumário
1 Introdução — 2 Controle externo, ação penal e poder investigatório: o tripé constitucional da rastreabilidade — 3 A investigação como fenômeno informacional: quando eficiência depende de linguagem e método — 4 Banco nacional do CNMP e bancos nacionais do Executivo: distinções necessárias — 5 Transparência métrica na persecução penal: estatística como escuta institucional — 6 Padronização algorítmica e auditabilidade: da busca ao grafo — 7 Infraestrutura pública de dados, convênios interinstitucionais e soberania informacional — 8 Proteção de dados pessoais e salvaguardas na persecução penal — 9 Conclusão: uma nova arquitetura de controle externo — 10 Referências bibliográficas — 11 Referências legislativas
1. Introdução
A Constituição de 1988 consagrou um conjunto de garantias clássicas — publicidade, transparência, fundamentação, devido processo legal, contraditório, ampla defesa — que, historicamente, foram lidas como exigências orientadas ao ato decisório final: a sentença, o acórdão, o ato administrativo sancionador. A Era Digital deslocou o centro de gravidade desse debate. Hoje, a restrição concreta de direitos, no âmbito penal, frequentemente se materializa antes do julgamento: nas escolhas investigativas, nos critérios de priorização de alvos, na construção de narrativas probatórias, nos registros de inteligência, na seleção do que é buscado e do que é ignorado. Em outras palavras: a decisão, no mundo contemporâneo, é composta por uma cadeia de microdecisões, muitas vezes invisíveis, cuja legitimidade depende de rastreabilidade.
Esse cenário exige reconhecer uma premissa metodológica: não se compreende o que não se consegue reconstruir. A publicidade formal de atos e a transparência clássica já não bastam quando a persecução penal se torna dependente de bases massivas, buscas estruturadas e correlações algorítmicas. Se as informações são fragmentadas, se os registros são semanticamente incompatíveis entre Estados, se não há trilhas de auditoria, a própria racionalidade do sistema perde densidade: a investigação pode produzir resultado, mas não produz inteligibilidade; pode gerar ação penal, mas fragiliza a capacidade de revisão crítica; pode condenar, mas dissolve a legitimidade do percurso.
O diagnóstico empírico confirma essa premissa com contundência. Pesquisa abrangente sobre a situação das tecnologias de segurança pública nas Unidades da Federação brasileiras revelou que doze estados sequer utilizam tecnologias disruptivas e outros nove não responderam a pedidos de informação durante a pesquisa. O Anuário Estatístico de Segurança Pública 2023-2024, elaborado conjuntamente pelo Ipea e pela Secretaria Nacional de Segurança Pública (Senasp/MJSP), é ainda mais preciso: o Brasil conta com vinte e sete sistemas distintos de estatísticas criminais apenas entre as polícias civis, e o país "segue sem ter um sistema de informações de segurança pública estruturado, com dados confiáveis". O vácuo regulatório é igualmente documentado: a Lei Geral de Proteção de Dados (LGPD — Lei nº 13.709/2018) prevê, em seu art. 4º, exceção para atividades de segurança pública e persecução penal, mas essa exceção, na ausência de lei específica que a discipline, transforma-se em zona de opacidade, dificultando o controle e a transparência sobre como os dados são tratados pelos órgãos estatais.
Nesse contexto, importa observar o papel do Conselho Nacional do Ministério Público (CNMP) que, segundo sua própria definição oficial, executa a fiscalização administrativa, financeira e disciplinar do Ministério Público no Brasil e de seus membros, respeitando a autonomia da instituição. O órgão, criado em 30 de dezembro de 2004 pela Emenda Constitucional nº 45, teve sua instalação concluída em 21 de junho de 2005, com sede em Brasília-DF. Formado por 14 membros que representam setores diversos da sociedade, o CNMP tem como objetivo imprimir uma visão nacional ao MP, o que é decorrência do princípio constitucional da unidade institucional.
Ao Conselho cabe orientar e fiscalizar todos os ramos do MP brasileiro: o Ministério Público da União (MPU), composto pelo Ministério Público Federal (MPF), Ministério Público Militar (MPM), Ministério Público do Trabalho (MPT) e do Distrito Federal e Territórios (MPDFT); e o Ministério Público dos Estados (MPE).
Presidido pelo procurador-geral da República, o Conselho é composto por quatro integrantes do MPU, três membros do MPE, dois juízes indicados um pelo Supremo Tribunal Federal e outro pelo Superior Tribunal de Justiça, dois advogados indicados pelo Conselho Federal da Ordem dos Advogados do Brasil, e dois cidadãos de notável saber jurídico e reputação ilibada, indicados um pela Câmara dos Deputados e outro pelo Senado Federal.
Antes da posse no CNMP, os nomes apresentados são apreciados pela Comissão de Constituição e Justiça e de Cidadania (CCJ) do Senado Federal, depois vão ao Plenário do Senado e seguem para a sanção do presidente da República.
Pautado pelo controle e pela transparência administrativa do MP e de seus membros, o CNMP é uma entidade aberta ao controle social e às entidades brasileiras, que podem encaminhar reclamações contra membros ou órgãos do MP, inclusive contra seus serviços auxiliares.
Tais princípios devem ser interpretados em harmonia com os princípios da eficiência, impessoalidade, legalidade, devido processo legal, economicidade, moralidade administrativa, interdição à arbitrariedade dos poderes públicos e direito à compreensão acerca dos conteúdos das decisões tomadas pelas autoridades públicas.
A implementação da unidade institucional do Ministério Público, na esfera criminal e no combate à criminalidade violenta e organizada, envolve o controle nacional do exercício do poder investigatório da instituição e o controle externo das polícias de modo integrado e harmônico, através de um planejamento estratégico e articulado nacionalmente.
É nesse ponto que a arquitetura constitucional do Ministério Público ganha centralidade. O CNMP deve velar pela unidade institucional na gestão da inteligência do Ministério Público brasileiro e sobretudo essa gestão deverá surtir um primeiro grande impacto na segurança pública e nas investigações criminais em todo o território nacional. O Ministério Público não é apenas o titular privativo da ação penal pública (art. 129, I, da Constituição Federal), mas também exerce o controle externo da atividade policial (art. 129, VII), além de deter poderes de requisição e, no horizonte jurisprudencial consolidado pelo Supremo Tribunal Federal (RE 593.727, Tema 184), poderes investigatórios compatíveis com a Constituição, desde que sob garantias. O tripé acusação–controle–investigação coloca o MP numa posição inevitável: ele é destinatário e fiscal do produto investigativo. Todavia, destinatário e controlador só podem operar em ambiente de dados se dispuserem de infraestrutura adequada. A ausência dessa infraestrutura produz uma contradição essencial: o MP carrega responsabilidades constitucionais crescentes, mas herda um universo informacional disperso, heterogêneo e frequentemente opaco.
Daí decorre a hipótese deste ensaio: o controle externo, embora não seja hierárquico, possui natureza conformativa no mundo digital. Ele conforma o mínimo de registrabilidade, auditabilidade e padronização semântica exigível para que a atividade policial seja controlável, comparável e corrigível, e para que a titularidade da ação penal se exerça com coerência nacional. Nessa perspectiva, o Banco Nacional de Dados do CNMP surge como infraestrutura do próprio Ministério Público: núcleo de memória institucional, base de padronização e ponte de interoperabilidade governada com sistemas externos.
É essencial, contudo, delimitar o objeto para evitar equívocos. O Banco Nacional do CNMP não pretende substituir bancos nacionais do Poder Executivo. O Ministério da Justiça e Segurança Pública (MJSP) instituiu o Sistema Nacional de Informações Criminais (Sinic), pela Portaria nº 1.123/2026, como base oficial de consolidação e disponibilização de informações criminais. O ambiente legislativo recente — assentado na Lei do SUSP (Lei nº 13.675/2018) — igualmente desenha bancos nacionais temáticos no enfrentamento ao crime organizado, com lógica federativa de interoperabilidade. O Banco do CNMP tem vocação própria: organizar o núcleo de dados do Ministério Público e permitir interoperabilidade controlada, auditável e finalística — sem absorção indiscriminada de bancos policiais estaduais.
2. Controle externo, ação penal e poder investigatório: o tripé constitucional da rastreabilidade
O controle externo não é comando administrativo. Essa afirmação, embora correta, costuma ser mal utilizada: como se a ausência de hierarquia implicasse ausência de potência institucional. Na Era Digital, ocorre precisamente o contrário. Quando a atividade policial se materializa em sistemas, registros e cadeias informacionais, o controle externo precisa incidir sobre aquilo que torna a atividade verificável: registros mínimos, integridade dos metadados, rastreabilidade de alterações, preservação de versões, padronização mínima de remessa e capacidade de reconstruir decisões investigativas.
A titularidade privativa da ação penal pública impõe ao MP a responsabilidade por organizar a acusação com base em prova compreensível e criticável. Isso exige, de maneira crescente, que os atos investigativos cheguem ao MP acompanhados de metadados essenciais e de trilhas que permitam aferição posterior. Cada peça de um inquérito policial encaminhado ao Ministério Público carrega, na era digital, metadados implícitos — carimbos temporais, identificadores de terminais, logs de acesso, histórico de alterações — que, quando preservados, permitem aferir a integridade probatória, e, quando suprimidos ou corrompidos, inviabilizam o controle.
A investigação, por sua vez, não pode ser concebida como "caixa-preta" administrativa: ela é o campo onde direitos fundamentais se tensionam cotidianamente. O controle externo ganha densidade quando se converte em exigência de auditabilidade, e essa auditabilidade, em ambiente informacional, é sempre um fenômeno de padrão. Sistemas de análise forense que aplicam modelos de linguagem de grande escala (Large Language Models — LLMs) a evidências extraídas de dispositivos móveis — como o framework desenvolvido pela Agência Nacional de Polícia da Coreia do Sul — demonstram que a estruturação mínima de metadados é condição de validade epistêmica: sem identificação precisa de remetente, destinatário, carimbo temporal e contexto de conversação, a evidência digital perde a cadeia de custódia que a torna utilizável na persecução.
A dimensão interorganizacional desse desafio é igualmente relevante. No Brasil, as competências investigativas são distribuídas entre polícias civis, polícia federal, polícia militar (em alguns estados), e o próprio Ministério Público — com atribuições partilhadas que historicamente geram distorções na produção e no compartilhamento de inteligência. A ausência de um modelo estruturado de inteligência orientada por dados — como o Intelligence-Led Policing (ILP) praticado no Reino Unido (National Intelligence Model) e adotado como diretriz pelo Subsistema de Inteligência de Segurança Pública (SISP) no Brasil — resulta em patrulhamento baseado em intuição, taxas de resolução de casos historicamente baixas e incapacidade de detecção de redes criminosas com atuação interestadual.
3. A investigação como fenômeno informacional: quando eficiência depende de linguagem e método
A ineficiência investigativa no Brasil não se explica apenas por escassez de recursos humanos ou tecnológicos. Ela se explica, em parte significativa, pela ausência de linguagem comum entre bases de dados. A investigação orientada por dados depende de encontrar relações entre registros dispersos — pessoas, endereços, veículos, armas, vínculos societários, comunicações, georreferências. Quando cada Estado registra em idioma próprio, o sistema nacional não enxerga redes — enxerga fragmentos.
Esse fenômeno produz um paradoxo: digitaliza-se a investigação, mas preserva-se a lógica analógica do registro. As consequências são previsíveis: a busca não funciona, a correlação é precária, os homônimos proliferam, a duplicidade se instala, e a análise estatística perde validade. A qualidade do dado deixa de ser detalhe técnico e passa a ser requisito de eficiência e de legitimidade.
O Anuário Estatístico de Segurança Pública 2023-2024 documenta esse paradoxo com precisão: a maioria dos estados usa sistemas próprios de coleta (como o RAI em Goiás, o SROP em Mato Grosso e o Millenium no Distrito Federal) e depois exporta planilhas ou emprega ferramentas de Business Intelligence para repassar dados estatísticos ao governo federal via Sinesp VDE. Alguns estados recusam enviar microdados alegando barreiras ligadas à LGPD "de forma inadequada", comprometendo a validade estatística e, por extensão, a racionalidade das políticas públicas fundadas nesses dados.
A pesquisa internacional sobre tecnologias disruptivas em segurança pública oferece contraste instrutivo. A plataforma SafetySmart, operada pela SoundThinking, Inc. nos Estados Unidos, processa mais de 1,3 bilhão de registros estruturados e não estruturados de múltiplas jurisdições por meio de um motor de busca federada, o CrimeTracer, que permite "acessar e cruzar informações cruciais de várias agências de TI através de cidades, condados, estados e de todo o país". O módulo CaseBuilder estrutura digitalmente todas as informações do caso em formato unificado, eliminando processos manuais e sistemas isolados. A comparação não é uma recomendação de privatização da inteligência criminal — modelo que suscita sérias objeções de soberania informacional e controle democrático, como se discute mais adiante —, mas uma demonstração de que a padronização semântica e a busca federada são tecnicamente viáveis e operacionalmente transformadoras.
No nível da microanálise probatória, pesquisas recentes demonstram que a estruturação de metadados de mensagens extraídas de smartphones — com campos padronizados de remetente, destinatário, carimbo temporal, identificador de sala de bate-papo e tipo de mensagem — permite que modelos de linguagem automatizem a leitura, a compreensão de contexto e a extração de evidências criminais ocultas, reduzindo drasticamente o tempo necessário para análise de volumes massivos de dados em prazos processuais rígidos. O estudo italiano sobre Grafos de Conhecimento e NLP aplicados à análise de mensagens de investigações reais de fraude e corrupção aponta na mesma direção: a estruturação de metadados (lista de participantes, horários, remetentes, anexos, entidades identificadas por NER — Reconhecimento de Entidades Nomeadas) é pré-condição para que investigadores extraiam insights sem ler manualmente todo o material apreendido.
A "IA contestável" — conceito proposto por pesquisadores alemães da Universidade Federal da Bundeswehr de Munique — vai além: propõe que sistemas de análise de inteligência criminal sejam não apenas explicáveis, mas contestáveis, permitindo ao investigador humano questionar, corrigir e refinar os outputs algorítmicos por meio de modelagem semântica e supervisão humana estruturada. Esses desenvolvimentos convergem para uma mesma conclusão: a qualidade do dado de entrada — sua completude, padronização semântica, rastreabilidade e integridade — determina o teto de qualidade da análise de saída, seja ela feita por humanos ou por algoritmos.
4. Banco nacional do CNMP e bancos nacionais do Executivo: distinções necessárias
A Resolução CNMP nº 318/2025 institui a Base de Dados Processuais do Ministério Público (BDP/MP) e estabelece regras de tratamento, governança e utilização. Trata-se do núcleo institucional do Banco Nacional do CNMP: dados processuais e extrajudiciais do MP, organizados sob padrão nacional e governança própria. A base justifica-se pela natureza constitucional do MP como titular da ação penal e fiscal do ordenamento jurídico: sem memória institucional estruturada, o exercício dessas funções é sistematicamente dependente de informações produzidas por terceiros — o que compromete tanto a independência funcional quanto a qualidade da persecução.
O Sinic, por sua vez, foi instituído pelo MJSP, pela Portaria nº 1.123/2026, como base oficial de consolidação e disponibilização de informações criminais — indiciamentos, denúncias e condenações — com vocação de se tornar a "fonte única" para emissão da Certidão Nacional Criminal e da Folha de Antecedentes Criminais, substituindo progressivamente os sistemas fragmentados de tribunais, polícias civis e institutos de identificação das Unidades da Federação. O ecossistema do SUSP (Lei nº 13.675/2018) fornece a moldura legal para integração nacional de dados de segurança pública, com o Sinesp como sistema de referência para as estatísticas policiais.
Assim, o Banco do CNMP deve ser desenhado como: (i) base nacional do MP (núcleo), compreendendo os dados processuais e extrajudiciais produzidos pelo Ministério Público em todas as esferas; (ii) interoperabilidade governada com bases federais e estaduais (ponte), mediante protocolos técnicos, acordos de compartilhamento e trilhas de auditoria; e (iii) camada analítica e estatística (inteligência institucional), que permita ao CNMP exercer sua função de planejamento, avaliação e controle sobre a persecução penal. A legitimidade do projeto depende justamente dessa distinção: não duplicar, não absorver indiscriminadamente, mas integrar com governança.
A distinção entre controlador e operador, nos termos da LGPD (Lei nº 13.709/2018), é aqui essencial. O CNMP, como controlador público dos dados da BDP/MP, define as finalidades e os meios de tratamento; as polícias e demais órgãos que alimentam o sistema operam como fontes; e eventuais empresas de tecnologia contratadas para desenvolver conectores estaduais e normalizar dados atuam como operadoras técnicas, subordinadas às instruções do controlador e sujeitas a auditorias periódicas. Essa arquitetura de responsabilidade é condição de conformidade com o art. 23 da LGPD, que impõe ao Poder Público o dever de publicar suas regras de tratamento e de indicar o encarregado (DPO — Data Protection Officer).
O Sinic incorpora, como diretriz normativa expressa, registros de pessoas condenadas por integrar organizações ou facções criminosas — o que densifica a inteligência criminal contra o crime organizado de âmbito nacional. A experiência da Rede Integrada de Bancos de Perfis Genéticos (RIBPG), que já acumula mais de 254 mil perfis genéticos em arquitetura federada (23 bancos estaduais conectados ao Banco Nacional de Perfis Genéticos — BNPG), demonstra que essa interoperabilidade é tecnicamente viável e institucionalmente sustentável. O modelo da RIBPG — com padrão técnico definido em Manual de Procedimentos Operacionais, software padronizado (CODIS) e conectividade à base da INTERPOL — oferece um template para o Banco do CNMP: arquitetura federada, padrão técnico centralizado, governança pública e auditabilidade externa.
5. Transparência métrica na persecução penal: estatística como escuta institucional
Na persecução penal, a estatística não deve ser reduzida a relatórios anuais ou contagem de ocorrências. Na Era da complexidade, estatística é a forma científica de escuta institucional: identifica padrões, revela anomalias, detecta desigualdades e permite autocrítica. Essa função só é possível com dados comparáveis e com qualidade aferível.
O Anuário Estatístico de Segurança Pública 2023-2024 documenta que o crime organizado (como PCC e CV) atua fortemente em regiões de fronteira (Norte e Centro-Oeste), utilizando rotas transnacionais para escoamento de drogas e armas, mas "não existe, atualmente, uma iniciativa federal ou banco de dados único e consolidado que integre as diversas instituições (Senappen, CNJ, Polícia Federal, Coaf, Abin) para um diagnóstico abrangente do crime organizado". A ausência de uma base integrada força os pesquisadores a construírem proxies — marcadores indiretos — utilizando as bases existentes (Sinesp), como a razão entre homicídios consumados e tentados, apreensões de armas de grosso calibre e taxas de óbitos intencionais dentro do sistema prisional.
Ganham relevância, aqui, os frameworks internacionais de qualidade estatística. O Data Quality Assessment Framework (DQAF) do FMI e os Princípios Fundamentais das Estatísticas Oficiais das Nações Unidas (Resolução ONU 68/261) consagram integridade, confiabilidade, confidencialidade e uso responsável como condições de confiança pública. Esses princípios têm implicação direta para o Banco do CNMP: (i) o Princípio 6 da ONU determina que dados individuais coletados por agências estatísticas devem ser "estritamente confidenciais e usados exclusivamente para fins estatísticos", o que impõe uma separação estrutural entre a camada analítica agregada do banco e os dados processuais individuais, com controles de acesso diferenciados; (ii) o Princípio 8 prescreve que "a coordenação entre agências estatísticas dentro dos países é essencial para alcançar consistência e eficiência no sistema estatístico", justificando o papel do CNMP como coordenador nacional da estatística do Ministério Público; e (iii) o Princípio 9 defende a padronização internacional de conceitos e classificações, orientando as escolhas de schema e de ontologia jurídica para o sistema.
A pesquisa sobre policiamento preditivo no Brasil revela que os estados e municípios têm adotado uma "autorregulamentação" na aplicação de algoritmos, "sujeitando a segurança pública a falhas metodológicas, discricionariedade governamental, vazamento de dados e viés discriminatório". Essa autorregulamentação fragmentária compromete não apenas a eficiência investigativa, mas a legitimidade das estatísticas produzidas: quando o algoritmo de um estado é alimentado com dados que "retratam a seletividade própria do sistema de segurança pública e de justiça criminal", as inferências estatísticas amplificam o viés em vez de corrigi-lo. O Tribunal de Contas do Estado de São Paulo, ao auditar o sistema Detecta, constatou "conflitos entre sistemas operacionais, falta de infraestrutura e treinamento", o que ilustra que a ausência de governança estruturada afeta tanto a validade operacional quanto a confiabilidade estatística dos dados.
Um episódio documentado ilustra, com dramaticidade, o risco da ausência de governança: em 2023, uma investigação da Polícia Federal revelou que o PCC (Primeiro Comando da Capital) conseguiu acessar o sistema de câmeras do Detecta, utilizando o banco de dados estatal para monitorar uma viatura descaracterizada da Polícia Civil em meio a um plano de assassinato. O episódio demonstra que bancos de dados de segurança pública sem controles adequados de acesso, autenticação, monitoramento de anomalias e gestão de vulnerabilidades podem ser instrumentalizados pela própria criminalidade organizada — convertendo-se de ferramenta de proteção em vetor de ameaça.
6. Padronização algorítmica e auditabilidade: da busca ao grafo
A padronização algorítmica não significa impor um software único aos Estados. Significa impor propriedades mínimas: (i) schema canônico versionado — estrutura de dados com campos e tipos definidos, controlada por versão para garantir retrocompatibilidade; (ii) dicionário semântico — vocabulário controlado de termos jurídicos e criminológicos que assegura que o mesmo fenômeno seja descrito da mesma forma em todos os sistemas; (iii) regras de resolução de identidade — algoritmos que identificam se dois registros referem-se ao mesmo indivíduo, entidade ou evento, eliminando duplicidades e homônimos; (iv) logs imutáveis — registros de acesso e operação que não podem ser alterados retroativamente, essenciais à cadeia de custódia digital; (v) trilhas de transformação (data lineage) — rastreamento de todas as transformações sofridas pelo dado desde a coleta até o uso analítico; e (vi) métricas de qualidade por fonte e por UF — indicadores mensuráveis de completude, consistência, precisão e atualidade.
A governança de riscos de IA, como enfatiza o NIST AI RMF 1.0 (Artificial Intelligence Risk Management Framework), parte da premissa de que riscos emergem da interação entre componentes técnicos e fatores sociais e institucionais, exigindo documentação, controle e gestão contínua. O framework organiza a governança de sistemas de IA em quatro funções — Govern (governar), Map (mapear), Measure (medir) e Manage (gerenciar) —, aplicáveis diretamente ao ciclo de vida dos algoritmos utilizados na busca, correlação e análise de dados criminais.
O AI Act europeu (Regulamento (UE) 2024/1689) consagra obrigações de gestão de riscos, transparência e governança especialmente relevantes quando sistemas impactam direitos fundamentais e atividades de enforcement. O regulamento classifica sistemas de IA voltados à aplicação da lei como de alto risco, exigindo avaliação de impacto sobre direitos fundamentais antes da implantação, supervisão humana estruturada, testes de precisão e avaliação de disparidades demográficas. Embora seja norma de direito europeu, o AI Act funciona como parâmetro de referência para a governança de sistemas similares no Brasil, especialmente diante da ausência de legislação específica para IA aplicada à segurança pública.
O Relatório Final do Departamento de Justiça dos Estados Unidos sobre IA e Justiça Criminal (2024) — elaborado em cumprimento à Seção 7.1(b) da Executive Order 14.110 (revogada em 20 de janeiro de 2025 pelo Presidente Trump, sem prejuízo dos documentos produzidos em sua vigência) — aponta que ferramentas de IA usadas para "identificar suspeitos criminais, prever crimes, aplicar técnicas de forense digital, monitorar redes sociais ou rastrear localização física de indivíduos" devem ser submetidas a avaliações de impacto (AI Impact Assessments) e práticas estruturadas de gerenciamento de risco, com procedimentos para auditar os dados de entrada e evitar ciclos de feedback discriminatórios. O Memorando M-25-21 da Casa Branca (OMB, 2025) reforça essa orientação, determinando que Diretores de IA e Diretores de Dados coordenem critérios de interoperabilidade entre agências e invistam em "ativos de dados de qualidade, infraestrutura de tecnologia e governança na coleta, curadoria e preparo da informação".
Esses marcos ajudam a dar densidade contemporânea ao argumento central: bancos de dados e algoritmos não são apenas ferramentas; são infraestruturas de poder que exigem auditabilidade. A Recomendação da UNESCO sobre a Ética da Inteligência Artificial (2021) é explícita ao proibir o uso de IA para "pontuação social ou vigilância em massa" e ao exigir que sistemas implantados por Estados para aplicação da lei se submetam a mecanismos independentes de supervisão, garantindo que os dados de treinamento "não reforcem preconceitos, desigualdades ou discriminação".
No plano técnico, a arquitetura de grafo de conhecimento (Knowledge Graph) — como proposta no sistema baseado em Neo4j para análise de mensagens de investigações criminais — oferece uma alternativa ao modelo relacional clássico para representar a complexidade das redes investigadas: em vez de tabelas, o grafo representa entidades (pessoas, organizações, locais) e suas relações (comunicou-se com, transferiu dinheiro para, apareceu no mesmo local que) com enriquecimento semântico por NER (Named Entity Recognition) e transcrição automática de áudios. O benchmark FEDLEGAL, discutido na literatura de Direito Computacional, propõe o Federated Learning como arquitetura alternativa para treinar modelos de IA em dados jurídicos sensíveis sem centralizar fisicamente os dados — preservando a privacidade das bases distribuídas e, ao mesmo tempo, permitindo aprendizado coletivo.
7. Infraestrutura pública de dados, convênios interinstitucionais e soberania informacional
A viabilização do Banco do CNMP, em escala federativa, pressupõe convênios e protocolos de interoperabilidade com os sistemas estaduais, com o Sinic do MJSP, com o Sinesp e com bases temáticas como a RIBPG. Esses instrumentos devem definir: (a) os tipos de dados objeto de compartilhamento (categoria, finalidade e sensibilidade); (b) as bases jurídicas aplicáveis em cada caso (art. 7º, III ou VI; art. 11, II, f; e art. 23 da LGPD, conforme o dado seja ou não de natureza sensível); (c) as salvaguardas técnicas exigíveis (criptografia em repouso e em trânsito, controle de acesso baseado em função, autenticação multifator, logs de acesso imutáveis); (d) as responsabilidades de cada parte (controlador, cocontrolador ou operador); e (e) os mecanismos de auditoria e prestação de contas.
A empresa eventualmente contratada pelo CNMP deve atuar como operadora técnica, implementando conectores estaduais e normalizando dados para o padrão nacional, sob governança do controlador público. Essa relação deve ser regida por contrato de tratamento de dados (art. 39 da LGPD), com cláusulas de auditorias periódicas, vedação de uso dos dados para finalidades alheias ao contrato, notificação obrigatória em caso de incidente de segurança (art. 48 da LGPD) e encerramento seguro do tratamento ao término do contrato. O modelo não é de privatização da inteligência criminal — que suscita graves objeções de soberania informacional e accountability democrático —, mas de terceirização técnica com responsabilidade pública preservada.
A experiência internacional fornece parâmetros relevantes. O Tribal Law and Order Act norte-americano de 2010 demonstra que a integração de bancos de dados entre entes de diferentes esferas pode ser viabilizada por mecanismos de "acesso gradual", condicionados ao cumprimento de requisitos técnicos e jurídicos. O modelo dos fusion centers americanos — centros onde agências criminais de níveis local, estadual e federal integram e compartilham inteligência — oferece referência para a articulação entre o Banco do CNMP e os centros de inteligência das polícias estaduais e federal.
Na esfera global, a arquitetura da INTERPOL demonstra que bancos de dados de inteligência criminal com alcance transnacional são viáveis sob governança rigorosa: todos os dados compartilhados pelos países-membros "obedecem a padrões internacionais rígidos, possuindo fundamentação legal e recursos de segurança embutidos", com acesso estruturado pelo sistema seguro I-24/7 e capacidade de consulta simultânea às bases nacionais e à base central, em tempo real. Isso reforça que a soberania informacional não é incompatível com a interoperabilidade — desde que o acesso seja controlado, a finalidade seja definida e o dado permaneça sob governança de autoridade pública.
O objetivo do Banco do CNMP não é "copiar tudo", mas criar uma ponte auditável que permita busca e correlação em escala nacional, com preservação de sigilos funcionais e conformidade com a LGPD. Dados de inteligência criminal, comunicações protegidas por sigilo profissional, dados de saúde mental de réus, informações de vítimas de crimes sexuais e dados de testemunhas protegidas requerem tratamento diferenciado, com controles de acesso mais restritivos e finalidades mais estreitamente definidas.
8. Proteção de dados pessoais e salvaguardas na persecução penal
A articulação entre segurança pública e proteção de dados pessoais é um dos nós mais complexos do ordenamento jurídico brasileiro contemporâneo. A LGPD (Lei nº 13.709/2018), em seu art. 4º, III, exclui de seu âmbito de aplicação o tratamento de dados para fins exclusivos de segurança pública, defesa nacional, segurança do Estado e atividades de investigação e repressão de infrações penais — excluindo tais operações de tratamento da incidência geral da lei e remetendo-as a lei específica a ser editada.
Essa exceção, contudo, não equivale a ausência de proteção. Dois argumentos convergentes sustentam essa afirmação. Primeiro, o argumento constitucional: os direitos fundamentais à privacidade (art. 5º, X), à proteção de dados (art. 5º, LXXIX, com a EC nº 115/2022) e ao devido processo legal (art. 5º, LIV) constituem limites intransponíveis mesmo para a persecução penal, independentemente de lei ordinária. Segundo, o argumento sistêmico: a ausência de lei específica não cria um vácuo normativo absoluto, pois incidem sobre a matéria: (i) o Código de Processo Penal (CPP), que disciplina a produção probatória e a integridade das cadeias de custódia; (ii) as resoluções do CNMP sobre manuseio de dados e sigilo funcional; (iii) a Convenção 108+ do Conselho da Europa, da qual o Brasil não é parte, mas que funciona como parâmetro interpretativo para a proteção de dados em contextos de aplicação da lei; e (iv) as diretrizes da UNESCO sobre ética na IA, que impõem salvaguardas específicas para dados relativos a infrações, processos criminais e condenações.
Para fins de aplicação ao Banco do CNMP, os princípios de proteção de dados operam do seguinte modo. O princípio da finalidade determina que cada tipo de dado só pode ser tratado para a finalidade que justificou sua coleta — dado coletado para fins de identificação criminal não pode ser reutilizado para fins de perfilamento comportamental ou vigilância contínua. O princípio da necessidade impõe que o banco colete apenas o mínimo de dados indispensável para as finalidades definidas, vedando a coleta especulativa ou o armazenamento de dados desnecessários. O princípio da adequação exige que o meio de tratamento seja proporcional à finalidade perseguida. O princípio da transparência impõe a publicação das regras de tratamento e a designação de encarregado de dados (DPO). O princípio da segurança exige a adoção de medidas técnicas e administrativas para proteger os dados contra acessos não autorizados, destruição, perda e alteração. O princípio da responsabilização e prestação de contas (accountability) impõe ao controlador a obrigação de demonstrar conformidade e de responder por danos causados em decorrência do tratamento.
Esses princípios impõem, na prática, um conjunto de salvaguardas operacionais para o Banco do CNMP: (a) mapeamento de categorias de dados e avaliação de sensibilidade (dados relativos a infrações, origem racial, saúde, orientação sexual e vida privada recebem proteção reforçada); (b) controle de acesso baseado em função (RBAC — Role-Based Access Control), com perfis diferenciados para consultores de inteligência, promotores de justiça, administradores de sistema e auditores; (c) logs de acesso imutáveis, auditados periodicamente por órgão externo; (d) anonimização ou pseudonimização dos dados para finalidades estatísticas e analíticas, preservando os dados identificados apenas para finalidades processuais específicas; (e) avaliação de impacto à proteção de dados (DPIA — Data Protection Impact Assessment) antes da implantação de novos módulos analíticos, especialmente os que utilizem IA; e (f) plano de resposta a incidentes, com notificação ao CNMP, à Autoridade Nacional de Proteção de Dados (ANPD) e, quando pertinente, ao titular dos dados afetado.
Um risco específico merece atenção destacada: o viés algorítmico. Quando os dados que alimentam um sistema de IA criminal foram coletados em contexto de policiamento seletivo — com sobrerrepresentação de determinados grupos populacionais nos registros de suspeitos, infrações e condenações —, os algoritmos treinados nessa base reproduzem e amplificam a discriminação estrutural, violando os princípios da igualdade (art. 5º, I, da CF) e da não discriminação. A mitigação exige: (i) auditoria de viés (bias audit) sobre os dados de entrada e sobre os outputs do sistema; (ii) testes de disparidade demográfica nos resultados analíticos; (iii) documentação das escolhas de design e das limitações do modelo; e (iv) supervisão humana obrigatória sobre decisões que impactem direitos individuais.
9. Conclusão: uma nova arquitetura de controle externo
O controle externo, no mundo digital, não se esgota em inspeções e recomendações. Ele se realiza como exigência de rastreabilidade. A rastreabilidade, por sua vez, depende de linguagem comum, metodologia de coleta, qualidade do dado e auditabilidade de acessos e transformações. Sem essas condições, o controle externo permanece retórico — uma garantia formal que não alcança o campo onde as decisões são efetivamente tomadas: na cadeia de microdecisões investigativas que antecedem o ato acusatório.
A construção do Banco Nacional de Dados do CNMP, assentada na BDP/MP e articulada a bases nacionais do Executivo — em especial o Sinic — por interoperabilidade governada, representa uma arquitetura institucional capaz de aumentar eficiência investigativa, fortalecer direitos fundamentais e permitir autocrítica do sistema de justiça penal. Essa arquitetura é necessária, mas não suficiente: ela precisa ser acompanhada de lei específica para o tratamento de dados na persecução penal (a ser aprovada na forma exigida pelo art. 4º, §1º, da LGPD), de uma Autoridade Nacional de Proteção de Dados (ANPD) fortalecida em sua capacidade de fiscalizar o Poder Público, e de uma cultura institucional de governança de dados que ainda precisa ser construída nas organizações de segurança pública brasileiras.
A literatura internacional converge, com variações de ênfase, em torno de cinco lições fundamentais para a construção desse tipo de infraestrutura: (i) a fragmentação de dados é o principal obstáculo à inteligência criminal eficaz, e a padronização semântica é condição prévia à integração; (ii) a centralização de dados sem governança adequada cria riscos de abuso, discriminação e instrumentalização por atores criminosos; (iii) a supervisão humana é insubstituível — algoritmos identificam padrões, mas não exercem julgamento; (iv) a accountability externa (auditoria, supervisão parlamentar, controle jurisdicional) é condição de legitimidade; e (v) a interoperabilidade federada — arquitetura em que os dados residem nos órgãos de origem e são acessados por consulta controlada, como no modelo da RIBPG e da INTERPOL — é mais compatível com o federalismo brasileiro e com os princípios de proteção de dados do que a centralização física irrestrita.
Ao Ministério Público, como titular da ação penal e guardião do Estado Democrático de Direito (art. 127, caput, da CF), cabe liderar esse processo — não porque o Banco Nacional seja de sua propriedade exclusiva, mas porque nenhum outro ator institucional reúne, com a mesma abrangência constitucional, o mandato de acusar, controlar e investigar. A unidade informacional do MP não é centralismo; é o pressuposto epistêmico de uma persecução penal que aspira à coerência, à equidade e à possibilidade de ser corrigida.

Perguntas & Respostas

1. O que é o Banco Nacional de Dados do CNMP e qual é o seu objetivo central?: O Banco Nacional de Dados do CNMP é uma infraestrutura institucional de rastreabilidade, coerência e autocrítica na persecução penal, organizada sob governança do Conselho Nacional do Ministério Público. Seu objetivo central não é substituir bancos nacionais do Poder Executivo, como o Sinic (MJSP), mas organizar o núcleo de dados próprios do Ministério Público — dados processuais e extrajudiciais — e permitir interoperabilidade governada com sistemas externos, com qualidade, segurança e trilhas de auditoria. A base normativa imediata é a Resolução CNMP nº 318/2025, que instituiu a Base de Dados Processuais do Ministério Público (BDP/MP).
2. Por que o Brasil ainda não possui um sistema integrado e confiável de estatísticas criminais?: O Anuário Estatístico de Segurança Pública 2023-2024 (Ipea/Senasp) aponta que o Brasil possui 27 sistemas distintos de estatísticas criminais apenas entre as polícias civis, sem um padrão semântico nacional. Há três obstáculos estruturais: cada estado registra dados em idioma próprio, tornando a correlação nacional impossível; alguns estados recusam enviar microdados alegando barreiras da LGPD "de forma inadequada"; e doze estados sequer utilizam tecnologias disruptivas de segurança pública. O resultado é um sistema que digitaliza a investigação, mas preserva a lógica analógica do registro — produzindo fragmentos, não redes.
3. Qual é o fundamento constitucional que justifica o controle de dados pelo Ministério Público?: O artigo identifica um tripé constitucional: a titularidade privativa da ação penal pública (art. 129, I, CF), que impõe ao MP organizar a acusação com base em prova compreensível e criticável; o controle externo da atividade policial (art. 129, VII, CF), que na Era Digital exige rastreabilidade mínima dos atos investigativos; e os poderes investigatórios reconhecidos pelo STF (RE 593.727, Tema 184). Na prática, o MP só pode exercer esses mandatos constitucionais com eficiência e coerência nacional se dispuser de infraestrutura de dados adequada — o que legitima a existência do Banco do CNMP.
4. Em que o Banco do CNMP difere do Sinic (Sistema Nacional de Informações Criminais) do MJSP?: São bases com vocações distintas e complementares. O Sinic, instituído pela Portaria MJSP nº 1.123/2026, consolida informações criminais — indiciamentos, denúncias e condenações — e se tornará a "fonte única" para emissão de Certidão Nacional Criminal, substituindo sistemas fragmentados de tribunais, polícias civis e institutos de identificação. O Banco do CNMP, por sua vez, organiza especificamente o núcleo de dados processuais e extrajudiciais do próprio Ministério Público, garantindo memória institucional e independência funcional. A relação entre eles é de interoperabilidade governada — não de sobreposição ou absorção.
5. Quais são os riscos concretos de bancos de dados de segurança pública sem governança adequada?: O artigo documenta um episódio emblemático: em 2023, a Polícia Federal revelou que o PCC acessou o sistema de câmeras Detecta de São Paulo, usando o banco de dados estatal para monitorar uma viatura descaracterizada da Polícia Civil durante um plano de assassinato. Além do risco de instrumentalização pelo crime organizado, o Tribunal de Contas do Estado de São Paulo identificou no mesmo sistema conflitos entre sistemas operacionais, falta de infraestrutura e treinamento. O artigo conclui que bancos sem controles técnicos adequados — autenticação multifator, logs imutáveis, monitoramento de anomalias — se convertem de ferramentas de proteção em vetores de ameaça.
6. O que é padronização algorítmica e quais são seus requisitos mínimos para bancos de dados criminais?: Padronização algorítmica não significa impor um software único aos estados, mas exigir seis propriedades mínimas: schema canônico versionado (estrutura de dados com campos e tipos definidos e retrocompatíveis); dicionário semântico (vocabulário controlado de termos jurídicos para que o mesmo fenômeno seja descrito da mesma forma em todos os sistemas); regras de resolução de identidade (algoritmos para eliminar duplicidades e homônimos); logs imutáveis (registros de acesso que não podem ser alterados retroativamente, essenciais à cadeia de custódia digital); trilhas de transformação — data lineage — (rastreamento de todas as transformações do dado desde a coleta); e métricas de qualidade por fonte e por UF.
7. Como a LGPD se aplica ao Banco do CNMP se os dados de segurança pública estão excluídos de seu âmbito?: O artigo sustenta dois argumentos para afastar a interpretação de que a exceção do art. 4º da LGPD cria um vácuo de proteção. O argumento constitucional: os direitos à privacidade (art. 5º, X), à proteção de dados (art. 5º, LXXIX, EC 115/2022) e ao devido processo legal (art. 5º, LIV) são limites intransponíveis mesmo na persecução penal, independentemente de lei ordinária. O argumento sistêmico: incidem sobre a matéria o CPP, as resoluções do CNMP, as diretrizes da UNESCO sobre ética em IA e, como parâmetro interpretativo, a Convenção 108+ do Conselho da Europa. Na prática, os princípios de finalidade, necessidade, adequação, transparência, segurança e accountability estruturam as salvaguardas operacionais exigíveis.
8. Como o modelo federado da RIBPG pode inspirar a arquitetura do Banco do CNMP?: A Rede Integrada de Bancos de Perfis Genéticos (RIBPG) reúne 23 bancos estaduais conectados ao Banco Nacional de Perfis Genéticos em arquitetura federada, com mais de 254 mil perfis e taxa de coincidência de 7,08%. O modelo opera com padrão técnico definido em Manual de Procedimentos Operacionais, software padronizado (CODIS) e conectividade à base da INTERPOL. O artigo propõe replicar essa lógica no Banco do CNMP: os dados residem nos órgãos de origem e são acessados por consulta controlada, com padrão técnico centralizado, governança pública e auditabilidade externa — solução mais compatível com o federalismo brasileiro e com os princípios de proteção de dados do que a centralização física irrestrita.

O BANCO NACIONAL DE DADOS DO CNMP NA ERA DA COMPLEXIDADE INVESTIGATIVA: FUNDAMENTOS CONSTITUCIONAIS, ESTATÍSTICOS E ALGORÍTMICOS DA RASTREABILIDADE PENAL

Perguntas & Respostas

Compartilhar:

Fale Conosco

Inscreva-se na nossalista de e-mail

Fale
Conosco

Inscreva-se na nossa
lista de e-mail