Todos os cursos > Concursos > Polícia Federal ::

Estatística Forense e Interpretação Probabilística na Perícia Criminal Federal

Capítulo 7

Tempo estimado de leitura: 13 minutos

1. Por que estatística é central na interpretação pericial

Em perícia, raramente a pergunta é “é igual ou diferente?” de forma absoluta. O que se busca é quantificar o quanto um resultado é compatível com uma hipótese versus outra, e comunicar a incerteza de modo transparente. Estatística fornece linguagem e ferramentas para: (i) descrever variabilidade natural e de medição; (ii) estimar taxas de erro; (iii) testar hipóteses com critérios explícitos; (iv) expressar o peso da evidência sem extrapolar além do que os dados sustentam.

2. Conceitos estatísticos essenciais para a prática forense

2.1 Variáveis, populações e amostras

Variável é uma característica mensurável ou classificável. Pode ser quantitativa (concentração de um resíduo, intensidade de um pico, comprimento de um fragmento) ou qualitativa (presença/ausência de um marcador, classe de tinta, tipo de fibra).

População é o conjunto de interesse (por exemplo, todos os indivíduos de uma região; todos os lotes de um produto; todas as impressões de um tipo de superfície). Amostra é o subconjunto observado. Em perícia, muitas vezes a “população” relevante é a distribuição de características em uma base de referência (banco de frequências, coleções de tintas, distribuição de ruído instrumental).

Variabilidade biológica/ambiental: diferenças reais entre fontes.
Variabilidade de coleta: diferenças introduzidas por amostragem, degradação, mistura.
Variabilidade analítica: repetibilidade/reprodutibilidade do método.

2.2 Distribuições e parâmetros (média, variância, percentis)

Uma distribuição descreve como valores se espalham. Parâmetros comuns: média (tendência central), variância/desvio-padrão (dispersão), mediana e percentis (posição relativa).

Distribuições frequentes na prática:

Continue em nosso aplicativo e ...

Ouça o áudio com a tela desligada
Ganhe Certificado após a conclusão
+ de 5000 cursos para você explorar!

ou continue lendo abaixo...

Baixar o aplicativo

Normal (gaussiana): erros de medição e muitas grandezas físicas quando somas de pequenas variações independentes.
Binomial: contagem de sucessos em n tentativas (ex.: número de testes positivos em um lote de controles).
Poisson: contagem de eventos raros em um intervalo (ex.: contagem de partículas/traços em uma área/tempo, sob certas condições).
Lognormal: concentrações e intensidades que não podem ser negativas e exibem assimetria (ex.: alguns resíduos químicos).

2.3 Erros tipo I e tipo II (e o que eles significam na perícia)

Ao tomar uma decisão baseada em um teste, há dois erros clássicos:

Erro tipo I (α): rejeitar uma hipótese quando ela é verdadeira (falso positivo no contexto de “detectar” algo).
Erro tipo II (β): não rejeitar uma hipótese quando ela é falsa (falso negativo no contexto de “detectar” algo).

Em perícia, o custo de cada erro depende do contexto. Por exemplo, em triagens (screening) pode-se tolerar mais falsos positivos para reduzir falsos negativos, desde que haja confirmação posterior por método mais específico.

2.4 Intervalos de confiança (IC) e incerteza de medição

Intervalo de confiança é uma faixa estimada para um parâmetro (por exemplo, média de concentração) com um nível de confiança (ex.: 95%). Não significa “95% de chance do valor verdadeiro estar dentro do intervalo” no sentido coloquial; significa que, em repetições do procedimento, 95% dos intervalos construídos conteriam o parâmetro verdadeiro.

Na rotina laboratorial, frequentemente se reporta incerteza expandida (por exemplo, U com k≈2 para ~95% de cobertura), associada ao resultado de medição. Isso é crucial quando o resultado é comparado a um limite (cutoff) ou a uma faixa de referência.

2.5 Testes estatísticos básicos e tamanho de efeito

Testes comuns (quando aplicáveis e com pressupostos verificados):

Teste t: comparar médias (ex.: diferença entre amostra e controle, ou entre dois lotes) sob normalidade aproximada.
Qui-quadrado/Fisher: associação entre variáveis categóricas (ex.: presença/ausência de marcador em grupos).
Correlação/regressão: relação entre variáveis (ex.: resposta instrumental vs concentração em curva analítica).

Além do p-valor, considere tamanho de efeito (diferença padronizada, razão, inclinação) e IC. Um p-valor pequeno não implica relevância prática; um p-valor grande não prova ausência de efeito.

3. Métricas forenses: falso positivo/negativo, sensibilidade, especificidade

3.1 Matriz de confusão e taxas

Para um teste que classifica “positivo/negativo” (detecção, triagem, correspondência), organize resultados em:

Verdadeiro positivo (VP): positivo quando a condição está presente.
Falso positivo (FP): positivo quando a condição não está presente.
Verdadeiro negativo (VN): negativo quando a condição não está presente.
Falso negativo (FN): negativo quando a condição está presente.

Derivados úteis:

Sensibilidade = VP/(VP+FN): capacidade de detectar quando existe.
Especificidade = VN/(VN+FP): capacidade de não acusar quando não existe.
Taxa de falso positivo = FP/(FP+VN) = 1 − especificidade.
Taxa de falso negativo = FN/(FN+VP) = 1 − sensibilidade.

3.2 Valor preditivo e a armadilha da taxa-base

Valor preditivo positivo (VPP) é a probabilidade de a condição estar presente dado que o teste deu positivo. Ele depende da prevalência (taxa-base) da condição no universo relevante. Mesmo um teste com alta especificidade pode gerar muitos falsos positivos quando a condição é rara.

Em perícia, isso aparece quando se interpreta “um match” ou “um positivo” sem considerar o quão comum é aquela característica na população de referência e o contexto de busca/seleção.

4. Interpretação probabilística: hipóteses, razão de verossimilhança e peso da evidência

4.1 Estrutura por hipóteses concorrentes

Uma forma robusta de raciocínio é formular duas hipóteses:

H1 (hipótese da acusação/alegação): por exemplo, “o vestígio veio da fonte A”.
H2 (hipótese alternativa): por exemplo, “o vestígio veio de outra fonte da população relevante”.

A evidência (E) é o resultado observado: perfil, padrão, medida, conjunto de características.

4.2 Razão de verossimilhança (Likelihood Ratio, LR)

A razão de verossimilhança compara quão provável é observar a evidência sob cada hipótese:

LR = P(E | H1) / P(E | H2)

LR > 1 favorece H1.
LR < 1 favorece H2.
LR = 1 indica evidência neutra.

Interpretação prática: LR não é “probabilidade de culpa” nem “probabilidade de a fonte ser A”. É uma medida do peso da evidência fornecida pelo exame, condicionada às hipóteses e ao modelo/população de referência.

4.3 Peso da evidência e comunicação

É comum comunicar o peso por categorias (por exemplo, “suporte moderado/forte/muito forte”) associadas a faixas de LR, quando a instituição adota uma escala. O essencial é explicitar: (i) quais hipóteses foram comparadas; (ii) qual população de referência foi usada; (iii) quais suposições e limitações influenciam P(E|H1) e P(E|H2).

5. Como reportar incerteza e limitações sem extrapolar

5.1 Boas práticas de redação técnica

Distinguir observação de interpretação: “foi observado X” vs “X é mais compatível com H1 do que com H2”.
Evitar linguagem absoluta quando o método não suporta (ex.: “com certeza”, “inequivocamente”) e preferir linguagem probabilística/condicional.
Explicitar condições: qualidade da amostra, mistura, degradação, quantidade limitada, interferentes.
Indicar incerteza: IC, incerteza expandida, limites de detecção/quantificação, variabilidade entre replicatas.
Delimitar o escopo: o exame avalia compatibilidade/associação, não intenção, autoria ou dinâmica completa sem outros elementos.

5.2 Erros comuns a evitar

Falácia do promotor: confundir P(E|H2) com P(H2|E). Ex.: “a chance de um inocente ter esse perfil é 1 em 1 milhão, então a chance de o suspeito ser inocente é 1 em 1 milhão” (isso é incorreto sem considerar taxa-base e outras evidências).
Falácia da defesa: concluir que, por existir chance de coincidência, a evidência “não vale nada”. O correto é quantificar o quanto a evidência muda o suporte relativo entre hipóteses.
Seleção pós-hoc: escolher a população de referência ou o critério após ver o resultado, inflando o peso aparente.

6. Passo a passo prático: do resultado ao enunciado probabilístico

6.1 Roteiro geral aplicável a diferentes exames

Passo 1: Definir a questão pericial em termos de hipóteses. Ex.: H1 “vestígio veio da fonte A”; H2 “veio de outra fonte relevante”.

Passo 2: Descrever a evidência (E) e sua qualidade. Quantidade, integridade, ruído, mistura, controles, repetição.

Passo 3: Identificar variáveis e modelo de variabilidade. O que varia entre fontes? O que varia dentro da mesma fonte? Qual o erro de medição?

Passo 4: Estimar P(E|H1). Considerar repetibilidade, tolerâncias, probabilidade de observar aquele grau de semelhança se a fonte for a mesma (inclui ruído e variação intra-fonte).

Passo 5: Estimar P(E|H2). Considerar frequência do padrão/medida na população relevante e a chance de outra fonte produzir evidência tão semelhante.

Passo 6: Calcular/qualificar o LR e testar sensibilidade. Avaliar como o LR muda com escolhas razoáveis (população, parâmetros, limiares).

Passo 7: Redigir a conclusão técnica com condicionais e limitações. Informar suporte relativo, sem converter em probabilidade de autoria.

7. Exemplos orientados a casos

7.1 Comparação de padrões: marcas/estrias e impressões (nível conceitual)

Cenário: um padrão de estrias em um item questionado é comparado a um padrão de referência. O examinador observa um grau de concordância em características (classe e individuais) e ausência de discrepâncias relevantes.

Aplicação estatística:

Variáveis: número de características coincidentes, medidas de similaridade (score), distribuição de scores para pares “mesma fonte” vs “fontes diferentes”.
Erro tipo I/II: se o critério de “correspondência” for muito permissivo, aumenta FP; se for muito estrito, aumenta FN.
LR (conceitual): se scores de “mesma fonte” tipicamente são altos e o score observado é alto, P(E|H1) tende a ser maior do que P(E|H2). P(E|H2) depende de quão frequentemente fontes diferentes produzem scores semelhantes (base de referência e estudos de validação).

Como reportar: “O padrão observado é mais compatível com a hipótese de mesma fonte do que com a hipótese de fontes distintas, considerando os critérios e estudos de desempenho do método. A avaliação é limitada por [qualidade da impressão, área disponível, substrato, etc.].”

7.2 Perfis genéticos (nível conceitual): frequências e LR

Cenário: um perfil genético obtido de um vestígio é comparado ao perfil de um indivíduo de referência. Há compatibilidade nos loci avaliados (sem entrar em detalhes operacionais).

Conceitos-chave:

Frequência do perfil: sob H2 (um indivíduo aleatório da população), a probabilidade de observar aquele conjunto de alelos depende das frequências alélicas na população relevante e de pressupostos do modelo (ex.: equilíbrio, subestrutura).
P(E|H1): se o vestígio veio do indivíduo, a compatibilidade é esperada, mas pode haver fatores que reduzem P(E|H1), como degradação, alelos ausentes (drop-out) ou mistura.
LR: combina a compatibilidade observada com a raridade do perfil e com a qualidade do dado (incluindo incertezas como drop-out/drop-in, quando aplicável).

Armadilha comum: transformar “raridade do perfil” em “probabilidade de autoria”. O correto é: “o resultado fornece X vezes mais suporte para H1 do que para H2”, condicionado à população e ao modelo.

Como reportar incerteza: indicar se o perfil é parcial, se há sinais de mistura, se alguns loci não foram interpretáveis, e como isso afeta o peso da evidência (tipicamente reduzindo-o).

7.3 Resíduos/traços: detecção, limites e taxas de erro

Cenário: um exame busca detectar um resíduo específico em amostra coletada de superfície/objeto. O método tem limite de detecção (LD) e limite de quantificação (LQ), e utiliza controles.

Passo a passo prático (interpretação de um “positivo”):

Passo 1: Verificar controles. Controle negativo sem sinal relevante; controle positivo dentro da faixa esperada. Se falhar, o resultado não deve ser interpretado como evidência confiável.

Passo 2: Classificar o resultado em relação a LD/LQ.

Abaixo do LD: “não detectado” (não significa ausência).
Entre LD e LQ: “detectado, não quantificável com confiabilidade” (maior incerteza).
Acima do LQ: quantificar com incerteza associada.

Passo 3: Considerar falso positivo/falso negativo. Interferentes podem gerar FP; baixa massa, degradação e matriz complexa podem gerar FN. Se houver estimativas de sensibilidade/especificidade do método para matrizes semelhantes, reportar como contexto de desempenho.

Passo 4: Contextualizar a fonte alternativa (H2). P(E|H2) pode ser influenciada por contaminação ambiental, transferência secundária, uso legítimo de substâncias similares, ou presença de compostos com assinatura parecida.

Como reportar: “Foi detectado o composto X acima do LD (e, se aplicável, quantificado em Y ± U). A interpretação considera controles satisfatórios. O resultado é compatível com [hipótese técnica], porém não permite inferir [tempo de deposição/origem única] sem dados adicionais. Limitações: [matriz, possibilidade de interferentes, amostra limitada].”

7.4 Resultados laboratoriais com controles: comparação com limite e IC

Cenário: uma concentração medida deve ser comparada a um valor de referência/limite técnico. Exemplo genérico: concentração medida C = 10,0 unidades com incerteza expandida U = 1,0 (k≈2).

Passo a passo prático (decisão com incerteza):

Passo 1: Registrar o resultado com incerteza. Intervalo aproximado de cobertura: [9,0; 11,0].

Passo 2: Comparar com o limite L.

Se L = 9,5: parte do intervalo está abaixo e parte acima; a decisão “acima do limite” é sensível à incerteza.
Se L = 8,0: todo o intervalo está acima; suporte mais robusto para “acima do limite”.
Se L = 11,5: todo o intervalo está abaixo; suporte para “abaixo do limite”.

Passo 3: Verificar consistência com controles e calibração. Curva analítica, branco, duplicatas, padrões de controle interno. Um resultado “acima do limite” sem controles adequados não deve ser afirmado com o mesmo grau de confiança.

Passo 4: Redigir a interpretação sem extrapolar. Em vez de “ultrapassa o limite com certeza”, usar formulações como: “o valor medido é compatível com estar acima do limite” ou “considerando a incerteza, o resultado não permite afirmar com robustez que excede o limite”, conforme o caso.

8. Checklist de consistência estatística antes de finalizar o laudo

As hipóteses H1/H2 estão claramente definidas e tecnicamente apropriadas?
A população de referência (quando usada) está descrita e justificada?
Há indicação de qualidade da amostra e de controles (negativo/positivo/replicatas)?
Foram consideradas fontes de variabilidade (intra-fonte, inter-fonte, analítica)?
Se houve decisão por limiar, o risco de erro tipo I/II foi reconhecido?
Resultados numéricos incluem incerteza (IC/U) quando aplicável?
A redação evita converter LR/raridade em probabilidade de autoria?
Limitações e cenários alternativos plausíveis foram explicitados sem especulação?

Agora responda o exercício sobre o conteúdo:

Ao interpretar um “match” ou um resultado positivo em perícia, qual abordagem evita conclusões indevidas e comunica adequadamente o peso da evidência?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

A interpretação recomendada compara H1 e H2 e quantifica o suporte relativo (ex.: LR), indicando população de referência, variabilidade e incertezas. Isso evita a falácia de converter P(E|H2) em P(H2|E) e comunica limites do exame.