1. Por que estatística é central na interpretação pericial
Em perícia, raramente a pergunta é “é igual ou diferente?” de forma absoluta. O que se busca é quantificar o quanto um resultado é compatível com uma hipótese versus outra, e comunicar a incerteza de modo transparente. Estatística fornece linguagem e ferramentas para: (i) descrever variabilidade natural e de medição; (ii) estimar taxas de erro; (iii) testar hipóteses com critérios explícitos; (iv) expressar o peso da evidência sem extrapolar além do que os dados sustentam.
2. Conceitos estatísticos essenciais para a prática forense
2.1 Variáveis, populações e amostras
Variável é uma característica mensurável ou classificável. Pode ser quantitativa (concentração de um resíduo, intensidade de um pico, comprimento de um fragmento) ou qualitativa (presença/ausência de um marcador, classe de tinta, tipo de fibra).
População é o conjunto de interesse (por exemplo, todos os indivíduos de uma região; todos os lotes de um produto; todas as impressões de um tipo de superfície). Amostra é o subconjunto observado. Em perícia, muitas vezes a “população” relevante é a distribuição de características em uma base de referência (banco de frequências, coleções de tintas, distribuição de ruído instrumental).
- Variabilidade biológica/ambiental: diferenças reais entre fontes.
- Variabilidade de coleta: diferenças introduzidas por amostragem, degradação, mistura.
- Variabilidade analítica: repetibilidade/reprodutibilidade do método.
2.2 Distribuições e parâmetros (média, variância, percentis)
Uma distribuição descreve como valores se espalham. Parâmetros comuns: média (tendência central), variância/desvio-padrão (dispersão), mediana e percentis (posição relativa).
Distribuições frequentes na prática:
Continue em nosso aplicativo
Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.
ou continue lendo abaixo...Baixar o aplicativo
- Normal (gaussiana): erros de medição e muitas grandezas físicas quando somas de pequenas variações independentes.
- Binomial: contagem de sucessos em n tentativas (ex.: número de testes positivos em um lote de controles).
- Poisson: contagem de eventos raros em um intervalo (ex.: contagem de partículas/traços em uma área/tempo, sob certas condições).
- Lognormal: concentrações e intensidades que não podem ser negativas e exibem assimetria (ex.: alguns resíduos químicos).
2.3 Erros tipo I e tipo II (e o que eles significam na perícia)
Ao tomar uma decisão baseada em um teste, há dois erros clássicos:
- Erro tipo I (α): rejeitar uma hipótese quando ela é verdadeira (falso positivo no contexto de “detectar” algo).
- Erro tipo II (β): não rejeitar uma hipótese quando ela é falsa (falso negativo no contexto de “detectar” algo).
Em perícia, o custo de cada erro depende do contexto. Por exemplo, em triagens (screening) pode-se tolerar mais falsos positivos para reduzir falsos negativos, desde que haja confirmação posterior por método mais específico.
2.4 Intervalos de confiança (IC) e incerteza de medição
Intervalo de confiança é uma faixa estimada para um parâmetro (por exemplo, média de concentração) com um nível de confiança (ex.: 95%). Não significa “95% de chance do valor verdadeiro estar dentro do intervalo” no sentido coloquial; significa que, em repetições do procedimento, 95% dos intervalos construídos conteriam o parâmetro verdadeiro.
Na rotina laboratorial, frequentemente se reporta incerteza expandida (por exemplo, U com k≈2 para ~95% de cobertura), associada ao resultado de medição. Isso é crucial quando o resultado é comparado a um limite (cutoff) ou a uma faixa de referência.
2.5 Testes estatísticos básicos e tamanho de efeito
Testes comuns (quando aplicáveis e com pressupostos verificados):
- Teste t: comparar médias (ex.: diferença entre amostra e controle, ou entre dois lotes) sob normalidade aproximada.
- Qui-quadrado/Fisher: associação entre variáveis categóricas (ex.: presença/ausência de marcador em grupos).
- Correlação/regressão: relação entre variáveis (ex.: resposta instrumental vs concentração em curva analítica).
Além do p-valor, considere tamanho de efeito (diferença padronizada, razão, inclinação) e IC. Um p-valor pequeno não implica relevância prática; um p-valor grande não prova ausência de efeito.
3. Métricas forenses: falso positivo/negativo, sensibilidade, especificidade
3.1 Matriz de confusão e taxas
Para um teste que classifica “positivo/negativo” (detecção, triagem, correspondência), organize resultados em:
- Verdadeiro positivo (VP): positivo quando a condição está presente.
- Falso positivo (FP): positivo quando a condição não está presente.
- Verdadeiro negativo (VN): negativo quando a condição não está presente.
- Falso negativo (FN): negativo quando a condição está presente.
Derivados úteis:
- Sensibilidade = VP/(VP+FN): capacidade de detectar quando existe.
- Especificidade = VN/(VN+FP): capacidade de não acusar quando não existe.
- Taxa de falso positivo = FP/(FP+VN) = 1 − especificidade.
- Taxa de falso negativo = FN/(FN+VP) = 1 − sensibilidade.
3.2 Valor preditivo e a armadilha da taxa-base
Valor preditivo positivo (VPP) é a probabilidade de a condição estar presente dado que o teste deu positivo. Ele depende da prevalência (taxa-base) da condição no universo relevante. Mesmo um teste com alta especificidade pode gerar muitos falsos positivos quando a condição é rara.
Em perícia, isso aparece quando se interpreta “um match” ou “um positivo” sem considerar o quão comum é aquela característica na população de referência e o contexto de busca/seleção.
4. Interpretação probabilística: hipóteses, razão de verossimilhança e peso da evidência
4.1 Estrutura por hipóteses concorrentes
Uma forma robusta de raciocínio é formular duas hipóteses:
- H1 (hipótese da acusação/alegação): por exemplo, “o vestígio veio da fonte A”.
- H2 (hipótese alternativa): por exemplo, “o vestígio veio de outra fonte da população relevante”.
A evidência (E) é o resultado observado: perfil, padrão, medida, conjunto de características.
4.2 Razão de verossimilhança (Likelihood Ratio, LR)
A razão de verossimilhança compara quão provável é observar a evidência sob cada hipótese:
LR = P(E | H1) / P(E | H2)- LR > 1 favorece H1.
- LR < 1 favorece H2.
- LR = 1 indica evidência neutra.
Interpretação prática: LR não é “probabilidade de culpa” nem “probabilidade de a fonte ser A”. É uma medida do peso da evidência fornecida pelo exame, condicionada às hipóteses e ao modelo/população de referência.
4.3 Peso da evidência e comunicação
É comum comunicar o peso por categorias (por exemplo, “suporte moderado/forte/muito forte”) associadas a faixas de LR, quando a instituição adota uma escala. O essencial é explicitar: (i) quais hipóteses foram comparadas; (ii) qual população de referência foi usada; (iii) quais suposições e limitações influenciam P(E|H1) e P(E|H2).
5. Como reportar incerteza e limitações sem extrapolar
5.1 Boas práticas de redação técnica
- Distinguir observação de interpretação: “foi observado X” vs “X é mais compatível com H1 do que com H2”.
- Evitar linguagem absoluta quando o método não suporta (ex.: “com certeza”, “inequivocamente”) e preferir linguagem probabilística/condicional.
- Explicitar condições: qualidade da amostra, mistura, degradação, quantidade limitada, interferentes.
- Indicar incerteza: IC, incerteza expandida, limites de detecção/quantificação, variabilidade entre replicatas.
- Delimitar o escopo: o exame avalia compatibilidade/associação, não intenção, autoria ou dinâmica completa sem outros elementos.
5.2 Erros comuns a evitar
- Falácia do promotor: confundir P(E|H2) com P(H2|E). Ex.: “a chance de um inocente ter esse perfil é 1 em 1 milhão, então a chance de o suspeito ser inocente é 1 em 1 milhão” (isso é incorreto sem considerar taxa-base e outras evidências).
- Falácia da defesa: concluir que, por existir chance de coincidência, a evidência “não vale nada”. O correto é quantificar o quanto a evidência muda o suporte relativo entre hipóteses.
- Seleção pós-hoc: escolher a população de referência ou o critério após ver o resultado, inflando o peso aparente.
6. Passo a passo prático: do resultado ao enunciado probabilístico
6.1 Roteiro geral aplicável a diferentes exames
Passo 1: Definir a questão pericial em termos de hipóteses. Ex.: H1 “vestígio veio da fonte A”; H2 “veio de outra fonte relevante”.
Passo 2: Descrever a evidência (E) e sua qualidade. Quantidade, integridade, ruído, mistura, controles, repetição.
Passo 3: Identificar variáveis e modelo de variabilidade. O que varia entre fontes? O que varia dentro da mesma fonte? Qual o erro de medição?
Passo 4: Estimar P(E|H1). Considerar repetibilidade, tolerâncias, probabilidade de observar aquele grau de semelhança se a fonte for a mesma (inclui ruído e variação intra-fonte).
Passo 5: Estimar P(E|H2). Considerar frequência do padrão/medida na população relevante e a chance de outra fonte produzir evidência tão semelhante.
Passo 6: Calcular/qualificar o LR e testar sensibilidade. Avaliar como o LR muda com escolhas razoáveis (população, parâmetros, limiares).
Passo 7: Redigir a conclusão técnica com condicionais e limitações. Informar suporte relativo, sem converter em probabilidade de autoria.
7. Exemplos orientados a casos
7.1 Comparação de padrões: marcas/estrias e impressões (nível conceitual)
Cenário: um padrão de estrias em um item questionado é comparado a um padrão de referência. O examinador observa um grau de concordância em características (classe e individuais) e ausência de discrepâncias relevantes.
Aplicação estatística:
- Variáveis: número de características coincidentes, medidas de similaridade (score), distribuição de scores para pares “mesma fonte” vs “fontes diferentes”.
- Erro tipo I/II: se o critério de “correspondência” for muito permissivo, aumenta FP; se for muito estrito, aumenta FN.
- LR (conceitual): se scores de “mesma fonte” tipicamente são altos e o score observado é alto, P(E|H1) tende a ser maior do que P(E|H2). P(E|H2) depende de quão frequentemente fontes diferentes produzem scores semelhantes (base de referência e estudos de validação).
Como reportar: “O padrão observado é mais compatível com a hipótese de mesma fonte do que com a hipótese de fontes distintas, considerando os critérios e estudos de desempenho do método. A avaliação é limitada por [qualidade da impressão, área disponível, substrato, etc.].”
7.2 Perfis genéticos (nível conceitual): frequências e LR
Cenário: um perfil genético obtido de um vestígio é comparado ao perfil de um indivíduo de referência. Há compatibilidade nos loci avaliados (sem entrar em detalhes operacionais).
Conceitos-chave:
- Frequência do perfil: sob H2 (um indivíduo aleatório da população), a probabilidade de observar aquele conjunto de alelos depende das frequências alélicas na população relevante e de pressupostos do modelo (ex.: equilíbrio, subestrutura).
- P(E|H1): se o vestígio veio do indivíduo, a compatibilidade é esperada, mas pode haver fatores que reduzem P(E|H1), como degradação, alelos ausentes (drop-out) ou mistura.
- LR: combina a compatibilidade observada com a raridade do perfil e com a qualidade do dado (incluindo incertezas como drop-out/drop-in, quando aplicável).
Armadilha comum: transformar “raridade do perfil” em “probabilidade de autoria”. O correto é: “o resultado fornece X vezes mais suporte para H1 do que para H2”, condicionado à população e ao modelo.
Como reportar incerteza: indicar se o perfil é parcial, se há sinais de mistura, se alguns loci não foram interpretáveis, e como isso afeta o peso da evidência (tipicamente reduzindo-o).
7.3 Resíduos/traços: detecção, limites e taxas de erro
Cenário: um exame busca detectar um resíduo específico em amostra coletada de superfície/objeto. O método tem limite de detecção (LD) e limite de quantificação (LQ), e utiliza controles.
Passo a passo prático (interpretação de um “positivo”):
Passo 1: Verificar controles. Controle negativo sem sinal relevante; controle positivo dentro da faixa esperada. Se falhar, o resultado não deve ser interpretado como evidência confiável.
Passo 2: Classificar o resultado em relação a LD/LQ.
- Abaixo do LD: “não detectado” (não significa ausência).
- Entre LD e LQ: “detectado, não quantificável com confiabilidade” (maior incerteza).
- Acima do LQ: quantificar com incerteza associada.
Passo 3: Considerar falso positivo/falso negativo. Interferentes podem gerar FP; baixa massa, degradação e matriz complexa podem gerar FN. Se houver estimativas de sensibilidade/especificidade do método para matrizes semelhantes, reportar como contexto de desempenho.
Passo 4: Contextualizar a fonte alternativa (H2). P(E|H2) pode ser influenciada por contaminação ambiental, transferência secundária, uso legítimo de substâncias similares, ou presença de compostos com assinatura parecida.
Como reportar: “Foi detectado o composto X acima do LD (e, se aplicável, quantificado em Y ± U). A interpretação considera controles satisfatórios. O resultado é compatível com [hipótese técnica], porém não permite inferir [tempo de deposição/origem única] sem dados adicionais. Limitações: [matriz, possibilidade de interferentes, amostra limitada].”
7.4 Resultados laboratoriais com controles: comparação com limite e IC
Cenário: uma concentração medida deve ser comparada a um valor de referência/limite técnico. Exemplo genérico: concentração medida C = 10,0 unidades com incerteza expandida U = 1,0 (k≈2).
Passo a passo prático (decisão com incerteza):
Passo 1: Registrar o resultado com incerteza. Intervalo aproximado de cobertura: [9,0; 11,0].
Passo 2: Comparar com o limite L.
- Se L = 9,5: parte do intervalo está abaixo e parte acima; a decisão “acima do limite” é sensível à incerteza.
- Se L = 8,0: todo o intervalo está acima; suporte mais robusto para “acima do limite”.
- Se L = 11,5: todo o intervalo está abaixo; suporte para “abaixo do limite”.
Passo 3: Verificar consistência com controles e calibração. Curva analítica, branco, duplicatas, padrões de controle interno. Um resultado “acima do limite” sem controles adequados não deve ser afirmado com o mesmo grau de confiança.
Passo 4: Redigir a interpretação sem extrapolar. Em vez de “ultrapassa o limite com certeza”, usar formulações como: “o valor medido é compatível com estar acima do limite” ou “considerando a incerteza, o resultado não permite afirmar com robustez que excede o limite”, conforme o caso.
8. Checklist de consistência estatística antes de finalizar o laudo
- As hipóteses H1/H2 estão claramente definidas e tecnicamente apropriadas?
- A população de referência (quando usada) está descrita e justificada?
- Há indicação de qualidade da amostra e de controles (negativo/positivo/replicatas)?
- Foram consideradas fontes de variabilidade (intra-fonte, inter-fonte, analítica)?
- Se houve decisão por limiar, o risco de erro tipo I/II foi reconhecido?
- Resultados numéricos incluem incerteza (IC/U) quando aplicável?
- A redação evita converter LR/raridade em probabilidade de autoria?
- Limitações e cenários alternativos plausíveis foram explicitados sem especulação?