Capa do Ebook gratuito Analista do IBGE: Estudo Avançado em Estatística, Geografia e Políticas Públicas

Analista do IBGE: Estudo Avançado em Estatística, Geografia e Políticas Públicas

Novo curso

15 páginas

Probabilidade para Analista do IBGE: fundamentos, variáveis aleatórias e distribuições

Capítulo 3

Tempo estimado de leitura: 11 minutos

+ Exercício

Probabilidade é a linguagem formal para quantificar incerteza em fenômenos observados pelo IBGE: respostas de questionários, contagens de eventos, tempos de ocorrência e medidas contínuas (renda, área, precipitação). Em amostragem e inferência, ela conecta o mecanismo gerador dos dados (população e processo de coleta) ao comportamento esperado de estimadores e testes.

1. Conceitos operacionais: experimento, espaço amostral e eventos

Experimento aleatório: procedimento com resultado incerto (ex.: selecionar um domicílio e registrar se houve recusa). Espaço amostral (Ω): conjunto de todos os resultados possíveis. Evento (A): subconjunto de Ω (ex.: “domicílio recusou”).

  • Operações: complemento Aᶜ, união A∪B, interseção A∩B.
  • Eventos mutuamente exclusivos: A∩B=∅.
  • Partição: {A1,…,Ak} disjuntos e cuja união é Ω (útil para decompor probabilidades por estratos, perfis ou etapas de coleta).

Exemplo prático (eventos em campo)

Ω={entrevista completa, recusa, domicílio fechado}. Defina A={recusa}, B={fechado}. Então A∩B=∅ e P(A∪B)=P(A)+P(B).

2. Axiomas de probabilidade e consequências úteis

Uma probabilidade P(·) satisfaz:

  • (A1) 0 ≤ P(A) ≤ 1.
  • (A2) P(Ω)=1.
  • (A3) Se A1,A2,… são disjuntos, então P(∪i Ai)=∑i P(Ai).

Consequências operacionais:

Continue em nosso aplicativo

Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.

ou continue lendo abaixo...
Download App

Baixar o aplicativo

  • P(Aᶜ)=1−P(A).
  • P(A∪B)=P(A)+P(B)−P(A∩B).
  • Se A⊆B então P(A)≤P(B).

3. Probabilidade condicional, regra do produto e independência

Probabilidade condicional quantifica incerteza após observar informação: P(A|B)=P(A∩B)/P(B), com P(B)>0.

Regra do produto: P(A∩B)=P(A|B)P(B)=P(B|A)P(A).

Independência: A e B são independentes se P(A∩B)=P(A)P(B), equivalente a P(A|B)=P(A) (quando P(B)>0).

Aplicação direta em amostragem e qualidade

Em auditoria de consistência, pode-se avaliar se “erro de digitação” é independente de “turno de coleta”. Se não for, a taxa de erro deve ser modelada condicionada ao turno (estratificação operacional).

Passo a passo: calcular P(A|B) em um cenário de recusa

  • 1) Defina A: “recusa”. Defina B: “área urbana”.
  • 2) Estime P(A∩B): proporção de domicílios urbanos que recusaram no total da amostra.
  • 3) Estime P(B): proporção de domicílios urbanos na amostra.
  • 4) Calcule P(A|B)=P(A∩B)/P(B).
  • 5) Compare com P(A|Bᶜ) para avaliar diferença por domínio.

4. Teorema de Bayes e aplicações em classificação e detecção de erros

O Teorema de Bayes inverte condicionais:

P(A|B) = P(B|A) P(A) / P(B)

Com partição {A1,…,Ak}:

P(Aj|B) = P(B|Aj) P(Aj) / Σi P(B|Ai) P(Ai)

Classificação: identificar provável tipo de erro

Suponha que um registro seja sinalizado por uma regra automática B (“renda muito alta para o perfil”). Existem dois tipos de causa: A1=“erro de digitação” e A2=“valor verdadeiro raro”. Bayes permite calcular P(A1|B) e P(A2|B) combinando: (i) prevalências P(A1), P(A2) e (ii) sensibilidade da regra P(B|A1), P(B|A2).

Passo a passo: Bayes para triagem de inconsistências

  • 1) Defina classes de causa (A1,…,Ak) e o sinal/alerta B.
  • 2) Estime priors P(Ai) com histórico de auditorias (proporção de cada causa).
  • 3) Estime P(B|Ai) (taxa de disparo do alerta quando a causa é Ai).
  • 4) Calcule P(B)=Σi P(B|Ai)P(Ai).
  • 5) Calcule P(Aj|B) para priorizar revisão manual (maior posterior primeiro).

5. Variáveis aleatórias (VAs): discretas e contínuas

Variável aleatória X é uma função que associa um número real a cada resultado em Ω. Em pesquisas, X pode ser: número de moradores (discreta), tempo até entrevista (contínua), indicador de resposta (0/1).

5.1 VA discreta: função de probabilidade (pmf)

Para X discreta, a função de probabilidade é p(x)=P(X=x), com p(x)≥0 e Σx p(x)=1.

5.2 VA contínua: densidade (pdf) e distribuição acumulada

Para X contínua, a densidade f(x) satisfaz f(x)≥0 e ∫ f(x) dx=1. Probabilidades são áreas: P(a≤X≤b)=∫a^b f(x) dx. A função distribuição acumulada é F(x)=P(X≤x).

6. Medidas fundamentais: esperança, variância, momentos e funções geradoras

6.1 Esperança (média teórica)

Interpretação: valor médio de longo prazo. Em amostragem, aparece como alvo de estimadores (ex.: média populacional) e como componente de viés.

  • Discreta: E[X]=Σx x p(x).
  • Contínua: E[X]=∫ x f(x) dx.

Propriedades úteis: E[aX+b]=aE[X]+b; E[X+Y]=E[X]+E[Y] (sempre, sem exigir independência).

6.2 Variância e desvio-padrão

Variância mede dispersão: Var(X)=E[(X−E[X])²]=E[X²]−(E[X])². Propriedades: Var(aX+b)=a²Var(X). Se X e Y independentes, Var(X+Y)=Var(X)+Var(Y).

6.3 Momentos e momentos centrais

  • k-ésimo momento: E[X^k].
  • k-ésimo momento central: E[(X−E[X])^k].
  • Assimetria e curtose derivam de momentos centrais padronizados (úteis para checagens de plausibilidade e escolha de modelos).

6.4 Funções geradoras (quando usar)

MGF (função geradora de momentos): M_X(t)=E[e^{tX}] quando existe. Ajuda a obter momentos e somas de VAs independentes.

PGF (geradora de probabilidades, para discretas não negativas): G_X(s)=E[s^X]. Muito útil em contagens e processos de Poisson.

Função característica: φ_X(t)=E[e^{itX}] (sempre existe). Útil em resultados teóricos e aproximações.

7. Distribuições centrais (parâmetros, interpretação e quando usar)

7.1 Bernoulli

Quando usar: evento binário (respondeu/não respondeu; erro/não erro). Parâmetro: p=P(X=1). Suporte: {0,1}.

P(X=1)=p, P(X=0)=1-p

E[X]=p; Var(X)=p(1−p).

7.2 Binomial

Quando usar: número de sucessos em n tentativas independentes com mesma probabilidade p (ex.: n contatos e contar quantas entrevistas completas). Parâmetros: n, p.

P(X=k)=C(n,k) p^k (1-p)^(n-k), k=0,...,n

E[X]=np; Var(X)=np(1−p).

7.3 Poisson

Quando usar: contagens de eventos raros em intervalo/área com taxa constante (ex.: número de inconsistências por lote; ocorrências por município em período). Parâmetro: λ (média/taxa no intervalo).

P(X=k)=e^{-λ} λ^k / k!, k=0,1,2,...

E[X]=λ; Var(X)=λ. Aproxima Binomial quando n grande e p pequeno (λ=np).

7.4 Geométrica

Quando usar: número de tentativas até o primeiro sucesso (ex.: quantas ligações até obter entrevista). Parâmetro: p.

P(X=k)=(1-p)^(k-1) p, k=1,2,...

E[X]=1/p; Var(X)=(1−p)/p². Propriedade de falta de memória (versão discreta).

7.5 Hipergeométrica

Quando usar: amostragem sem reposição em população finita (muito alinhado a desenho amostral). Parâmetros: N (população), K (sucessos na população), n (amostra). X=sucessos na amostra.

P(X=k)= [C(K,k) C(N-K, n-k)] / C(N,n)

E[X]=n(K/N). Variância incorpora correção de população finita.

7.6 Uniforme (contínua)

Quando usar: ausência de preferência dentro de um intervalo; simulações; erros de arredondamento modelados de forma simples. Parâmetros: a,b (a<b).

f(x)=1/(b-a), a≤x≤b

E[X]=(a+b)/2; Var(X)=(b−a)²/12.

7.7 Normal

Quando usar: medidas agregadas e erros aproximados por soma de muitos efeitos; base para inferência clássica e aproximações (CLT). Parâmetros: μ, σ².

f(x)= (1/(σ√(2π))) exp(-(x-μ)^2/(2σ^2))

Padronização: Z=(X−μ)/σ ~ N(0,1). Interpretação: μ é centro; σ controla dispersão.

7.8 Exponencial

Quando usar: tempo entre eventos em processo de Poisson; tempo até ocorrência com taxa constante (ex.: tempo até conseguir contato bem-sucedido, sob hipótese simplificada). Parâmetro: λ (taxa).

f(x)=λ e^{-λx}, x≥0

E[X]=1/λ; Var(X)=1/λ². Propriedade de falta de memória (contínua).

7.9 Gama

Quando usar: tempos positivos com assimetria; soma de exponenciais; modelagem de duração/espera com heterogeneidade. Parâmetros: forma α (k), escala θ (ou taxa β=1/θ).

f(x)= x^{α-1} e^{-x/θ} / (Γ(α) θ^α), x≥0

E[X]=αθ; Var(X)=αθ². Caso especial: Exponencial é Gama com α=1.

7.10 Qui-quadrado (χ²)

Quando usar: inferência sobre variância normal; testes de aderência e independência em tabelas; base para intervalos e testes. Parâmetro: ν (graus de liberdade).

Se Zi ~ N(0,1) independentes, então Σ Zi² ~ χ²(ν).

7.11 t de Student

Quando usar: inferência sobre média com variância desconhecida e amostra pequena sob normalidade; muito comum em testes e intervalos. Parâmetro: ν.

Se Z~N(0,1) e V~χ²(ν) independentes, então T=Z/√(V/ν) ~ t(ν).

7.12 F

Quando usar: comparação de variâncias; base de testes em modelos lineares (razão de variâncias explicada/erro). Parâmetros: ν1, ν2.

Se V1~χ²(ν1), V2~χ²(ν2) independentes, então (V1/ν1)/(V2/ν2) ~ F(ν1,ν2).

8. Escolha rápida do modelo: contagens, taxas e tempos

8.1 Contagens

  • Binomial: contagem de “sucessos” em n tentativas com reposição/independência aproximada.
  • Hipergeométrica: contagem de sucessos em amostra sem reposição de população finita.
  • Poisson: contagem em intervalo/área com taxa λ; útil para eventos raros.

8.2 Taxas e proporções

  • Proporção amostral de Bernoulli/Binomial: base para estimar p (taxa de recusa, taxa de erro).
  • Taxa de eventos por exposição: frequentemente modelada via Poisson (eventos por tempo, por km², por domicílios visitados).

8.3 Tempos e durações

  • Exponencial: tempo até evento com taxa constante (modelo simples).
  • Gama: tempos positivos mais flexíveis (assimetria, soma de etapas).
  • Normal: tempos podem ser aproximados por normal após transformação (ex.: log) ou em médias de muitos tempos.

9. Exercícios aplicados (seleção do modelo e cálculo)

1) Bernoulli (indicador de resposta)

Em um domínio, a probabilidade de um domicílio responder é p=0,82. Defina X=1 se respondeu, 0 caso contrário.

  • a) Calcule E[X] e Var(X).
  • b) Interprete E[X] como taxa esperada de resposta.

2) Binomial (entrevistas completas em n tentativas)

Uma equipe realiza n=30 contatos independentes, com probabilidade p=0,7 de entrevista completa em cada contato.

  • a) Qual a probabilidade de obter exatamente 20 entrevistas completas?
  • b) Calcule E[X] e Var(X) para X=número de entrevistas completas.

3) Hipergeométrica (amostragem sem reposição)

Em um cadastro com N=500 domicílios, K=80 têm pendência documental. Seleciona-se n=50 sem reposição.

  • a) Modele X=número de pendências na amostra e escreva P(X=k).
  • b) Calcule E[X].

4) Poisson (contagem de erros por lote)

Um sistema registra em média λ=2,4 inconsistências por lote processado.

  • a) Qual a probabilidade de um lote ter zero inconsistências?
  • b) Qual a probabilidade de ter pelo menos 5 inconsistências?

5) Geométrica (tentativas até sucesso)

A probabilidade de conseguir contato efetivo em uma ligação é p=0,25. Seja X o número de ligações até o primeiro contato efetivo.

  • a) Calcule P(X=3).
  • b) Calcule E[X] e interprete.

6) Condicional e independência (qualidade por turno)

Em um mês, P(erro)=0,06. Sabe-se que P(turno noite)=0,30 e P(erro|noite)=0,10.

  • a) Calcule P(erro ∩ noite).
  • b) Calcule P(erro|dia).
  • c) Erro e turno são independentes? Justifique com uma igualdade.

7) Bayes (triagem de registros suspeitos)

Um alerta B (“valor extremo”) pode ser causado por A1=erro de digitação ou A2=valor verdadeiro raro. Suponha P(A1)=0,04, P(A2)=0,96, P(B|A1)=0,90 e P(B|A2)=0,02.

  • a) Calcule P(B).
  • b) Calcule P(A1|B) e interprete como probabilidade de ser erro dado o alerta.

8) Exponencial (tempo até entrevista)

Modele o tempo (em horas) até concluir uma entrevista como Exponencial com taxa λ=0,5.

  • a) Calcule P(X>3).
  • b) Calcule o tempo médio esperado.

9) Gama (tempo total de duas etapas)

O tempo de uma etapa de verificação é Exponencial com taxa λ=1 por hora, e o processo exige 3 etapas independentes. Modele o tempo total T.

  • a) Identifique a distribuição de T e seus parâmetros.
  • b) Calcule E[T] e Var(T).

10) Normal, t e χ² (inferência sob normalidade)

Uma variável contínua (ex.: medida física) é aproximadamente normal. Em uma amostra pequena, a variância populacional é desconhecida.

  • a) Qual distribuição usar para inferir sobre a média: Normal ou t? Explique em termos de σ conhecido/desconhecido.
  • b) Qual distribuição aparece ao construir intervalo para σ² sob normalidade?

11) F (comparação de variâncias)

Duas equipes usam procedimentos diferentes e você deseja comparar a variabilidade do tempo de entrevista entre elas, assumindo normalidade.

  • a) Qual distribuição modela a razão das variâncias amostrais?
  • b) Interprete o que significa obter um valor muito maior que 1.

12) Escolha do modelo (mapeamento cenário → distribuição)

Associe cada cenário ao modelo mais adequado e justifique em 1 frase:

  • a) Número de domicílios com “campo obrigatório em branco” em 1.000 formulários, com baixa taxa de ocorrência.
  • b) Número de sucessos ao auditar 40 registros, com reposição e probabilidade constante de erro.
  • c) Número de sucessos ao auditar 40 registros sem reposição de um lote finito de 400 registros com 60 erros conhecidos.
  • d) Tempo até a próxima ocorrência de falha em um sistema com taxa constante.
  • e) Soma de vários tempos positivos de etapas independentes.

Agora responda o exercício sobre o conteúdo:

Em uma auditoria operacional, observou-se que a taxa de erro difere entre turnos de coleta. O que essa evidência sugere sobre a relação entre “erro de digitação” (A) e “turno” (B), e qual a implicação prática?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Se a taxa de erro muda por turno, então em geral P(A|B)  P(A), indicando falta de independeancia. Na pre1tica, a taxa deve ser analisada/modelada condicionada ao turno (estratificae7e3o operacional).

Próximo capitúlo

Inferência estatística para Analista do IBGE: estimação, testes de hipóteses e intervalos de confiança

Arrow Right Icon
Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.