Probabilidade é a linguagem formal para quantificar incerteza em fenômenos observados pelo IBGE: respostas de questionários, contagens de eventos, tempos de ocorrência e medidas contínuas (renda, área, precipitação). Em amostragem e inferência, ela conecta o mecanismo gerador dos dados (população e processo de coleta) ao comportamento esperado de estimadores e testes.
1. Conceitos operacionais: experimento, espaço amostral e eventos
Experimento aleatório: procedimento com resultado incerto (ex.: selecionar um domicílio e registrar se houve recusa). Espaço amostral (Ω): conjunto de todos os resultados possíveis. Evento (A): subconjunto de Ω (ex.: “domicílio recusou”).
- Operações: complemento Aᶜ, união A∪B, interseção A∩B.
- Eventos mutuamente exclusivos: A∩B=∅.
- Partição: {A1,…,Ak} disjuntos e cuja união é Ω (útil para decompor probabilidades por estratos, perfis ou etapas de coleta).
Exemplo prático (eventos em campo)
Ω={entrevista completa, recusa, domicílio fechado}. Defina A={recusa}, B={fechado}. Então A∩B=∅ e P(A∪B)=P(A)+P(B).
2. Axiomas de probabilidade e consequências úteis
Uma probabilidade P(·) satisfaz:
- (A1) 0 ≤ P(A) ≤ 1.
- (A2) P(Ω)=1.
- (A3) Se A1,A2,… são disjuntos, então P(∪i Ai)=∑i P(Ai).
Consequências operacionais:
Continue em nosso aplicativo
Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.
ou continue lendo abaixo...Baixar o aplicativo
- P(Aᶜ)=1−P(A).
- P(A∪B)=P(A)+P(B)−P(A∩B).
- Se A⊆B então P(A)≤P(B).
3. Probabilidade condicional, regra do produto e independência
Probabilidade condicional quantifica incerteza após observar informação: P(A|B)=P(A∩B)/P(B), com P(B)>0.
Regra do produto: P(A∩B)=P(A|B)P(B)=P(B|A)P(A).
Independência: A e B são independentes se P(A∩B)=P(A)P(B), equivalente a P(A|B)=P(A) (quando P(B)>0).
Aplicação direta em amostragem e qualidade
Em auditoria de consistência, pode-se avaliar se “erro de digitação” é independente de “turno de coleta”. Se não for, a taxa de erro deve ser modelada condicionada ao turno (estratificação operacional).
Passo a passo: calcular P(A|B) em um cenário de recusa
- 1) Defina A: “recusa”. Defina B: “área urbana”.
- 2) Estime P(A∩B): proporção de domicílios urbanos que recusaram no total da amostra.
- 3) Estime P(B): proporção de domicílios urbanos na amostra.
- 4) Calcule P(A|B)=P(A∩B)/P(B).
- 5) Compare com P(A|Bᶜ) para avaliar diferença por domínio.
4. Teorema de Bayes e aplicações em classificação e detecção de erros
O Teorema de Bayes inverte condicionais:
P(A|B) = P(B|A) P(A) / P(B)Com partição {A1,…,Ak}:
P(Aj|B) = P(B|Aj) P(Aj) / Σi P(B|Ai) P(Ai)Classificação: identificar provável tipo de erro
Suponha que um registro seja sinalizado por uma regra automática B (“renda muito alta para o perfil”). Existem dois tipos de causa: A1=“erro de digitação” e A2=“valor verdadeiro raro”. Bayes permite calcular P(A1|B) e P(A2|B) combinando: (i) prevalências P(A1), P(A2) e (ii) sensibilidade da regra P(B|A1), P(B|A2).
Passo a passo: Bayes para triagem de inconsistências
- 1) Defina classes de causa (A1,…,Ak) e o sinal/alerta B.
- 2) Estime priors P(Ai) com histórico de auditorias (proporção de cada causa).
- 3) Estime P(B|Ai) (taxa de disparo do alerta quando a causa é Ai).
- 4) Calcule P(B)=Σi P(B|Ai)P(Ai).
- 5) Calcule P(Aj|B) para priorizar revisão manual (maior posterior primeiro).
5. Variáveis aleatórias (VAs): discretas e contínuas
Variável aleatória X é uma função que associa um número real a cada resultado em Ω. Em pesquisas, X pode ser: número de moradores (discreta), tempo até entrevista (contínua), indicador de resposta (0/1).
5.1 VA discreta: função de probabilidade (pmf)
Para X discreta, a função de probabilidade é p(x)=P(X=x), com p(x)≥0 e Σx p(x)=1.
5.2 VA contínua: densidade (pdf) e distribuição acumulada
Para X contínua, a densidade f(x) satisfaz f(x)≥0 e ∫ f(x) dx=1. Probabilidades são áreas: P(a≤X≤b)=∫a^b f(x) dx. A função distribuição acumulada é F(x)=P(X≤x).
6. Medidas fundamentais: esperança, variância, momentos e funções geradoras
6.1 Esperança (média teórica)
Interpretação: valor médio de longo prazo. Em amostragem, aparece como alvo de estimadores (ex.: média populacional) e como componente de viés.
- Discreta: E[X]=Σx x p(x).
- Contínua: E[X]=∫ x f(x) dx.
Propriedades úteis: E[aX+b]=aE[X]+b; E[X+Y]=E[X]+E[Y] (sempre, sem exigir independência).
6.2 Variância e desvio-padrão
Variância mede dispersão: Var(X)=E[(X−E[X])²]=E[X²]−(E[X])². Propriedades: Var(aX+b)=a²Var(X). Se X e Y independentes, Var(X+Y)=Var(X)+Var(Y).
6.3 Momentos e momentos centrais
- k-ésimo momento: E[X^k].
- k-ésimo momento central: E[(X−E[X])^k].
- Assimetria e curtose derivam de momentos centrais padronizados (úteis para checagens de plausibilidade e escolha de modelos).
6.4 Funções geradoras (quando usar)
MGF (função geradora de momentos): M_X(t)=E[e^{tX}] quando existe. Ajuda a obter momentos e somas de VAs independentes.
PGF (geradora de probabilidades, para discretas não negativas): G_X(s)=E[s^X]. Muito útil em contagens e processos de Poisson.
Função característica: φ_X(t)=E[e^{itX}] (sempre existe). Útil em resultados teóricos e aproximações.
7. Distribuições centrais (parâmetros, interpretação e quando usar)
7.1 Bernoulli
Quando usar: evento binário (respondeu/não respondeu; erro/não erro). Parâmetro: p=P(X=1). Suporte: {0,1}.
P(X=1)=p, P(X=0)=1-pE[X]=p; Var(X)=p(1−p).
7.2 Binomial
Quando usar: número de sucessos em n tentativas independentes com mesma probabilidade p (ex.: n contatos e contar quantas entrevistas completas). Parâmetros: n, p.
P(X=k)=C(n,k) p^k (1-p)^(n-k), k=0,...,nE[X]=np; Var(X)=np(1−p).
7.3 Poisson
Quando usar: contagens de eventos raros em intervalo/área com taxa constante (ex.: número de inconsistências por lote; ocorrências por município em período). Parâmetro: λ (média/taxa no intervalo).
P(X=k)=e^{-λ} λ^k / k!, k=0,1,2,...E[X]=λ; Var(X)=λ. Aproxima Binomial quando n grande e p pequeno (λ=np).
7.4 Geométrica
Quando usar: número de tentativas até o primeiro sucesso (ex.: quantas ligações até obter entrevista). Parâmetro: p.
P(X=k)=(1-p)^(k-1) p, k=1,2,...E[X]=1/p; Var(X)=(1−p)/p². Propriedade de falta de memória (versão discreta).
7.5 Hipergeométrica
Quando usar: amostragem sem reposição em população finita (muito alinhado a desenho amostral). Parâmetros: N (população), K (sucessos na população), n (amostra). X=sucessos na amostra.
P(X=k)= [C(K,k) C(N-K, n-k)] / C(N,n)E[X]=n(K/N). Variância incorpora correção de população finita.
7.6 Uniforme (contínua)
Quando usar: ausência de preferência dentro de um intervalo; simulações; erros de arredondamento modelados de forma simples. Parâmetros: a,b (a<b).
f(x)=1/(b-a), a≤x≤bE[X]=(a+b)/2; Var(X)=(b−a)²/12.
7.7 Normal
Quando usar: medidas agregadas e erros aproximados por soma de muitos efeitos; base para inferência clássica e aproximações (CLT). Parâmetros: μ, σ².
f(x)= (1/(σ√(2π))) exp(-(x-μ)^2/(2σ^2))Padronização: Z=(X−μ)/σ ~ N(0,1). Interpretação: μ é centro; σ controla dispersão.
7.8 Exponencial
Quando usar: tempo entre eventos em processo de Poisson; tempo até ocorrência com taxa constante (ex.: tempo até conseguir contato bem-sucedido, sob hipótese simplificada). Parâmetro: λ (taxa).
f(x)=λ e^{-λx}, x≥0E[X]=1/λ; Var(X)=1/λ². Propriedade de falta de memória (contínua).
7.9 Gama
Quando usar: tempos positivos com assimetria; soma de exponenciais; modelagem de duração/espera com heterogeneidade. Parâmetros: forma α (k), escala θ (ou taxa β=1/θ).
f(x)= x^{α-1} e^{-x/θ} / (Γ(α) θ^α), x≥0E[X]=αθ; Var(X)=αθ². Caso especial: Exponencial é Gama com α=1.
7.10 Qui-quadrado (χ²)
Quando usar: inferência sobre variância normal; testes de aderência e independência em tabelas; base para intervalos e testes. Parâmetro: ν (graus de liberdade).
Se Zi ~ N(0,1) independentes, então Σ Zi² ~ χ²(ν).
7.11 t de Student
Quando usar: inferência sobre média com variância desconhecida e amostra pequena sob normalidade; muito comum em testes e intervalos. Parâmetro: ν.
Se Z~N(0,1) e V~χ²(ν) independentes, então T=Z/√(V/ν) ~ t(ν).
7.12 F
Quando usar: comparação de variâncias; base de testes em modelos lineares (razão de variâncias explicada/erro). Parâmetros: ν1, ν2.
Se V1~χ²(ν1), V2~χ²(ν2) independentes, então (V1/ν1)/(V2/ν2) ~ F(ν1,ν2).
8. Escolha rápida do modelo: contagens, taxas e tempos
8.1 Contagens
- Binomial: contagem de “sucessos” em n tentativas com reposição/independência aproximada.
- Hipergeométrica: contagem de sucessos em amostra sem reposição de população finita.
- Poisson: contagem em intervalo/área com taxa λ; útil para eventos raros.
8.2 Taxas e proporções
- Proporção amostral de Bernoulli/Binomial: base para estimar p (taxa de recusa, taxa de erro).
- Taxa de eventos por exposição: frequentemente modelada via Poisson (eventos por tempo, por km², por domicílios visitados).
8.3 Tempos e durações
- Exponencial: tempo até evento com taxa constante (modelo simples).
- Gama: tempos positivos mais flexíveis (assimetria, soma de etapas).
- Normal: tempos podem ser aproximados por normal após transformação (ex.: log) ou em médias de muitos tempos.
9. Exercícios aplicados (seleção do modelo e cálculo)
1) Bernoulli (indicador de resposta)
Em um domínio, a probabilidade de um domicílio responder é p=0,82. Defina X=1 se respondeu, 0 caso contrário.
- a) Calcule E[X] e Var(X).
- b) Interprete E[X] como taxa esperada de resposta.
2) Binomial (entrevistas completas em n tentativas)
Uma equipe realiza n=30 contatos independentes, com probabilidade p=0,7 de entrevista completa em cada contato.
- a) Qual a probabilidade de obter exatamente 20 entrevistas completas?
- b) Calcule E[X] e Var(X) para X=número de entrevistas completas.
3) Hipergeométrica (amostragem sem reposição)
Em um cadastro com N=500 domicílios, K=80 têm pendência documental. Seleciona-se n=50 sem reposição.
- a) Modele X=número de pendências na amostra e escreva P(X=k).
- b) Calcule E[X].
4) Poisson (contagem de erros por lote)
Um sistema registra em média λ=2,4 inconsistências por lote processado.
- a) Qual a probabilidade de um lote ter zero inconsistências?
- b) Qual a probabilidade de ter pelo menos 5 inconsistências?
5) Geométrica (tentativas até sucesso)
A probabilidade de conseguir contato efetivo em uma ligação é p=0,25. Seja X o número de ligações até o primeiro contato efetivo.
- a) Calcule P(X=3).
- b) Calcule E[X] e interprete.
6) Condicional e independência (qualidade por turno)
Em um mês, P(erro)=0,06. Sabe-se que P(turno noite)=0,30 e P(erro|noite)=0,10.
- a) Calcule P(erro ∩ noite).
- b) Calcule P(erro|dia).
- c) Erro e turno são independentes? Justifique com uma igualdade.
7) Bayes (triagem de registros suspeitos)
Um alerta B (“valor extremo”) pode ser causado por A1=erro de digitação ou A2=valor verdadeiro raro. Suponha P(A1)=0,04, P(A2)=0,96, P(B|A1)=0,90 e P(B|A2)=0,02.
- a) Calcule P(B).
- b) Calcule P(A1|B) e interprete como probabilidade de ser erro dado o alerta.
8) Exponencial (tempo até entrevista)
Modele o tempo (em horas) até concluir uma entrevista como Exponencial com taxa λ=0,5.
- a) Calcule P(X>3).
- b) Calcule o tempo médio esperado.
9) Gama (tempo total de duas etapas)
O tempo de uma etapa de verificação é Exponencial com taxa λ=1 por hora, e o processo exige 3 etapas independentes. Modele o tempo total T.
- a) Identifique a distribuição de T e seus parâmetros.
- b) Calcule E[T] e Var(T).
10) Normal, t e χ² (inferência sob normalidade)
Uma variável contínua (ex.: medida física) é aproximadamente normal. Em uma amostra pequena, a variância populacional é desconhecida.
- a) Qual distribuição usar para inferir sobre a média: Normal ou t? Explique em termos de σ conhecido/desconhecido.
- b) Qual distribuição aparece ao construir intervalo para σ² sob normalidade?
11) F (comparação de variâncias)
Duas equipes usam procedimentos diferentes e você deseja comparar a variabilidade do tempo de entrevista entre elas, assumindo normalidade.
- a) Qual distribuição modela a razão das variâncias amostrais?
- b) Interprete o que significa obter um valor muito maior que 1.
12) Escolha do modelo (mapeamento cenário → distribuição)
Associe cada cenário ao modelo mais adequado e justifique em 1 frase:
- a) Número de domicílios com “campo obrigatório em branco” em 1.000 formulários, com baixa taxa de ocorrência.
- b) Número de sucessos ao auditar 40 registros, com reposição e probabilidade constante de erro.
- c) Número de sucessos ao auditar 40 registros sem reposição de um lote finito de 400 registros com 60 erros conhecidos.
- d) Tempo até a próxima ocorrência de falha em um sistema com taxa constante.
- e) Soma de vários tempos positivos de etapas independentes.