1. Probabilidade: ideias centrais e linguagem de prova
Probabilidade é uma medida numérica (entre 0 e 1) que quantifica o quão provável é um evento ocorrer em um experimento aleatório. Em provas, o foco costuma ser: definir corretamente o espaço amostral, identificar eventos e aplicar regras (adição, multiplicação, condicional e independência).
1.1 Experimento aleatório, espaço amostral e evento
Experimento aleatório: procedimento cujo resultado não é previsível com certeza (ex.: lançar um dado, sortear um domicílio, selecionar um questionário para auditoria).
Espaço amostral (Ω): conjunto de todos os resultados possíveis do experimento.
Evento (A): subconjunto de Ω; é algo que pode acontecer (ex.: “sair número par”).
- Evento certo: A = Ω, então P(A)=1
- Evento impossível: A = ∅, então P(A)=0
- Evento complementar: Aᶜ = Ω \ A, então P(Aᶜ)=1−P(A)
Exemplo 1 (dado honesto): lançar um dado.
Continue em nosso aplicativo
Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.
ou continue lendo abaixo...Baixar o aplicativo
- Ω = {1,2,3,4,5,6}
- A = “sair par” = {2,4,6}
- P(A) = 3/6 = 1/2
1.2 Probabilidade clássica (equiprovável)
Quando todos os resultados em Ω têm a mesma chance, usa-se:
P(A) = n(A) / n(Ω), onde n(.) é a quantidade de elementos.
Passo a passo prático (para questões equiprováveis):
- 1) Escreva Ω (ou pelo menos n(Ω)).
- 2) Descreva o evento A e conte n(A).
- 3) Calcule P(A)=n(A)/n(Ω) e simplifique.
2. Regras de adição e multiplicação
2.1 Regra de adição
Para dois eventos A e B:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
Se A e B forem mutuamente exclusivos (não podem ocorrer juntos), então A ∩ B = ∅ e:
P(A ∪ B) = P(A) + P(B)
Exemplo 2: em um dado, A = “sair 1 ou 2” e B = “sair par”.
- A = {1,2} ⇒ P(A)=2/6
- B = {2,4,6} ⇒ P(B)=3/6
- A ∩ B = {2} ⇒ P(A∩B)=1/6
- P(A∪B)=2/6+3/6−1/6=4/6=2/3
2.2 Regra de multiplicação (com condicional)
Para dois eventos A e B:
P(A ∩ B) = P(A) · P(B|A)
Interpretação: probabilidade de A acontecer e, depois, B acontecer dado que A ocorreu.
Exemplo 3 (sem reposição): urna com 3 bolas azuis e 2 vermelhas. Retira-se 2 bolas sem reposição. Qual a probabilidade de sair “azul e depois vermelha”?
- A = “1ª azul”: P(A)=3/5
- B = “2ª vermelha dado 1ª azul”: após sair azul, restam 2 vermelhas em 4 bolas ⇒ P(B|A)=2/4=1/2
- P(A∩B)=3/5·1/2=3/10
3. Independência e probabilidade condicional
3.1 Probabilidade condicional (nível básico)
P(B|A) = P(A ∩ B) / P(A), desde que P(A)>0.
Leitura: “probabilidade de B ocorrer sabendo que A ocorreu”. Em tabelas e problemas de pesquisa, isso aparece como “entre os que têm A, qual a proporção que tem B?”.
Exemplo 4 (interpretação direta): em uma amostra, 40 pessoas foram entrevistadas. Destas, 10 são jovens (A) e, entre os jovens, 6 usam transporte público (B). Então:
- P(B|A) = 6/10 = 0,6
3.2 Independência
Eventos A e B são independentes quando a ocorrência de um não altera a probabilidade do outro. Critérios equivalentes (em provas, use o que for mais fácil):
- P(B|A) = P(B)
- P(A ∩ B) = P(A)·P(B)
Exemplo 5: lançar uma moeda honesta e um dado honesto. A = “moeda dá cara”, B = “dado dá 6”.
- P(A)=1/2, P(B)=1/6
- P(A∩B)=1/2·1/6=1/12 (independentes)
Atenção: “disjuntos” (mutuamente exclusivos) não é o mesmo que “independentes”. Se A e B são disjuntos e ambos têm probabilidade >0, então não podem ser independentes, pois P(A∩B)=0, mas P(A)·P(B)>0.
4. Tabelas de contingência: leitura e probabilidades
Tabela de contingência cruza duas variáveis categóricas (ex.: sexo × situação de ocupação). Ela permite calcular probabilidades conjuntas, marginais e condicionais.
4.1 Exemplo de tabela e como extrair probabilidades
Suponha uma pesquisa com 200 pessoas, classificadas por “Trabalha” (Sim/Não) e “Curso técnico” (Sim/Não):
Curso técnico: Sim Curso técnico: Não Total (linha)
Trabalha: Sim 50 70 120
Trabalha: Não 30 50 80
Total (coluna) 80 120 200- Probabilidade conjunta: P(Trabalha e Curso=Sim)=50/200=0,25
- Probabilidade marginal: P(Trabalha)=120/200=0,60
- Condicional: P(Curso=Sim | Trabalha)=50/120≈0,4167
- Condicional: P(Trabalha | Curso=Sim)=50/80=0,625
Passo a passo prático (para questões com tabela):
- 1) Identifique o total geral (N).
- 2) Para probabilidade conjunta, use a célula correspondente / N.
- 3) Para marginal, use o total da linha ou coluna / N.
- 4) Para condicional “B|A”, use (célula A∩B) / (total de A).
4.2 Checagem rápida de consistência
- Somatórios: totais de linhas devem bater com o total geral; idem colunas.
- Probabilidades devem ficar entre 0 e 1.
- P(A∩B) ≤ P(A) e ≤ P(B).
5. Noções de amostragem: população, amostra e tipos
5.1 População e amostra
População: conjunto completo de unidades de interesse (ex.: todos os domicílios de um município; todas as empresas de um setor).
Amostra: subconjunto da população selecionado para observação, visando inferir características da população com custo/tempo menores.
Unidade amostral: elemento que pode ser selecionado (ex.: domicílio, pessoa, estabelecimento).
Quadro amostral: lista/estrutura que representa a população e permite selecionar unidades (cadastro, mapa de setores, lista de endereços).
5.2 Amostragem aleatória simples (AAS)
Na AAS, cada unidade da população tem a mesma probabilidade de ser selecionada, e a seleção é feita de forma aleatória.
Quando usar: população relativamente homogênea e quadro amostral completo.
Passo a passo prático (conceitual):
- 1) Defina a população e obtenha o quadro amostral.
- 2) Defina o tamanho da amostra (n).
- 3) Sorteie n unidades por método aleatório (números aleatórios, sorteio).
Risco comum: se o quadro amostral estiver desatualizado, pode haver viés de cobertura (unidades fora/ausentes do cadastro).
5.3 Amostragem estratificada
Divide-se a população em estratos (grupos internamente mais homogêneos) e sorteia-se uma amostra dentro de cada estrato.
Quando usar: quando há subgrupos importantes (ex.: áreas urbanas/rurais; faixas de renda; regiões) e deseja-se garantir representatividade de cada um.
Vantagens típicas:
- Melhora a precisão (reduz variabilidade) se os estratos forem bem definidos.
- Garante presença de estratos pequenos (evita “sumir” na amostra).
Exemplo prático: uma cidade tem 70% domicílios urbanos e 30% rurais. Em uma amostra de 100 domicílios, uma alocação proporcional selecionaria 70 urbanos e 30 rurais.
5.4 Amostragem por conglomerados (clusters)
Seleciona-se aleatoriamente conglomerados (grupos naturais, como quarteirões, setores censitários, escolas) e, dentro deles, observa-se todas as unidades ou uma subamostra.
Quando usar: quando é caro listar toda a população, mas é viável listar unidades dentro de conglomerados selecionados (reduz custo de deslocamento e operação).
Ponto de atenção: unidades dentro do mesmo conglomerado tendem a ser parecidas, o que pode reduzir a precisão em comparação com AAS do mesmo tamanho.
Exemplo prático: sortear 20 setores censitários e entrevistar 10 domicílios em cada setor (amostragem em dois estágios: conglomerado e, depois, unidades).
6. Vieses comuns em amostragem (o que a prova cobra)
6.1 Viés de seleção
Ocorre quando algumas unidades têm maior chance de entrar na amostra por causa do método (ex.: entrevistar apenas em horário comercial e excluir quem trabalha fora).
6.2 Viés de cobertura
O quadro amostral não representa toda a população (ex.: cadastro sem áreas novas; domicílios não listados).
6.3 Viés de não resposta
Parte dos selecionados não responde, e os não respondentes diferem dos respondentes (ex.: recusa maior em certas áreas).
6.4 Viés de mensuração (ou resposta)
Erro sistemático na coleta (pergunta mal formulada, entrevistador induzindo, registro incorreto).
7. Exercícios curtos com validação do resultado
Exercício 1 (espaço amostral e complemento)
Uma urna tem 5 cartões numerados de 1 a 5. Sorteia-se 1 cartão. Qual a probabilidade de NÃO sair número primo?
Raciocínio:
- Ω={1,2,3,4,5} (5 resultados)
- Primos: {2,3,5} (3 resultados)
- Não primo (complemento): {1,4} (2 resultados)
Resposta: P(não primo)=2/5=0,4.
Validação: P(primo)=3/5; 1−3/5=2/5, consistente.
Exercício 2 (adição com interseção)
Em um dado honesto, A = “sair múltiplo de 3” e B = “sair número par”. Calcule P(A ∪ B).
Raciocínio:
- A={3,6} ⇒ P(A)=2/6
- B={2,4,6} ⇒ P(B)=3/6
- A∩B={6} ⇒ P(A∩B)=1/6
Resposta: P(A∪B)=2/6+3/6−1/6=4/6=2/3.
Validação: A∪B={2,3,4,6} tem 4 resultados em 6, então 4/6.
Exercício 3 (multiplicação e condicional)
Uma equipe tem 4 técnicos, sendo 1 supervisor. Selecionam-se 2 pessoas sem reposição. Qual a probabilidade de selecionar o supervisor e depois um não supervisor?
Raciocínio:
- A = “1ª é supervisor”: P(A)=1/4
- B = “2ª é não supervisor | 1ª supervisor”: restam 3 não supervisores em 3 pessoas ⇒ P(B|A)=3/3=1
- P(A∩B)=1/4·1=1/4
Resposta: 1/4.
Validação: se o supervisor saiu primeiro, necessariamente o segundo é não supervisor; então a probabilidade é só a do primeiro evento.
Exercício 4 (tabela de contingência e condicional)
Use a tabela (N=200) do item 4.1. Calcule P(Trabalha | Curso técnico = Não).
Raciocínio:
- Total com Curso=Não: 120
- Trabalha e Curso=Não: 70
- P(Trabalha | Curso=Não)=70/120=7/12≈0,5833
Resposta: 7/12≈0,5833.
Validação: valor entre 0 e 1; e é maior que P(Trabalha e Curso=Não)=70/200=0,35, como esperado.
8. Questões estilo prova (com explicação do raciocínio)
Questão 1 (independência)
Em uma pesquisa, P(A)=0,4, P(B)=0,5 e P(A∩B)=0,2. Os eventos A e B são independentes?
Raciocínio: se independentes, deveria valer P(A∩B)=P(A)·P(B)=0,4·0,5=0,2.
Resposta: Sim, são independentes.
Validação: como a igualdade bate exatamente, o critério de independência é satisfeito.
Questão 2 (probabilidade condicional)
Uma amostra de 100 domicílios registrou 30 domicílios com internet (I). Desses 30, 18 têm computador (C). Qual é P(C|I)?
Raciocínio: condicional “C dado I” é a proporção de C dentro do grupo I.
Resposta: P(C|I)=18/30=0,6.
Validação: não depende do total 100 diretamente; depende do subconjunto com I.
Questão 3 (adição com exclusão)
Em um cadastro, 60% têm telefone (T), 35% têm e-mail (E) e 20% têm ambos. Qual a probabilidade de ter telefone OU e-mail?
Raciocínio: usar inclusão-exclusão.
Resposta: P(T∪E)=0,60+0,35−0,20=0,75.
Validação: como há sobreposição (20%), subtrai-se para não contar duas vezes; resultado plausível (≤1).
Questão 4 (amostragem: identificar o tipo)
Um município é dividido em setores censitários. Sorteiam-se 15 setores e, em cada setor sorteado, entrevistam-se todos os domicílios de uma rua previamente escolhida. O plano é mais bem descrito como:
- A) Aleatória simples
- B) Estratificada
- C) Por conglomerados (em estágios)
- D) Não probabilística por conveniência
Raciocínio: primeiro seleciona conglomerados (setores), depois seleciona unidades dentro deles (domicílios de uma rua). Isso caracteriza conglomerados em estágios.
Resposta: C) Por conglomerados (em estágios).
Validação: não é estratificada porque não há divisão em estratos com amostra em cada estrato; o foco é reduzir custo via agrupamentos.
Questão 5 (viés comum)
Uma pesquisa domiciliar seleciona aleatoriamente domicílios, mas realiza entrevistas apenas em dias úteis, das 9h às 16h. Qual viés é mais provável?
- A) Viés de cobertura
- B) Viés de seleção
- C) Viés de mensuração
- D) Viés de processamento
Raciocínio: o horário pode excluir sistematicamente pessoas que trabalham fora e estão ausentes, alterando a chance efetiva de participação.
Resposta: B) Viés de seleção (associado ao procedimento de coleta/contato).
Validação: não é cobertura (o cadastro pode estar completo), nem mensuração (não é erro de pergunta), e sim um mecanismo que afeta quem entra/permanece na amostra respondente.