Capa do Ebook gratuito Preparação Completa para Técnico do IBGE - Informações Geográficas e Estatísticas

Preparação Completa para Técnico do IBGE - Informações Geográficas e Estatísticas

Novo curso

19 páginas

Noções de Estatística Básica para Técnico do IBGE: probabilidade e noções de amostragem

Capítulo 10

Tempo estimado de leitura: 10 minutos

+ Exercício

1. Probabilidade: ideias centrais e linguagem de prova

Probabilidade é uma medida numérica (entre 0 e 1) que quantifica o quão provável é um evento ocorrer em um experimento aleatório. Em provas, o foco costuma ser: definir corretamente o espaço amostral, identificar eventos e aplicar regras (adição, multiplicação, condicional e independência).

1.1 Experimento aleatório, espaço amostral e evento

Experimento aleatório: procedimento cujo resultado não é previsível com certeza (ex.: lançar um dado, sortear um domicílio, selecionar um questionário para auditoria).

Espaço amostral (Ω): conjunto de todos os resultados possíveis do experimento.

Evento (A): subconjunto de Ω; é algo que pode acontecer (ex.: “sair número par”).

  • Evento certo: A = Ω, então P(A)=1
  • Evento impossível: A = ∅, então P(A)=0
  • Evento complementar: Aᶜ = Ω \ A, então P(Aᶜ)=1−P(A)

Exemplo 1 (dado honesto): lançar um dado.

Continue em nosso aplicativo

Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.

ou continue lendo abaixo...
Download App

Baixar o aplicativo

  • Ω = {1,2,3,4,5,6}
  • A = “sair par” = {2,4,6}
  • P(A) = 3/6 = 1/2

1.2 Probabilidade clássica (equiprovável)

Quando todos os resultados em Ω têm a mesma chance, usa-se:

P(A) = n(A) / n(Ω), onde n(.) é a quantidade de elementos.

Passo a passo prático (para questões equiprováveis):

  • 1) Escreva Ω (ou pelo menos n(Ω)).
  • 2) Descreva o evento A e conte n(A).
  • 3) Calcule P(A)=n(A)/n(Ω) e simplifique.

2. Regras de adição e multiplicação

2.1 Regra de adição

Para dois eventos A e B:

P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Se A e B forem mutuamente exclusivos (não podem ocorrer juntos), então A ∩ B = ∅ e:

P(A ∪ B) = P(A) + P(B)

Exemplo 2: em um dado, A = “sair 1 ou 2” e B = “sair par”.

  • A = {1,2} ⇒ P(A)=2/6
  • B = {2,4,6} ⇒ P(B)=3/6
  • A ∩ B = {2} ⇒ P(A∩B)=1/6
  • P(A∪B)=2/6+3/6−1/6=4/6=2/3

2.2 Regra de multiplicação (com condicional)

Para dois eventos A e B:

P(A ∩ B) = P(A) · P(B|A)

Interpretação: probabilidade de A acontecer e, depois, B acontecer dado que A ocorreu.

Exemplo 3 (sem reposição): urna com 3 bolas azuis e 2 vermelhas. Retira-se 2 bolas sem reposição. Qual a probabilidade de sair “azul e depois vermelha”?

  • A = “1ª azul”: P(A)=3/5
  • B = “2ª vermelha dado 1ª azul”: após sair azul, restam 2 vermelhas em 4 bolas ⇒ P(B|A)=2/4=1/2
  • P(A∩B)=3/5·1/2=3/10

3. Independência e probabilidade condicional

3.1 Probabilidade condicional (nível básico)

P(B|A) = P(A ∩ B) / P(A), desde que P(A)>0.

Leitura: “probabilidade de B ocorrer sabendo que A ocorreu”. Em tabelas e problemas de pesquisa, isso aparece como “entre os que têm A, qual a proporção que tem B?”.

Exemplo 4 (interpretação direta): em uma amostra, 40 pessoas foram entrevistadas. Destas, 10 são jovens (A) e, entre os jovens, 6 usam transporte público (B). Então:

  • P(B|A) = 6/10 = 0,6

3.2 Independência

Eventos A e B são independentes quando a ocorrência de um não altera a probabilidade do outro. Critérios equivalentes (em provas, use o que for mais fácil):

  • P(B|A) = P(B)
  • P(A ∩ B) = P(A)·P(B)

Exemplo 5: lançar uma moeda honesta e um dado honesto. A = “moeda dá cara”, B = “dado dá 6”.

  • P(A)=1/2, P(B)=1/6
  • P(A∩B)=1/2·1/6=1/12 (independentes)

Atenção: “disjuntos” (mutuamente exclusivos) não é o mesmo que “independentes”. Se A e B são disjuntos e ambos têm probabilidade >0, então não podem ser independentes, pois P(A∩B)=0, mas P(A)·P(B)>0.

4. Tabelas de contingência: leitura e probabilidades

Tabela de contingência cruza duas variáveis categóricas (ex.: sexo × situação de ocupação). Ela permite calcular probabilidades conjuntas, marginais e condicionais.

4.1 Exemplo de tabela e como extrair probabilidades

Suponha uma pesquisa com 200 pessoas, classificadas por “Trabalha” (Sim/Não) e “Curso técnico” (Sim/Não):

                 Curso técnico: Sim   Curso técnico: Não   Total (linha)  
Trabalha: Sim              50                 70              120  
Trabalha: Não              30                 50               80  
Total (coluna)             80                120              200
  • Probabilidade conjunta: P(Trabalha e Curso=Sim)=50/200=0,25
  • Probabilidade marginal: P(Trabalha)=120/200=0,60
  • Condicional: P(Curso=Sim | Trabalha)=50/120≈0,4167
  • Condicional: P(Trabalha | Curso=Sim)=50/80=0,625

Passo a passo prático (para questões com tabela):

  • 1) Identifique o total geral (N).
  • 2) Para probabilidade conjunta, use a célula correspondente / N.
  • 3) Para marginal, use o total da linha ou coluna / N.
  • 4) Para condicional “B|A”, use (célula A∩B) / (total de A).

4.2 Checagem rápida de consistência

  • Somatórios: totais de linhas devem bater com o total geral; idem colunas.
  • Probabilidades devem ficar entre 0 e 1.
  • P(A∩B) ≤ P(A) e ≤ P(B).

5. Noções de amostragem: população, amostra e tipos

5.1 População e amostra

População: conjunto completo de unidades de interesse (ex.: todos os domicílios de um município; todas as empresas de um setor).

Amostra: subconjunto da população selecionado para observação, visando inferir características da população com custo/tempo menores.

Unidade amostral: elemento que pode ser selecionado (ex.: domicílio, pessoa, estabelecimento).

Quadro amostral: lista/estrutura que representa a população e permite selecionar unidades (cadastro, mapa de setores, lista de endereços).

5.2 Amostragem aleatória simples (AAS)

Na AAS, cada unidade da população tem a mesma probabilidade de ser selecionada, e a seleção é feita de forma aleatória.

Quando usar: população relativamente homogênea e quadro amostral completo.

Passo a passo prático (conceitual):

  • 1) Defina a população e obtenha o quadro amostral.
  • 2) Defina o tamanho da amostra (n).
  • 3) Sorteie n unidades por método aleatório (números aleatórios, sorteio).

Risco comum: se o quadro amostral estiver desatualizado, pode haver viés de cobertura (unidades fora/ausentes do cadastro).

5.3 Amostragem estratificada

Divide-se a população em estratos (grupos internamente mais homogêneos) e sorteia-se uma amostra dentro de cada estrato.

Quando usar: quando há subgrupos importantes (ex.: áreas urbanas/rurais; faixas de renda; regiões) e deseja-se garantir representatividade de cada um.

Vantagens típicas:

  • Melhora a precisão (reduz variabilidade) se os estratos forem bem definidos.
  • Garante presença de estratos pequenos (evita “sumir” na amostra).

Exemplo prático: uma cidade tem 70% domicílios urbanos e 30% rurais. Em uma amostra de 100 domicílios, uma alocação proporcional selecionaria 70 urbanos e 30 rurais.

5.4 Amostragem por conglomerados (clusters)

Seleciona-se aleatoriamente conglomerados (grupos naturais, como quarteirões, setores censitários, escolas) e, dentro deles, observa-se todas as unidades ou uma subamostra.

Quando usar: quando é caro listar toda a população, mas é viável listar unidades dentro de conglomerados selecionados (reduz custo de deslocamento e operação).

Ponto de atenção: unidades dentro do mesmo conglomerado tendem a ser parecidas, o que pode reduzir a precisão em comparação com AAS do mesmo tamanho.

Exemplo prático: sortear 20 setores censitários e entrevistar 10 domicílios em cada setor (amostragem em dois estágios: conglomerado e, depois, unidades).

6. Vieses comuns em amostragem (o que a prova cobra)

6.1 Viés de seleção

Ocorre quando algumas unidades têm maior chance de entrar na amostra por causa do método (ex.: entrevistar apenas em horário comercial e excluir quem trabalha fora).

6.2 Viés de cobertura

O quadro amostral não representa toda a população (ex.: cadastro sem áreas novas; domicílios não listados).

6.3 Viés de não resposta

Parte dos selecionados não responde, e os não respondentes diferem dos respondentes (ex.: recusa maior em certas áreas).

6.4 Viés de mensuração (ou resposta)

Erro sistemático na coleta (pergunta mal formulada, entrevistador induzindo, registro incorreto).

7. Exercícios curtos com validação do resultado

Exercício 1 (espaço amostral e complemento)

Uma urna tem 5 cartões numerados de 1 a 5. Sorteia-se 1 cartão. Qual a probabilidade de NÃO sair número primo?

Raciocínio:

  • Ω={1,2,3,4,5} (5 resultados)
  • Primos: {2,3,5} (3 resultados)
  • Não primo (complemento): {1,4} (2 resultados)

Resposta: P(não primo)=2/5=0,4.

Validação: P(primo)=3/5; 1−3/5=2/5, consistente.

Exercício 2 (adição com interseção)

Em um dado honesto, A = “sair múltiplo de 3” e B = “sair número par”. Calcule P(A ∪ B).

Raciocínio:

  • A={3,6} ⇒ P(A)=2/6
  • B={2,4,6} ⇒ P(B)=3/6
  • A∩B={6} ⇒ P(A∩B)=1/6

Resposta: P(A∪B)=2/6+3/6−1/6=4/6=2/3.

Validação: A∪B={2,3,4,6} tem 4 resultados em 6, então 4/6.

Exercício 3 (multiplicação e condicional)

Uma equipe tem 4 técnicos, sendo 1 supervisor. Selecionam-se 2 pessoas sem reposição. Qual a probabilidade de selecionar o supervisor e depois um não supervisor?

Raciocínio:

  • A = “1ª é supervisor”: P(A)=1/4
  • B = “2ª é não supervisor | 1ª supervisor”: restam 3 não supervisores em 3 pessoas ⇒ P(B|A)=3/3=1
  • P(A∩B)=1/4·1=1/4

Resposta: 1/4.

Validação: se o supervisor saiu primeiro, necessariamente o segundo é não supervisor; então a probabilidade é só a do primeiro evento.

Exercício 4 (tabela de contingência e condicional)

Use a tabela (N=200) do item 4.1. Calcule P(Trabalha | Curso técnico = Não).

Raciocínio:

  • Total com Curso=Não: 120
  • Trabalha e Curso=Não: 70
  • P(Trabalha | Curso=Não)=70/120=7/12≈0,5833

Resposta: 7/12≈0,5833.

Validação: valor entre 0 e 1; e é maior que P(Trabalha e Curso=Não)=70/200=0,35, como esperado.

8. Questões estilo prova (com explicação do raciocínio)

Questão 1 (independência)

Em uma pesquisa, P(A)=0,4, P(B)=0,5 e P(A∩B)=0,2. Os eventos A e B são independentes?

Raciocínio: se independentes, deveria valer P(A∩B)=P(A)·P(B)=0,4·0,5=0,2.

Resposta: Sim, são independentes.

Validação: como a igualdade bate exatamente, o critério de independência é satisfeito.

Questão 2 (probabilidade condicional)

Uma amostra de 100 domicílios registrou 30 domicílios com internet (I). Desses 30, 18 têm computador (C). Qual é P(C|I)?

Raciocínio: condicional “C dado I” é a proporção de C dentro do grupo I.

Resposta: P(C|I)=18/30=0,6.

Validação: não depende do total 100 diretamente; depende do subconjunto com I.

Questão 3 (adição com exclusão)

Em um cadastro, 60% têm telefone (T), 35% têm e-mail (E) e 20% têm ambos. Qual a probabilidade de ter telefone OU e-mail?

Raciocínio: usar inclusão-exclusão.

Resposta: P(T∪E)=0,60+0,35−0,20=0,75.

Validação: como há sobreposição (20%), subtrai-se para não contar duas vezes; resultado plausível (≤1).

Questão 4 (amostragem: identificar o tipo)

Um município é dividido em setores censitários. Sorteiam-se 15 setores e, em cada setor sorteado, entrevistam-se todos os domicílios de uma rua previamente escolhida. O plano é mais bem descrito como:

  • A) Aleatória simples
  • B) Estratificada
  • C) Por conglomerados (em estágios)
  • D) Não probabilística por conveniência

Raciocínio: primeiro seleciona conglomerados (setores), depois seleciona unidades dentro deles (domicílios de uma rua). Isso caracteriza conglomerados em estágios.

Resposta: C) Por conglomerados (em estágios).

Validação: não é estratificada porque não há divisão em estratos com amostra em cada estrato; o foco é reduzir custo via agrupamentos.

Questão 5 (viés comum)

Uma pesquisa domiciliar seleciona aleatoriamente domicílios, mas realiza entrevistas apenas em dias úteis, das 9h às 16h. Qual viés é mais provável?

  • A) Viés de cobertura
  • B) Viés de seleção
  • C) Viés de mensuração
  • D) Viés de processamento

Raciocínio: o horário pode excluir sistematicamente pessoas que trabalham fora e estão ausentes, alterando a chance efetiva de participação.

Resposta: B) Viés de seleção (associado ao procedimento de coleta/contato).

Validação: não é cobertura (o cadastro pode estar completo), nem mensuração (não é erro de pergunta), e sim um mecanismo que afeta quem entra/permanece na amostra respondente.

Agora responda o exercício sobre o conteúdo:

Em uma tabela de contingência, como calcular a probabilidade condicional P(B|A)?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Probabilidade condicional mede a proporção de B dentro do grupo que satisfaz A. Em tabela, isso é (A∩B)/(total de A).

Próximo capitúlo

Fundamentos de Geografia para Técnico do IBGE: cartografia, escala e coordenadas

Arrow Right Icon
Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.