Capa do Ebook gratuito Preparação Completa para Técnico do IBGE - Informações Geográficas e Estatísticas

Preparação Completa para Técnico do IBGE - Informações Geográficas e Estatísticas

Novo curso

19 páginas

Noções de Estatística Básica para Técnico do IBGE: medidas de tendência central e posição

Capítulo 8

Tempo estimado de leitura: 8 minutos

+ Exercício

Medidas de tendência central: ideia e uso

Medidas de tendência central resumem um conjunto de dados em um valor “típico”. Em provas, o ponto-chave é escolher a medida adequada ao enunciado: a média é sensível a valores extremos; a mediana é robusta a extremos; a moda destaca o valor mais frequente (útil para identificar padrão de ocorrência).

Média aritmética simples

Conceito: soma dos valores dividida pela quantidade de observações.

Fórmula: x̄ = (x1 + x2 + ... + xn) / n

Passo a passo prático:

  • Some todos os valores.
  • Conte quantos valores existem (n).
  • Divida a soma por n.

Exemplo (dados não agrupados): tempos (min) para atendimento: 8, 10, 12, 10, 60.

Continue em nosso aplicativo

Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.

ou continue lendo abaixo...
Download App

Baixar o aplicativo

  • Soma = 8 + 10 + 12 + 10 + 60 = 100
  • n = 5
  • Média = 100/5 = 20

Interpretação e efeito de extremo: apesar de quatro atendimentos estarem entre 8 e 12, a média ficou 20 por causa do valor extremo 60. Esse é um alerta típico em questões: “média elevada por outlier”.

Média aritmética ponderada

Conceito: usada quando cada valor tem um “peso” (frequência, importância, quantidade de pessoas, horas, etc.).

Fórmula: x̄p = (Σ wi·xi) / (Σ wi)

Passo a passo prático:

  • Multiplique cada valor (xi) pelo seu peso (wi).
  • Some os produtos.
  • Some os pesos.
  • Divida a soma dos produtos pela soma dos pesos.

Exemplo (contextualizado): em uma coleta, três setores tiveram produtividades (questionários/dia) e números de recenseadores:

Setor   Produtividade (xi)   Recenseadores (wi)  wi·xi  A        12                  4                  48  B        15                  2                  30  C        9                   4                  36

Σ(wi·xi)=48+30+36=114; Σwi=4+2+4=10; média ponderada = 114/10 = 11,4 questionários/dia.

Armadilha comum: fazer média simples de 12, 15 e 9 (que daria 12) ignorando que os grupos têm tamanhos diferentes.

Mediana: medida central robusta

Conceito: valor que divide o conjunto ordenado ao meio (50% abaixo e 50% acima). É indicada quando há assimetria ou valores extremos.

Mediana em dados não agrupados

Passo a passo:

  • Ordene os dados.
  • Se n é ímpar, a mediana é o valor na posição (n+1)/2.
  • Se n é par, a mediana é a média dos valores nas posições n/2 e n/2 + 1.

Exemplo (mesmos tempos): 8, 10, 10, 12, 60 (ordenado). n=5 ⇒ posição (5+1)/2=3 ⇒ mediana = 10.

Comparação com a média: média=20 e mediana=10. Em presença de extremo, a mediana representa melhor o “centro” típico.

Moda: valor mais frequente

Conceito: valor (ou classe) com maior frequência. Pode ser:

  • Amodal: não há repetição relevante (todas frequências iguais).
  • Unimodal: uma moda.
  • Bimodal/multimodal: duas ou mais modas.

Exemplo: 8, 10, 10, 12, 60 ⇒ moda = 10.

Interpretação: útil para identificar o valor mais comum (por exemplo, tempo mais frequente de atendimento), mesmo quando a média é distorcida.

Medidas de posição: quartis, decis e percentis

Ideia central: são pontos de corte em dados ordenados. A mediana é um caso particular: é o percentil 50 (P50) e também o 2º quartil (Q2).

  • Quartis: dividem em 4 partes iguais: Q1 (25%), Q2 (50%), Q3 (75%).
  • Decis: dividem em 10 partes: D1 (10%), ..., D9 (90%).
  • Percentis: dividem em 100 partes: P1, ..., P99.

Cálculo em dados não agrupados (método de posição)

Em concursos, é comum usar a posição teórica: pos(Pk) = k·(n+1)/100. Se a posição não for inteira, faz-se interpolação linear entre os vizinhos (ou o enunciado pode orientar arredondamento). Sempre verifique o método pedido.

Exemplo: dados (ordenados) de produtividade diária: 6, 7, 9, 10, 12, 13, 15, 18, 20 (n=9).

  • Q1 = P25: posição = 25·(9+1)/100 = 2,5 ⇒ entre o 2º (7) e o 3º (9). Interpolando: 7 + 0,5·(9−7) = 8.
  • Q2 = P50 (mediana): posição = 50·10/100 = 5 ⇒ 5º valor = 12.
  • Q3 = P75: posição = 75·10/100 = 7,5 ⇒ entre 7º (15) e 8º (18): 15 + 0,5·(3) = 16,5.

Interpretação: Q1=8 indica que 25% das produtividades são ≤ 8; Q3=16,5 indica que 75% são ≤ 16,5. O intervalo interquartílico (Q3−Q1) mede dispersão central e é pouco afetado por extremos.

Dados agrupados: média, mediana, moda e medidas de posição

Quando os dados são apresentados em classes (intervalos), calcula-se com aproximações. O cuidado principal é identificar: amplitude da classe (h), frequências (fi), frequência acumulada (Fi) e ponto médio (xi) de cada classe.

Média em dados agrupados

Conceito: usa-se o ponto médio de cada classe como representante.

Fórmula: x̄ ≈ (Σ fi·xi) / (Σ fi)

Exemplo (tabela): tempo de atendimento (min) em uma agência, por classes:

Classe (min)   fi   Ponto médio (xi)   fi·xi  0–10          6    5                 30  10–20         8    15                120  20–30         4    25                100  30–40         2    35                70  Total         20                      320

Média ≈ 320/20 = 16 min.

Interpretação: é um valor típico aproximado; não significa que alguém foi atendido exatamente em 16 min.

Mediana em dados agrupados

Ideia: localizar a classe mediana (onde cai a posição N/2) e interpolar dentro da classe.

Passo a passo:

  • Calcule N = Σfi.
  • Encontre a posição da mediana: N/2.
  • Monte Fi (frequência acumulada) e identifique a classe onde Fi ultrapassa N/2 (classe mediana).
  • Aplique: Mediana ≈ L + [(N/2 − Fantes)/fmed]·h

Onde L é o limite inferior da classe mediana, Fantes é a frequência acumulada antes da classe mediana, fmed é a frequência da classe mediana e h é a amplitude da classe.

Aplicando ao exemplo:

Classe (min)   fi   Fi  0–10          6    6  10–20         8    14  20–30         4    18  30–40         2    20
  • N=20 ⇒ N/2=10.
  • Fi ultrapassa 10 na classe 10–20 ⇒ classe mediana.
  • L=10, Fantes=6, fmed=8, h=10.
  • Mediana ≈ 10 + [(10−6)/8]·10 = 10 + (4/8)·10 = 15 min.

Leitura: cerca de 50% dos atendimentos duram até ~15 min.

Moda em dados agrupados

Ideia: a classe modal é a de maior frequência. Para estimar a moda dentro da classe, usa-se uma interpolação baseada nas frequências vizinhas.

Fórmula (moda agrupada): Mo ≈ L + [d1/(d1+d2)]·h, em que d1 = fmodal − fanterior e d2 = fmodal − fposterior.

No exemplo: classe modal é 10–20 (fi=8). fanterior=6, fposterior=4 ⇒ d1=2, d2=4, L=10, h=10.

Mo ≈ 10 + [2/(2+4)]·10 = 10 + (2/6)·10 ≈ 13,33 min.

Interpretação: valor mais provável (aproximado) dentro da classe de maior concentração.

Quartis, decis e percentis em dados agrupados

Ideia: localizar a classe que contém a posição desejada e interpolar como na mediana.

Fórmula geral: Pk ≈ L + [(k·N/100 − Fantes)/fclasse]·h

Exemplo (mesma tabela): calcule P90 (90º percentil).

  • N=20 ⇒ posição = 0,90·20 = 18.
  • Fi atinge 18 na classe 20–30 (Fi=18). Essa é a classe do P90 (pela regra “primeira classe com Fi ≥ posição”).
  • L=20, Fantes=14, fclasse=4, h=10.
  • P90 ≈ 20 + [(18−14)/4]·10 = 20 + 10 = 30 min.

Leitura: aproximadamente 90% dos atendimentos duram até 30 min (e 10% duram acima disso). Se a posição cair exatamente no limite superior, o resultado pode coincidir com a fronteira entre classes.

Comparações e armadilhas frequentes em prova

Média vs. mediana (assimetria e extremos)

Quando há valores extremos (ex.: poucos tempos muito altos), a média “puxa” para o extremo; a mediana tende a permanecer próxima do centro do bloco principal. Em enunciados com “renda”, “tempo de espera”, “custos” e “produtividade com poucos casos muito altos”, a mediana costuma ser mais representativa.

“Média dos grupos” não é média geral

Se o enunciado traz médias por setor e tamanhos diferentes, a média geral deve ser ponderada pelos tamanhos. A média simples das médias só vale quando os grupos têm o mesmo tamanho.

Percentil não é “porcentagem de aumento”

P90 é um ponto de corte: 90% dos valores estão abaixo (ou iguais) a ele. Não significa “aumentou 90%”.

Problemas contextualizados (com resolução)

Problema 1: média simples e impacto de outlier

Em um dia, os tempos (min) de 6 atendimentos foram: 9, 10, 10, 11, 12, 50. Calcule média e mediana e interprete.

Resolução:

  • Média = (9+10+10+11+12+50)/6 = 102/6 = 17.
  • Ordenado: 9, 10, 10, 11, 12, 50 ⇒ mediana = (3º e 4º)/2 = (10+11)/2 = 10,5.

Interpretação: a média (17) foi inflada pelo atendimento de 50 min; a mediana (10,5) descreve melhor o centro dos atendimentos típicos.

Problema 2: média ponderada por quantidade

Dois postos coletaram formulários: Posto A coletou 120 formulários com tempo médio de 8 min por formulário; Posto B coletou 30 formulários com tempo médio de 14 min. Qual o tempo médio geral por formulário?

Resolução: média ponderada pelos quantitativos.

  • Σwi·xi = 120·8 + 30·14 = 960 + 420 = 1380
  • Σwi = 150
  • Média geral = 1380/150 = 9,2 min

Armadilha: (8+14)/2=11 (incorreto), pois ignora que A tem muito mais formulários.

Problema 3: quartis em dados não agrupados

Os números de domicílios visitados por 11 recenseadores foram: 12, 15, 9, 20, 18, 15, 14, 10, 22, 16, 15. Encontre a mediana e o Q3 (use posição (n+1)).

Resolução: ordenando: 9, 10, 12, 14, 15, 15, 15, 16, 18, 20, 22 (n=11).

  • Mediana: posição (11+1)/2=6 ⇒ 6º valor = 15.
  • Q3 = P75: posição = 75·(12)/100 = 9 ⇒ 9º valor = 18.

Interpretação: 75% dos recenseadores visitaram até 18 domicílios.

Problema 4: mediana e percentil em dados agrupados

Distribuição do número de entrevistas por dia (N=40):

Entrevistas/dia   fi  0–4              6  4–8              10  8–12             14  12–16            8  16–20            2

Calcule a mediana e o P25.

Resolução: h=4. Frequência acumulada:

Classe   fi   Fi  0–4      6    6  4–8      10   16  8–12     14   30  12–16    8    38  16–20    2    40
  • Mediana: N/2=20. Classe mediana: 8–12 (Fi passa de 16 para 30). L=8, Fantes=16, f=14. Mediana ≈ 8 + [(20−16)/14]·4 = 8 + (4/14)·4 ≈ 9,14.
  • P25: posição = 0,25·40=10. Classe do P25: 4–8 (Fi chega a 16). L=4, Fantes=6, f=10. P25 ≈ 4 + [(10−6)/10]·4 = 5,6.

Interpretação: cerca de 25% fazem até ~5,6 entrevistas/dia; 50% fazem até ~9,14 entrevistas/dia.

Questões comentadas (estilo concurso)

Questão 1 (média vs. mediana)

Uma equipe registrou tempos (min) de deslocamento: 12, 13, 12, 14, 13, 120. A medida mais adequada para representar o tempo típico é:

a) média b) mediana c) moda d) média ponderada

Comentário: há um valor extremo (120) que distorce a média. Ordenando: 12, 12, 13, 13, 14, 120 ⇒ mediana = (3º e 4º)/2 = (13+13)/2 = 13. Alternativa b. Armadilha: marcar média por ser “mais conhecida”.

Questão 2 (média ponderada disfarçada)

Dois municípios têm rendas médias: Município X: R$ 1.800 (população 10 mil); Município Y: R$ 2.400 (população 2 mil). A renda média conjunta é:

a) R$ 2.100 b) R$ 1.900 c) R$ 2.300 d) R$ 2.000

Comentário: é média ponderada pela população. (1800·10000 + 2400·2000)/(12000) = (18.000.000 + 4.800.000)/12.000 = 22.800.000/12.000 = 1.900. Alternativa b. Armadilha: (1800+2400)/2=2100 (incorreto).

Questão 3 (mediana em dados agrupados)

Em uma distribuição de idades (anos):

Idade   fi  18–22   5  22–26   9  26–30   6

A mediana aproximada é:

a) 22 b) 24 c) 25 d) 26

Comentário: N=20 ⇒ N/2=10. Fi: 5, 14, 20 ⇒ classe mediana 22–26. L=22, Fantes=5, f=9, h=4. Mediana ≈ 22 + [(10−5)/9]·4 = 22 + (5/9)·4 ≈ 24,22. Alternativa mais próxima: b. Armadilha: escolher o limite inferior (22) sem interpolar.

Questão 4 (percentil: leitura do enunciado)

O P80 do tempo de atendimento é 18 min. Isso significa que:

a) 80% dos atendimentos duram exatamente 18 min b) 80% dos atendimentos duram até 18 min c) o tempo aumentou 80% d) 18 min é a média

Comentário: percentil é ponto de corte. P80=18 indica que cerca de 80% dos valores são ≤ 18. Alternativa b. Armadilhas: confundir com “exatamente” ou com média.

Agora responda o exercício sobre o conteúdo:

Ao calcular uma medida de tendência central para resumir um conjunto de tempos de atendimento com um valor extremamente alto (outlier), qual medida tende a representar melhor o “centro típico” dos dados?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Com valores extremos, a média pode ser distorcida (puxada para o outlier). A mediana depende da ordem dos dados e tende a permanecer próxima do bloco principal, representando melhor o centro típico.

Próximo capitúlo

Noções de Estatística Básica para Técnico do IBGE: dispersão e forma da distribuição

Arrow Right Icon
Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.