Medidas de tendência central: ideia e uso
Medidas de tendência central resumem um conjunto de dados em um valor “típico”. Em provas, o ponto-chave é escolher a medida adequada ao enunciado: a média é sensível a valores extremos; a mediana é robusta a extremos; a moda destaca o valor mais frequente (útil para identificar padrão de ocorrência).
Média aritmética simples
Conceito: soma dos valores dividida pela quantidade de observações.
Fórmula: x̄ = (x1 + x2 + ... + xn) / n
Passo a passo prático:
- Some todos os valores.
- Conte quantos valores existem (n).
- Divida a soma por n.
Exemplo (dados não agrupados): tempos (min) para atendimento: 8, 10, 12, 10, 60.
Continue em nosso aplicativo
Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.
ou continue lendo abaixo...Baixar o aplicativo
- Soma = 8 + 10 + 12 + 10 + 60 = 100
- n = 5
- Média = 100/5 = 20
Interpretação e efeito de extremo: apesar de quatro atendimentos estarem entre 8 e 12, a média ficou 20 por causa do valor extremo 60. Esse é um alerta típico em questões: “média elevada por outlier”.
Média aritmética ponderada
Conceito: usada quando cada valor tem um “peso” (frequência, importância, quantidade de pessoas, horas, etc.).
Fórmula: x̄p = (Σ wi·xi) / (Σ wi)
Passo a passo prático:
- Multiplique cada valor (xi) pelo seu peso (wi).
- Some os produtos.
- Some os pesos.
- Divida a soma dos produtos pela soma dos pesos.
Exemplo (contextualizado): em uma coleta, três setores tiveram produtividades (questionários/dia) e números de recenseadores:
Setor Produtividade (xi) Recenseadores (wi) wi·xi A 12 4 48 B 15 2 30 C 9 4 36Σ(wi·xi)=48+30+36=114; Σwi=4+2+4=10; média ponderada = 114/10 = 11,4 questionários/dia.
Armadilha comum: fazer média simples de 12, 15 e 9 (que daria 12) ignorando que os grupos têm tamanhos diferentes.
Mediana: medida central robusta
Conceito: valor que divide o conjunto ordenado ao meio (50% abaixo e 50% acima). É indicada quando há assimetria ou valores extremos.
Mediana em dados não agrupados
Passo a passo:
- Ordene os dados.
- Se n é ímpar, a mediana é o valor na posição (n+1)/2.
- Se n é par, a mediana é a média dos valores nas posições n/2 e n/2 + 1.
Exemplo (mesmos tempos): 8, 10, 10, 12, 60 (ordenado). n=5 ⇒ posição (5+1)/2=3 ⇒ mediana = 10.
Comparação com a média: média=20 e mediana=10. Em presença de extremo, a mediana representa melhor o “centro” típico.
Moda: valor mais frequente
Conceito: valor (ou classe) com maior frequência. Pode ser:
- Amodal: não há repetição relevante (todas frequências iguais).
- Unimodal: uma moda.
- Bimodal/multimodal: duas ou mais modas.
Exemplo: 8, 10, 10, 12, 60 ⇒ moda = 10.
Interpretação: útil para identificar o valor mais comum (por exemplo, tempo mais frequente de atendimento), mesmo quando a média é distorcida.
Medidas de posição: quartis, decis e percentis
Ideia central: são pontos de corte em dados ordenados. A mediana é um caso particular: é o percentil 50 (P50) e também o 2º quartil (Q2).
- Quartis: dividem em 4 partes iguais: Q1 (25%), Q2 (50%), Q3 (75%).
- Decis: dividem em 10 partes: D1 (10%), ..., D9 (90%).
- Percentis: dividem em 100 partes: P1, ..., P99.
Cálculo em dados não agrupados (método de posição)
Em concursos, é comum usar a posição teórica: pos(Pk) = k·(n+1)/100. Se a posição não for inteira, faz-se interpolação linear entre os vizinhos (ou o enunciado pode orientar arredondamento). Sempre verifique o método pedido.
Exemplo: dados (ordenados) de produtividade diária: 6, 7, 9, 10, 12, 13, 15, 18, 20 (n=9).
- Q1 = P25: posição = 25·(9+1)/100 = 2,5 ⇒ entre o 2º (7) e o 3º (9). Interpolando: 7 + 0,5·(9−7) = 8.
- Q2 = P50 (mediana): posição = 50·10/100 = 5 ⇒ 5º valor = 12.
- Q3 = P75: posição = 75·10/100 = 7,5 ⇒ entre 7º (15) e 8º (18): 15 + 0,5·(3) = 16,5.
Interpretação: Q1=8 indica que 25% das produtividades são ≤ 8; Q3=16,5 indica que 75% são ≤ 16,5. O intervalo interquartílico (Q3−Q1) mede dispersão central e é pouco afetado por extremos.
Dados agrupados: média, mediana, moda e medidas de posição
Quando os dados são apresentados em classes (intervalos), calcula-se com aproximações. O cuidado principal é identificar: amplitude da classe (h), frequências (fi), frequência acumulada (Fi) e ponto médio (xi) de cada classe.
Média em dados agrupados
Conceito: usa-se o ponto médio de cada classe como representante.
Fórmula: x̄ ≈ (Σ fi·xi) / (Σ fi)
Exemplo (tabela): tempo de atendimento (min) em uma agência, por classes:
Classe (min) fi Ponto médio (xi) fi·xi 0–10 6 5 30 10–20 8 15 120 20–30 4 25 100 30–40 2 35 70 Total 20 320Média ≈ 320/20 = 16 min.
Interpretação: é um valor típico aproximado; não significa que alguém foi atendido exatamente em 16 min.
Mediana em dados agrupados
Ideia: localizar a classe mediana (onde cai a posição N/2) e interpolar dentro da classe.
Passo a passo:
- Calcule N = Σfi.
- Encontre a posição da mediana: N/2.
- Monte Fi (frequência acumulada) e identifique a classe onde Fi ultrapassa N/2 (classe mediana).
- Aplique: Mediana ≈ L + [(N/2 − Fantes)/fmed]·h
Onde L é o limite inferior da classe mediana, Fantes é a frequência acumulada antes da classe mediana, fmed é a frequência da classe mediana e h é a amplitude da classe.
Aplicando ao exemplo:
Classe (min) fi Fi 0–10 6 6 10–20 8 14 20–30 4 18 30–40 2 20- N=20 ⇒ N/2=10.
- Fi ultrapassa 10 na classe 10–20 ⇒ classe mediana.
- L=10, Fantes=6, fmed=8, h=10.
- Mediana ≈ 10 + [(10−6)/8]·10 = 10 + (4/8)·10 = 15 min.
Leitura: cerca de 50% dos atendimentos duram até ~15 min.
Moda em dados agrupados
Ideia: a classe modal é a de maior frequência. Para estimar a moda dentro da classe, usa-se uma interpolação baseada nas frequências vizinhas.
Fórmula (moda agrupada): Mo ≈ L + [d1/(d1+d2)]·h, em que d1 = fmodal − fanterior e d2 = fmodal − fposterior.
No exemplo: classe modal é 10–20 (fi=8). fanterior=6, fposterior=4 ⇒ d1=2, d2=4, L=10, h=10.
Mo ≈ 10 + [2/(2+4)]·10 = 10 + (2/6)·10 ≈ 13,33 min.
Interpretação: valor mais provável (aproximado) dentro da classe de maior concentração.
Quartis, decis e percentis em dados agrupados
Ideia: localizar a classe que contém a posição desejada e interpolar como na mediana.
Fórmula geral: Pk ≈ L + [(k·N/100 − Fantes)/fclasse]·h
Exemplo (mesma tabela): calcule P90 (90º percentil).
- N=20 ⇒ posição = 0,90·20 = 18.
- Fi atinge 18 na classe 20–30 (Fi=18). Essa é a classe do P90 (pela regra “primeira classe com Fi ≥ posição”).
- L=20, Fantes=14, fclasse=4, h=10.
- P90 ≈ 20 + [(18−14)/4]·10 = 20 + 10 = 30 min.
Leitura: aproximadamente 90% dos atendimentos duram até 30 min (e 10% duram acima disso). Se a posição cair exatamente no limite superior, o resultado pode coincidir com a fronteira entre classes.
Comparações e armadilhas frequentes em prova
Média vs. mediana (assimetria e extremos)
Quando há valores extremos (ex.: poucos tempos muito altos), a média “puxa” para o extremo; a mediana tende a permanecer próxima do centro do bloco principal. Em enunciados com “renda”, “tempo de espera”, “custos” e “produtividade com poucos casos muito altos”, a mediana costuma ser mais representativa.
“Média dos grupos” não é média geral
Se o enunciado traz médias por setor e tamanhos diferentes, a média geral deve ser ponderada pelos tamanhos. A média simples das médias só vale quando os grupos têm o mesmo tamanho.
Percentil não é “porcentagem de aumento”
P90 é um ponto de corte: 90% dos valores estão abaixo (ou iguais) a ele. Não significa “aumentou 90%”.
Problemas contextualizados (com resolução)
Problema 1: média simples e impacto de outlier
Em um dia, os tempos (min) de 6 atendimentos foram: 9, 10, 10, 11, 12, 50. Calcule média e mediana e interprete.
Resolução:
- Média = (9+10+10+11+12+50)/6 = 102/6 = 17.
- Ordenado: 9, 10, 10, 11, 12, 50 ⇒ mediana = (3º e 4º)/2 = (10+11)/2 = 10,5.
Interpretação: a média (17) foi inflada pelo atendimento de 50 min; a mediana (10,5) descreve melhor o centro dos atendimentos típicos.
Problema 2: média ponderada por quantidade
Dois postos coletaram formulários: Posto A coletou 120 formulários com tempo médio de 8 min por formulário; Posto B coletou 30 formulários com tempo médio de 14 min. Qual o tempo médio geral por formulário?
Resolução: média ponderada pelos quantitativos.
- Σwi·xi = 120·8 + 30·14 = 960 + 420 = 1380
- Σwi = 150
- Média geral = 1380/150 = 9,2 min
Armadilha: (8+14)/2=11 (incorreto), pois ignora que A tem muito mais formulários.
Problema 3: quartis em dados não agrupados
Os números de domicílios visitados por 11 recenseadores foram: 12, 15, 9, 20, 18, 15, 14, 10, 22, 16, 15. Encontre a mediana e o Q3 (use posição (n+1)).
Resolução: ordenando: 9, 10, 12, 14, 15, 15, 15, 16, 18, 20, 22 (n=11).
- Mediana: posição (11+1)/2=6 ⇒ 6º valor = 15.
- Q3 = P75: posição = 75·(12)/100 = 9 ⇒ 9º valor = 18.
Interpretação: 75% dos recenseadores visitaram até 18 domicílios.
Problema 4: mediana e percentil em dados agrupados
Distribuição do número de entrevistas por dia (N=40):
Entrevistas/dia fi 0–4 6 4–8 10 8–12 14 12–16 8 16–20 2Calcule a mediana e o P25.
Resolução: h=4. Frequência acumulada:
Classe fi Fi 0–4 6 6 4–8 10 16 8–12 14 30 12–16 8 38 16–20 2 40- Mediana: N/2=20. Classe mediana: 8–12 (Fi passa de 16 para 30). L=8, Fantes=16, f=14. Mediana ≈ 8 + [(20−16)/14]·4 = 8 + (4/14)·4 ≈ 9,14.
- P25: posição = 0,25·40=10. Classe do P25: 4–8 (Fi chega a 16). L=4, Fantes=6, f=10. P25 ≈ 4 + [(10−6)/10]·4 = 5,6.
Interpretação: cerca de 25% fazem até ~5,6 entrevistas/dia; 50% fazem até ~9,14 entrevistas/dia.
Questões comentadas (estilo concurso)
Questão 1 (média vs. mediana)
Uma equipe registrou tempos (min) de deslocamento: 12, 13, 12, 14, 13, 120. A medida mais adequada para representar o tempo típico é:
a) média b) mediana c) moda d) média ponderada
Comentário: há um valor extremo (120) que distorce a média. Ordenando: 12, 12, 13, 13, 14, 120 ⇒ mediana = (3º e 4º)/2 = (13+13)/2 = 13. Alternativa b. Armadilha: marcar média por ser “mais conhecida”.
Questão 2 (média ponderada disfarçada)
Dois municípios têm rendas médias: Município X: R$ 1.800 (população 10 mil); Município Y: R$ 2.400 (população 2 mil). A renda média conjunta é:
a) R$ 2.100 b) R$ 1.900 c) R$ 2.300 d) R$ 2.000
Comentário: é média ponderada pela população. (1800·10000 + 2400·2000)/(12000) = (18.000.000 + 4.800.000)/12.000 = 22.800.000/12.000 = 1.900. Alternativa b. Armadilha: (1800+2400)/2=2100 (incorreto).
Questão 3 (mediana em dados agrupados)
Em uma distribuição de idades (anos):
Idade fi 18–22 5 22–26 9 26–30 6A mediana aproximada é:
a) 22 b) 24 c) 25 d) 26
Comentário: N=20 ⇒ N/2=10. Fi: 5, 14, 20 ⇒ classe mediana 22–26. L=22, Fantes=5, f=9, h=4. Mediana ≈ 22 + [(10−5)/9]·4 = 22 + (5/9)·4 ≈ 24,22. Alternativa mais próxima: b. Armadilha: escolher o limite inferior (22) sem interpolar.
Questão 4 (percentil: leitura do enunciado)
O P80 do tempo de atendimento é 18 min. Isso significa que:
a) 80% dos atendimentos duram exatamente 18 min b) 80% dos atendimentos duram até 18 min c) o tempo aumentou 80% d) 18 min é a média
Comentário: percentil é ponto de corte. P80=18 indica que cerca de 80% dos valores são ≤ 18. Alternativa b. Armadilhas: confundir com “exatamente” ou com média.