Dispersão: por que ela importa em estatística aplicada ao IBGE
Medidas de tendência central (como média e mediana) resumem o “nível” dos dados, mas não dizem o quanto os valores variam. Em contextos do IBGE, duas regiões podem ter a mesma média de um indicador (ex.: renda, taxa de desemprego, produção agrícola) e, ainda assim, uma delas ser muito mais heterogênea. As medidas de dispersão quantificam essa variabilidade e ajudam a comparar séries e avaliar estabilidade.
Amplitude (range)
Conceito
A amplitude é a medida de dispersão mais simples: diferença entre o maior e o menor valor da série.
Fórmula: Amplitude = xmax − xmin
Passo a passo prático
- Identifique o menor valor (xmin).
- Identifique o maior valor (xmax).
- Subtraia: xmax − xmin.
Exemplo
Taxa de desocupação (%) em 5 regiões: 6, 7, 7, 9, 11.
- xmin = 6
- xmax = 11
- Amplitude = 11 − 6 = 5 (pontos percentuais)
Interpretação: a diferença entre a região com menor e maior taxa é de 5 p.p. A amplitude é sensível a extremos e não usa todos os valores no cálculo.
Continue em nosso aplicativo
Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.
ou continue lendo abaixo...Baixar o aplicativo
Variância e desvio padrão
Ideia central
A variância mede o “espalhamento” em torno da média usando os desvios (diferenças) de cada valor em relação à média. Como esses desvios podem ser negativos, elevamos ao quadrado. O desvio padrão é a raiz quadrada da variância, voltando à unidade original dos dados (mais interpretável em provas).
Fórmulas (população e amostra)
Variância populacional: σ² = Σ(xi − μ)² / N
Desvio padrão populacional: σ = √σ²
Variância amostral: s² = Σ(xi − x̄)² / (n − 1)
Desvio padrão amostral: s = √s²
Em concursos, é comum indicar se os dados representam uma população (usa N) ou uma amostra (usa n−1). Quando não indicado, muitas questões trabalham como população para simplificar.
Passo a passo (cálculo direto)
- Calcule a média (μ ou x̄).
- Calcule os desvios: (xi − média).
- Eleve ao quadrado: (xi − média)².
- Some os quadrados: Σ(xi − média)².
- Divida por N (população) ou por (n−1) (amostra) para obter a variância.
- Tire a raiz quadrada para obter o desvio padrão.
Exemplo 1 (população): variabilidade entre regiões
Considere a produção (em mil toneladas) de um produto em 4 regiões: 10, 12, 14, 16.
1) Média: μ = (10+12+14+16)/4 = 52/4 = 13
2) Desvios e quadrados:
- (10−13) = −3 → 9
- (12−13) = −1 → 1
- (14−13) = 1 → 1
- (16−13) = 3 → 9
3) Soma dos quadrados: 9+1+1+9 = 20
4) Variância populacional: σ² = 20/4 = 5
5) Desvio padrão: σ = √5 ≈ 2,236
Interpretação: em média, os valores se afastam da média (13) em cerca de 2,24 mil toneladas. Quanto maior o desvio padrão, maior a heterogeneidade entre regiões.
Exemplo 2 (amostra): quando usar n−1
Uma amostra de 5 municípios tem o indicador X: 2, 4, 4, 4, 6.
1) Média: x̄ = (2+4+4+4+6)/5 = 20/5 = 4
2) Quadrados dos desvios:
- (2−4)² = 4
- (4−4)² = 0
- (4−4)² = 0
- (4−4)² = 0
- (6−4)² = 4
3) Soma: 8
4) Variância amostral: s² = 8/(5−1) = 8/4 = 2
5) Desvio padrão amostral: s = √2 ≈ 1,414
Interpretação: a amostra tem dispersão moderada em torno de 4. O uso de (n−1) corrige o viés na estimação da variância populacional.
Coeficiente de variação (CV): comparar dispersão em escalas diferentes
Conceito
O coeficiente de variação mede a dispersão relativa ao nível médio. É muito útil para comparar séries com médias diferentes ou unidades distintas.
Fórmula: CV = (desvio padrão / média) × 100%
Regra prática comum em provas: quanto maior o CV, maior a variabilidade relativa (menos homogeneidade). O CV é mais informativo quando a média é positiva e não muito próxima de zero.
Passo a passo prático
- Calcule a média.
- Calcule o desvio padrão (populacional ou amostral, conforme o caso).
- Divida desvio padrão pela média.
- Multiplique por 100 para obter porcentagem.
Exemplo: comparar duas séries por dispersão e por CV
Série A (indicador em %): 8, 10, 12. Série B (indicador em %): 80, 100, 120.
1) Médias: A: 10; B: 100
2) Desvio padrão populacional:
- A: desvios −2, 0, 2 → quadrados 4,0,4 → soma 8 → variância 8/3 ≈ 2,667 → σA ≈ 1,633
- B: desvios −20, 0, 20 → quadrados 400,0,400 → soma 800 → variância 800/3 ≈ 266,667 → σB ≈ 16,330
Comparação por desvio padrão: B tem desvio padrão maior (16,33 > 1,63), mas isso ocorre porque a escala é 10 vezes maior.
3) CV:
- CVA = (1,633/10)×100% ≈ 16,33%
- CVB = (16,330/100)×100% ≈ 16,33%
Interpretação: as séries têm a mesma variabilidade relativa. Para comparar heterogeneidade entre regiões com níveis médios diferentes, o CV costuma ser a escolha mais adequada.
Noções de forma da distribuição: assimetria e curtose
Assimetria (skewness) — conceito e leitura
Assimetria descreve se a distribuição é “puxada” para um lado (cauda mais longa).
- Assimetria positiva (à direita): cauda longa à direita, poucos valores muito altos. Em geral, média > mediana.
- Assimetria negativa (à esquerda): cauda longa à esquerda, poucos valores muito baixos. Em geral, média < mediana.
- Simétrica: caudas semelhantes; média ≈ mediana.
Exemplo aplicado: renda domiciliar costuma apresentar assimetria positiva: muitos domicílios com renda baixa/média e poucos com renda muito alta, elevando a média.
Medida introdutória de assimetria (baseada em média e mediana)
Em nível de concurso, pode aparecer uma medida simples para indicar direção da assimetria:
Assimetria de Pearson (2ª forma): Sk ≈ 3(x̄ − Mediana)/s
Leitura: Sk > 0 indica assimetria à direita; Sk < 0 indica assimetria à esquerda; Sk ≈ 0 indica quase simetria.
Exemplo rápido
Dados: 2, 2, 3, 3, 10.
- x̄ = (2+2+3+3+10)/5 = 20/5 = 4
- Mediana = 3
- Há um valor alto (10), sugerindo cauda à direita; como x̄ > mediana, a assimetria é positiva.
Curtose — conceito e leitura
Curtose descreve o “grau de concentração” de valores em torno do centro e o peso das caudas, comparando com a distribuição normal.
- Leptocúrtica: mais “pontuda”/concentrada no centro e/ou caudas mais pesadas (mais valores extremos).
- Mesocúrtica: semelhante à normal (referência).
- Platicúrtica: mais “achatada”/dispersa no centro e/ou caudas mais leves.
Em provas, muitas vezes a curtose é cobrada de forma conceitual (interpretação), sem exigir cálculo.
Exercícios (cálculo direto e interpretação)
Exercício 1 — amplitude, variância e desvio padrão (população)
O tempo (em minutos) de atendimento em 5 postos: 12, 15, 15, 18, 20. Calcule amplitude, variância populacional e desvio padrão populacional.
Gabarito comentado:
- Amplitude = 20 − 12 = 8
- Média μ = (12+15+15+18+20)/5 = 80/5 = 16
- Desvios: −4, −1, −1, 2, 4
- Quadrados: 16, 1, 1, 4, 16 → soma = 38
- Variância σ² = 38/5 = 7,6
- Desvio padrão σ = √7,6 ≈ 2,757
Interpretação: o atendimento varia em torno de 16 min com dispersão típica de ~2,76 min; a amplitude mostra que há diferença de 8 min entre o menor e o maior tempo.
Exercício 2 — comparar duas regiões por dispersão
Indicador Y em 4 sub-regiões:
Região 1: 50, 52, 48, 50
Região 2: 50, 60, 40, 50
Compare a dispersão usando desvio padrão populacional.
Gabarito comentado:
- Ambas têm média μ = (50+52+48+50)/4 = 200/4 = 50 e μ = (50+60+40+50)/4 = 200/4 = 50
- Região 1: desvios 0,2,−2,0 → quadrados 0,4,4,0 → soma 8 → σ² = 8/4 = 2 → σ = √2 ≈ 1,414
- Região 2: desvios 0,10,−10,0 → quadrados 0,100,100,0 → soma 200 → σ² = 200/4 = 50 → σ = √50 ≈ 7,071
Interpretação: apesar da mesma média, a Região 2 é muito mais heterogênea (maior dispersão), sugerindo desigualdade interna maior no indicador.
Exercício 3 — coeficiente de variação (CV) para comparar séries
Considere dois indicadores em unidades diferentes:
Série A (em R$ mil): 30, 33, 27
Série B (em %): 3, 3,3, 2,7
Calcule o CV (populacional) e compare a variabilidade relativa.
Gabarito comentado:
- Ambas têm média: A = 30; B = 3
- Para A: desvios 0,3,−3 → quadrados 0,9,9 → soma 18 → σ² = 18/3 = 6 → σ ≈ 2,449 → CVA = (2,449/30)×100% ≈ 8,16%
- Para B: desvios 0,0,3,−0,3 → quadrados 0,0,09,0,09 → soma 0,18 → σ² = 0,18/3 = 0,06 → σ ≈ 0,245 → CVB = (0,245/3)×100% ≈ 8,16%
Interpretação: embora as unidades e magnitudes sejam diferentes, a variabilidade relativa é a mesma. O CV permite comparar estabilidade/heterogeneidade entre indicadores distintos.
Exercício 4 — assimetria (interpretação)
Em uma distribuição de rendimentos, a média é 2.800 e a mediana é 2.100. Indique o tipo provável de assimetria e justifique.
Gabarito comentado: como média > mediana, a distribuição tende a ter assimetria positiva (à direita), típica quando poucos valores muito altos puxam a média para cima.
Questões comentadas (estilo concurso)
Questão 1
Uma série tem valores 5, 5, 5, 5. Assinale a alternativa correta.
- A) Amplitude = 5
- B) Variância = 0
- C) Desvio padrão > 0
- D) CV é indefinido porque a média é 0
Comentário: todos os valores são iguais, então não há dispersão: amplitude = 0, variância = 0, desvio padrão = 0. A média é 5, então o CV é 0%. Resposta: B.
Questão 2
Sobre o coeficiente de variação (CV), assinale a correta.
- A) Serve para comparar dispersão absoluta entre séries com unidades diferentes.
- B) É dado por (média/desvio padrão)×100%.
- C) Mede dispersão relativa e é útil para comparar séries com médias diferentes.
- D) Quanto menor o CV, maior a heterogeneidade.
Comentário: CV = (desvio padrão/média)×100% e mede dispersão relativa. Menor CV indica maior homogeneidade. Resposta: C.
Questão 3
Duas regiões apresentam o mesmo valor médio de um indicador. A Região X tem desvio padrão 2 e a Região Y tem desvio padrão 5. Assinale a interpretação correta.
- A) A Região X é mais heterogênea.
- B) A Região Y é mais homogênea.
- C) A Região Y apresenta maior variabilidade em torno da média.
- D) Não é possível comparar dispersão sem a mediana.
Comentário: maior desvio padrão implica maior dispersão em torno da média. Resposta: C.
Questão 4
Uma distribuição com cauda longa à esquerda tende a apresentar:
- A) Assimetria positiva e média maior que a mediana.
- B) Assimetria negativa e média menor que a mediana.
- C) Simetria e média igual à moda.
- D) Curtose necessariamente leptocúrtica.
Comentário: cauda à esquerda indica assimetria negativa; em geral, média < mediana. Curtose é outro conceito e não é determinada apenas pela direção da cauda. Resposta: B.
Checklist de fórmulas essenciais
- Amplitude: xmax − xmin
- Média (população): μ = Σxi / N
- Média (amostra): x̄ = Σxi / n
- Variância populacional: σ² = Σ(xi − μ)² / N
- Desvio padrão populacional: σ = √σ²
- Variância amostral: s² = Σ(xi − x̄)² / (n − 1)
- Desvio padrão amostral: s = √s²
- Coeficiente de variação: CV = (desvio padrão / média) × 100%
- Assimetria (Pearson, forma introdutória): Sk ≈ 3(x̄ − Mediana)/s