Capa do Ebook gratuito Preparação Completa para Técnico do IBGE - Informações Geográficas e Estatísticas

Preparação Completa para Técnico do IBGE - Informações Geográficas e Estatísticas

Novo curso

19 páginas

Noções de Estatística Básica para Técnico do IBGE: dispersão e forma da distribuição

Capítulo 9

Tempo estimado de leitura: 8 minutos

+ Exercício

Dispersão: por que ela importa em estatística aplicada ao IBGE

Medidas de tendência central (como média e mediana) resumem o “nível” dos dados, mas não dizem o quanto os valores variam. Em contextos do IBGE, duas regiões podem ter a mesma média de um indicador (ex.: renda, taxa de desemprego, produção agrícola) e, ainda assim, uma delas ser muito mais heterogênea. As medidas de dispersão quantificam essa variabilidade e ajudam a comparar séries e avaliar estabilidade.

Amplitude (range)

Conceito

A amplitude é a medida de dispersão mais simples: diferença entre o maior e o menor valor da série.

Fórmula: Amplitude = xmax − xmin

Passo a passo prático

  • Identifique o menor valor (xmin).
  • Identifique o maior valor (xmax).
  • Subtraia: xmax − xmin.

Exemplo

Taxa de desocupação (%) em 5 regiões: 6, 7, 7, 9, 11.

  • xmin = 6
  • xmax = 11
  • Amplitude = 11 − 6 = 5 (pontos percentuais)

Interpretação: a diferença entre a região com menor e maior taxa é de 5 p.p. A amplitude é sensível a extremos e não usa todos os valores no cálculo.

Continue em nosso aplicativo

Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.

ou continue lendo abaixo...
Download App

Baixar o aplicativo

Variância e desvio padrão

Ideia central

A variância mede o “espalhamento” em torno da média usando os desvios (diferenças) de cada valor em relação à média. Como esses desvios podem ser negativos, elevamos ao quadrado. O desvio padrão é a raiz quadrada da variância, voltando à unidade original dos dados (mais interpretável em provas).

Fórmulas (população e amostra)

Variância populacional: σ² = Σ(xi − μ)² / N

Desvio padrão populacional: σ = √σ²

Variância amostral: s² = Σ(xi − x̄)² / (n − 1)

Desvio padrão amostral: s = √s²

Em concursos, é comum indicar se os dados representam uma população (usa N) ou uma amostra (usa n−1). Quando não indicado, muitas questões trabalham como população para simplificar.

Passo a passo (cálculo direto)

  • Calcule a média (μ ou x̄).
  • Calcule os desvios: (xi − média).
  • Eleve ao quadrado: (xi − média)².
  • Some os quadrados: Σ(xi − média)².
  • Divida por N (população) ou por (n−1) (amostra) para obter a variância.
  • Tire a raiz quadrada para obter o desvio padrão.

Exemplo 1 (população): variabilidade entre regiões

Considere a produção (em mil toneladas) de um produto em 4 regiões: 10, 12, 14, 16.

1) Média: μ = (10+12+14+16)/4 = 52/4 = 13

2) Desvios e quadrados:

  • (10−13) = −3 → 9
  • (12−13) = −1 → 1
  • (14−13) = 1 → 1
  • (16−13) = 3 → 9

3) Soma dos quadrados: 9+1+1+9 = 20

4) Variância populacional: σ² = 20/4 = 5

5) Desvio padrão: σ = √5 ≈ 2,236

Interpretação: em média, os valores se afastam da média (13) em cerca de 2,24 mil toneladas. Quanto maior o desvio padrão, maior a heterogeneidade entre regiões.

Exemplo 2 (amostra): quando usar n−1

Uma amostra de 5 municípios tem o indicador X: 2, 4, 4, 4, 6.

1) Média: x̄ = (2+4+4+4+6)/5 = 20/5 = 4

2) Quadrados dos desvios:

  • (2−4)² = 4
  • (4−4)² = 0
  • (4−4)² = 0
  • (4−4)² = 0
  • (6−4)² = 4

3) Soma: 8

4) Variância amostral: s² = 8/(5−1) = 8/4 = 2

5) Desvio padrão amostral: s = √2 ≈ 1,414

Interpretação: a amostra tem dispersão moderada em torno de 4. O uso de (n−1) corrige o viés na estimação da variância populacional.

Coeficiente de variação (CV): comparar dispersão em escalas diferentes

Conceito

O coeficiente de variação mede a dispersão relativa ao nível médio. É muito útil para comparar séries com médias diferentes ou unidades distintas.

Fórmula: CV = (desvio padrão / média) × 100%

Regra prática comum em provas: quanto maior o CV, maior a variabilidade relativa (menos homogeneidade). O CV é mais informativo quando a média é positiva e não muito próxima de zero.

Passo a passo prático

  • Calcule a média.
  • Calcule o desvio padrão (populacional ou amostral, conforme o caso).
  • Divida desvio padrão pela média.
  • Multiplique por 100 para obter porcentagem.

Exemplo: comparar duas séries por dispersão e por CV

Série A (indicador em %): 8, 10, 12. Série B (indicador em %): 80, 100, 120.

1) Médias: A: 10; B: 100

2) Desvio padrão populacional:

  • A: desvios −2, 0, 2 → quadrados 4,0,4 → soma 8 → variância 8/3 ≈ 2,667 → σA ≈ 1,633
  • B: desvios −20, 0, 20 → quadrados 400,0,400 → soma 800 → variância 800/3 ≈ 266,667 → σB ≈ 16,330

Comparação por desvio padrão: B tem desvio padrão maior (16,33 > 1,63), mas isso ocorre porque a escala é 10 vezes maior.

3) CV:

  • CVA = (1,633/10)×100% ≈ 16,33%
  • CVB = (16,330/100)×100% ≈ 16,33%

Interpretação: as séries têm a mesma variabilidade relativa. Para comparar heterogeneidade entre regiões com níveis médios diferentes, o CV costuma ser a escolha mais adequada.

Noções de forma da distribuição: assimetria e curtose

Assimetria (skewness) — conceito e leitura

Assimetria descreve se a distribuição é “puxada” para um lado (cauda mais longa).

  • Assimetria positiva (à direita): cauda longa à direita, poucos valores muito altos. Em geral, média > mediana.
  • Assimetria negativa (à esquerda): cauda longa à esquerda, poucos valores muito baixos. Em geral, média < mediana.
  • Simétrica: caudas semelhantes; média ≈ mediana.

Exemplo aplicado: renda domiciliar costuma apresentar assimetria positiva: muitos domicílios com renda baixa/média e poucos com renda muito alta, elevando a média.

Medida introdutória de assimetria (baseada em média e mediana)

Em nível de concurso, pode aparecer uma medida simples para indicar direção da assimetria:

Assimetria de Pearson (2ª forma): Sk ≈ 3(x̄ − Mediana)/s

Leitura: Sk > 0 indica assimetria à direita; Sk < 0 indica assimetria à esquerda; Sk ≈ 0 indica quase simetria.

Exemplo rápido

Dados: 2, 2, 3, 3, 10.

  • x̄ = (2+2+3+3+10)/5 = 20/5 = 4
  • Mediana = 3
  • Há um valor alto (10), sugerindo cauda à direita; como x̄ > mediana, a assimetria é positiva.

Curtose — conceito e leitura

Curtose descreve o “grau de concentração” de valores em torno do centro e o peso das caudas, comparando com a distribuição normal.

  • Leptocúrtica: mais “pontuda”/concentrada no centro e/ou caudas mais pesadas (mais valores extremos).
  • Mesocúrtica: semelhante à normal (referência).
  • Platicúrtica: mais “achatada”/dispersa no centro e/ou caudas mais leves.

Em provas, muitas vezes a curtose é cobrada de forma conceitual (interpretação), sem exigir cálculo.

Exercícios (cálculo direto e interpretação)

Exercício 1 — amplitude, variância e desvio padrão (população)

O tempo (em minutos) de atendimento em 5 postos: 12, 15, 15, 18, 20. Calcule amplitude, variância populacional e desvio padrão populacional.

Gabarito comentado:

  • Amplitude = 20 − 12 = 8
  • Média μ = (12+15+15+18+20)/5 = 80/5 = 16
  • Desvios: −4, −1, −1, 2, 4
  • Quadrados: 16, 1, 1, 4, 16 → soma = 38
  • Variância σ² = 38/5 = 7,6
  • Desvio padrão σ = √7,6 ≈ 2,757

Interpretação: o atendimento varia em torno de 16 min com dispersão típica de ~2,76 min; a amplitude mostra que há diferença de 8 min entre o menor e o maior tempo.

Exercício 2 — comparar duas regiões por dispersão

Indicador Y em 4 sub-regiões:

Região 1: 50, 52, 48, 50

Região 2: 50, 60, 40, 50

Compare a dispersão usando desvio padrão populacional.

Gabarito comentado:

  • Ambas têm média μ = (50+52+48+50)/4 = 200/4 = 50 e μ = (50+60+40+50)/4 = 200/4 = 50
  • Região 1: desvios 0,2,−2,0 → quadrados 0,4,4,0 → soma 8 → σ² = 8/4 = 2 → σ = √2 ≈ 1,414
  • Região 2: desvios 0,10,−10,0 → quadrados 0,100,100,0 → soma 200 → σ² = 200/4 = 50 → σ = √50 ≈ 7,071

Interpretação: apesar da mesma média, a Região 2 é muito mais heterogênea (maior dispersão), sugerindo desigualdade interna maior no indicador.

Exercício 3 — coeficiente de variação (CV) para comparar séries

Considere dois indicadores em unidades diferentes:

Série A (em R$ mil): 30, 33, 27

Série B (em %): 3, 3,3, 2,7

Calcule o CV (populacional) e compare a variabilidade relativa.

Gabarito comentado:

  • Ambas têm média: A = 30; B = 3
  • Para A: desvios 0,3,−3 → quadrados 0,9,9 → soma 18 → σ² = 18/3 = 6 → σ ≈ 2,449 → CVA = (2,449/30)×100% ≈ 8,16%
  • Para B: desvios 0,0,3,−0,3 → quadrados 0,0,09,0,09 → soma 0,18 → σ² = 0,18/3 = 0,06 → σ ≈ 0,245 → CVB = (0,245/3)×100% ≈ 8,16%

Interpretação: embora as unidades e magnitudes sejam diferentes, a variabilidade relativa é a mesma. O CV permite comparar estabilidade/heterogeneidade entre indicadores distintos.

Exercício 4 — assimetria (interpretação)

Em uma distribuição de rendimentos, a média é 2.800 e a mediana é 2.100. Indique o tipo provável de assimetria e justifique.

Gabarito comentado: como média > mediana, a distribuição tende a ter assimetria positiva (à direita), típica quando poucos valores muito altos puxam a média para cima.

Questões comentadas (estilo concurso)

Questão 1

Uma série tem valores 5, 5, 5, 5. Assinale a alternativa correta.

  • A) Amplitude = 5
  • B) Variância = 0
  • C) Desvio padrão > 0
  • D) CV é indefinido porque a média é 0

Comentário: todos os valores são iguais, então não há dispersão: amplitude = 0, variância = 0, desvio padrão = 0. A média é 5, então o CV é 0%. Resposta: B.

Questão 2

Sobre o coeficiente de variação (CV), assinale a correta.

  • A) Serve para comparar dispersão absoluta entre séries com unidades diferentes.
  • B) É dado por (média/desvio padrão)×100%.
  • C) Mede dispersão relativa e é útil para comparar séries com médias diferentes.
  • D) Quanto menor o CV, maior a heterogeneidade.

Comentário: CV = (desvio padrão/média)×100% e mede dispersão relativa. Menor CV indica maior homogeneidade. Resposta: C.

Questão 3

Duas regiões apresentam o mesmo valor médio de um indicador. A Região X tem desvio padrão 2 e a Região Y tem desvio padrão 5. Assinale a interpretação correta.

  • A) A Região X é mais heterogênea.
  • B) A Região Y é mais homogênea.
  • C) A Região Y apresenta maior variabilidade em torno da média.
  • D) Não é possível comparar dispersão sem a mediana.

Comentário: maior desvio padrão implica maior dispersão em torno da média. Resposta: C.

Questão 4

Uma distribuição com cauda longa à esquerda tende a apresentar:

  • A) Assimetria positiva e média maior que a mediana.
  • B) Assimetria negativa e média menor que a mediana.
  • C) Simetria e média igual à moda.
  • D) Curtose necessariamente leptocúrtica.

Comentário: cauda à esquerda indica assimetria negativa; em geral, média < mediana. Curtose é outro conceito e não é determinada apenas pela direção da cauda. Resposta: B.

Checklist de fórmulas essenciais

  • Amplitude: xmax − xmin
  • Média (população): μ = Σxi / N
  • Média (amostra): x̄ = Σxi / n
  • Variância populacional: σ² = Σ(xi − μ)² / N
  • Desvio padrão populacional: σ = √σ²
  • Variância amostral: s² = Σ(xi − x̄)² / (n − 1)
  • Desvio padrão amostral: s = √s²
  • Coeficiente de variação: CV = (desvio padrão / média) × 100%
  • Assimetria (Pearson, forma introdutória): Sk ≈ 3(x̄ − Mediana)/s

Agora responda o exercício sobre o conteúdo:

Ao comparar duas regiões com a mesma média de um indicador, mas com desvios padrão diferentes (2 e 5), qual interpretação está correta?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

O desvio padrão mede o espalhamento em torno da média. Mantida a mesma média, o maior desvio padrão (5) indica maior dispersão/variabilidade e, portanto, maior heterogeneidade.

Próximo capitúlo

Noções de Estatística Básica para Técnico do IBGE: probabilidade e noções de amostragem

Arrow Right Icon
Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.