Estatística Descritiva do Zero: medidas de dispersão (amplitude, variância e desvio-padrão)

Capítulo 8

Tempo estimado de leitura: 5 minutos

+ Exercício

Variabilidade: por que “espalhamento” importa tanto quanto o centro

Duas turmas podem ter a mesma média e a mesma mediana, mas serem completamente diferentes no dia a dia. A variabilidade (ou dispersão) descreve o quanto os valores se afastam uns dos outros e do valor central. Ela é essencial para:

  • Avaliar consistência: resultados “estáveis” têm baixa dispersão; resultados “irregulares” têm alta dispersão.
  • Comparar conjuntos com mesmo centro: se duas lojas têm o mesmo ticket médio, a que tem menor dispersão costuma ser mais previsível.
  • Entender risco/incerteza: em finanças, produção, prazos e qualidade, a dispersão frequentemente é tão importante quanto a média.

Ao ler uma medida de dispersão, pergunte: “os dados estão concentrados perto do centro ou espalhados?” e “há valores extremos puxando o espalhamento?”

Amplitude (range): a medida mais simples de dispersão

A amplitude mede o tamanho total do intervalo ocupado pelos dados:

Amplitude = máximo − mínimo

Exemplo rápido

Considere os tempos (em minutos) para concluir uma tarefa: 8, 9, 10, 10, 13.

Continue em nosso aplicativo e ...
  • Ouça o áudio com a tela desligada
  • Ganhe Certificado após a conclusão
  • + de 5000 cursos para você explorar!
ou continue lendo abaixo...
Download App

Baixar o aplicativo

  • Mínimo = 8
  • Máximo = 13
  • Amplitude = 13 − 8 = 5 minutos

Interpretação: os tempos variam dentro de um intervalo total de 5 minutos.

Limitação importante

A amplitude usa apenas dois valores (mínimo e máximo). Um único outlier pode inflar muito a amplitude, mesmo que o restante dos dados seja bem concentrado.

Amplitude interquartil (AIQ/IQR): dispersão robusta

A amplitude interquartil (AIQ ou IQR) mede a dispersão do “miolo” dos dados, ignorando os extremos. Ela é definida como:

AIQ = Q3 − Q1

Onde:

  • Q1 (1º quartil): valor abaixo do qual estão ~25% dos dados
  • Q3 (3º quartil): valor abaixo do qual estão ~75% dos dados

Por que é robusta? Porque foca nos 50% centrais e tende a ser pouco afetada por outliers.

Passo a passo (exemplo pequeno)

Use os dados ordenados: 8, 9, 10, 10, 13.

  • 1) Encontre a mediana: o valor central é 10.
  • 2) Separe as metades (uma prática comum é excluir a mediana quando n é ímpar):
    • Metade inferior: 8, 9
    • Metade superior: 10, 13
  • 3) Calcule Q1: mediana da metade inferior (8, 9) = (8+9)/2 = 8,5
  • 4) Calcule Q3: mediana da metade superior (10, 13) = (10+13)/2 = 11,5
  • 5) AIQ = 11,5 − 8,5 = 3 minutos

Interpretação: os 50% centrais dos tempos se espalham por 3 minutos. Compare isso com a amplitude (5): a AIQ descreve melhor o “corpo” dos dados.

Observação prática: existem variações de método para quartis (especialmente em amostras pequenas). O importante é ser consistente no método ao comparar grupos.

Variância e desvio-padrão: dispersão em torno da média

Enquanto a amplitude olha o intervalo total e a AIQ olha o miolo, variância e desvio-padrão medem o espalhamento considerando todas as observações e suas distâncias em relação à média.

Ideia central

Se os valores ficam próximos da média, as distâncias (desvios) são pequenas; se ficam longe, as distâncias são grandes.

  • Variância: média dos desvios ao quadrado.
  • Desvio-padrão: raiz quadrada da variância (volta para a unidade original).

Unidades e interpretação

  • A variância fica em unidades ao quadrado (ex.: minutos²), o que dificulta a interpretação direta.
  • O desvio-padrão fica na mesma unidade dos dados (ex.: minutos), sendo mais interpretável.
  • Um desvio-padrão maior indica dados mais espalhados em torno da média.

Cálculo passo a passo (exemplo completo)

Vamos usar o mesmo conjunto: 8, 9, 10, 10, 13.

1) Calcule a média

média = (8 + 9 + 10 + 10 + 13) / 5 = 50 / 5 = 10

2) Calcule os desvios em relação à média

Valor (x)x − média(x − média)²
8-24
9-11
1000
1000
1339

Soma dos quadrados: 4 + 1 + 0 + 0 + 9 = 14

3) Variância: população vs. amostra

Existem duas fórmulas comuns, dependendo do contexto:

  • Variância populacional (quando você tem todos os elementos do grupo):
    σ² = Σ(x − μ)² / n
  • Variância amostral (quando você tem uma amostra e quer estimar a população):
    s² = Σ(x − x̄)² / (n − 1)

No nosso exemplo, a soma dos quadrados é 14 e n = 5:

  • População: σ² = 14 / 5 = 2,8 (minutos²)
  • Amostra: s² = 14 / 4 = 3,5 (minutos²)

4) Desvio-padrão

  • População: σ = √2,8 ≈ 1,673 minutos
  • Amostra: s = √3,5 ≈ 1,871 minutos

Interpretação prática: um desvio-padrão em torno de 1,7 a 1,9 minuto sugere que, tipicamente, os tempos ficam a cerca de ~2 minutos da média (10 min), embora isso não seja uma regra rígida para todos os conjuntos.

Como usar variância/desvio-padrão para comparar conjuntos

Se dois conjuntos estão na mesma unidade (por exemplo, minutos) e representam o mesmo tipo de medida, você pode comparar seus desvios-padrão:

  • Menor desvio-padrão → maior consistência (valores mais concentrados).
  • Maior desvio-padrão → maior variabilidade (valores mais espalhados).

Exemplo de leitura: se a Turma A tem média 10 e desvio-padrão 1,8, e a Turma B tem média 10 e desvio-padrão 4,0, a Turma B é muito mais heterogênea, apesar do mesmo centro.

Cuidados essenciais ao interpretar medidas de dispersão

Sensibilidade a outliers

  • Amplitude, variância e desvio-padrão podem aumentar muito por causa de um único valor extremo.
  • A AIQ tende a ser mais estável quando há outliers.

Na prática: se você suspeita de outliers, olhe AIQ e mediana junto com desvio-padrão e média.

Comparar apenas em escalas compatíveis

  • Não compare diretamente desvio-padrão de variáveis com unidades diferentes (ex.: minutos vs. reais).
  • Mesmo com a mesma unidade, compare quando o significado é equivalente (ex.: tempos do mesmo processo, notas da mesma prova).

Ler dispersão junto com tendência central

  • Dispersão sem centro pode enganar: um desvio-padrão de 2 pode ser pequeno se a média é 100, mas grande se a média é 5.
  • Combine leituras típicas: (média, desvio-padrão) e (mediana, AIQ).

Variância em unidades ao quadrado

Use a variância principalmente para cálculo e comparação técnica; para comunicação, o desvio-padrão costuma ser mais intuitivo por estar na unidade original.

Agora responda o exercício sobre o conteúdo:

Ao comparar dois conjuntos de dados com a mesma média, qual medida de dispersão tende a ser mais robusta à presença de um valor extremo (outlier), por focar nos 50% centrais dos dados?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

A AIQ é calculada como Q3 − Q1 e descreve o espalhamento do “miolo” (50% central) dos dados, sendo pouco afetada por valores extremos. Já amplitude e variância podem aumentar bastante com um único outlier.

Próximo capitúlo

Estatística Descritiva do Zero: posição e separatrizes (quartis, decis e percentis)

Arrow Right Icon
Capa do Ebook gratuito Estatística Descritiva do Zero: Como Entender e Resumir Dados
62%

Estatística Descritiva do Zero: Como Entender e Resumir Dados

Novo curso

13 páginas

Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.