Variabilidade: por que “espalhamento” importa tanto quanto o centro
Duas turmas podem ter a mesma média e a mesma mediana, mas serem completamente diferentes no dia a dia. A variabilidade (ou dispersão) descreve o quanto os valores se afastam uns dos outros e do valor central. Ela é essencial para:
- Avaliar consistência: resultados “estáveis” têm baixa dispersão; resultados “irregulares” têm alta dispersão.
- Comparar conjuntos com mesmo centro: se duas lojas têm o mesmo ticket médio, a que tem menor dispersão costuma ser mais previsível.
- Entender risco/incerteza: em finanças, produção, prazos e qualidade, a dispersão frequentemente é tão importante quanto a média.
Ao ler uma medida de dispersão, pergunte: “os dados estão concentrados perto do centro ou espalhados?” e “há valores extremos puxando o espalhamento?”
Amplitude (range): a medida mais simples de dispersão
A amplitude mede o tamanho total do intervalo ocupado pelos dados:
Amplitude = máximo − mínimo
Exemplo rápido
Considere os tempos (em minutos) para concluir uma tarefa: 8, 9, 10, 10, 13.
- Ouça o áudio com a tela desligada
- Ganhe Certificado após a conclusão
- + de 5000 cursos para você explorar!
Baixar o aplicativo
- Mínimo = 8
- Máximo = 13
- Amplitude = 13 − 8 = 5 minutos
Interpretação: os tempos variam dentro de um intervalo total de 5 minutos.
Limitação importante
A amplitude usa apenas dois valores (mínimo e máximo). Um único outlier pode inflar muito a amplitude, mesmo que o restante dos dados seja bem concentrado.
Amplitude interquartil (AIQ/IQR): dispersão robusta
A amplitude interquartil (AIQ ou IQR) mede a dispersão do “miolo” dos dados, ignorando os extremos. Ela é definida como:
AIQ = Q3 − Q1
Onde:
- Q1 (1º quartil): valor abaixo do qual estão ~25% dos dados
- Q3 (3º quartil): valor abaixo do qual estão ~75% dos dados
Por que é robusta? Porque foca nos 50% centrais e tende a ser pouco afetada por outliers.
Passo a passo (exemplo pequeno)
Use os dados ordenados: 8, 9, 10, 10, 13.
- 1) Encontre a mediana: o valor central é
10. - 2) Separe as metades (uma prática comum é excluir a mediana quando n é ímpar):
- Metade inferior:
8, 9 - Metade superior:
10, 13
- Metade inferior:
- 3) Calcule Q1: mediana da metade inferior (
8, 9) = (8+9)/2 = 8,5 - 4) Calcule Q3: mediana da metade superior (
10, 13) = (10+13)/2 = 11,5 - 5) AIQ = 11,5 − 8,5 = 3 minutos
Interpretação: os 50% centrais dos tempos se espalham por 3 minutos. Compare isso com a amplitude (5): a AIQ descreve melhor o “corpo” dos dados.
Observação prática: existem variações de método para quartis (especialmente em amostras pequenas). O importante é ser consistente no método ao comparar grupos.
Variância e desvio-padrão: dispersão em torno da média
Enquanto a amplitude olha o intervalo total e a AIQ olha o miolo, variância e desvio-padrão medem o espalhamento considerando todas as observações e suas distâncias em relação à média.
Ideia central
Se os valores ficam próximos da média, as distâncias (desvios) são pequenas; se ficam longe, as distâncias são grandes.
- Variância: média dos desvios ao quadrado.
- Desvio-padrão: raiz quadrada da variância (volta para a unidade original).
Unidades e interpretação
- A variância fica em unidades ao quadrado (ex.: minutos²), o que dificulta a interpretação direta.
- O desvio-padrão fica na mesma unidade dos dados (ex.: minutos), sendo mais interpretável.
- Um desvio-padrão maior indica dados mais espalhados em torno da média.
Cálculo passo a passo (exemplo completo)
Vamos usar o mesmo conjunto: 8, 9, 10, 10, 13.
1) Calcule a média
média = (8 + 9 + 10 + 10 + 13) / 5 = 50 / 5 = 10
2) Calcule os desvios em relação à média
| Valor (x) | x − média | (x − média)² |
|---|---|---|
| 8 | -2 | 4 |
| 9 | -1 | 1 |
| 10 | 0 | 0 |
| 10 | 0 | 0 |
| 13 | 3 | 9 |
Soma dos quadrados: 4 + 1 + 0 + 0 + 9 = 14
3) Variância: população vs. amostra
Existem duas fórmulas comuns, dependendo do contexto:
- Variância populacional (quando você tem todos os elementos do grupo):
σ² = Σ(x − μ)² / n - Variância amostral (quando você tem uma amostra e quer estimar a população):
s² = Σ(x − x̄)² / (n − 1)
No nosso exemplo, a soma dos quadrados é 14 e n = 5:
- População:
σ² = 14 / 5 = 2,8(minutos²) - Amostra:
s² = 14 / 4 = 3,5(minutos²)
4) Desvio-padrão
- População:
σ = √2,8 ≈ 1,673minutos - Amostra:
s = √3,5 ≈ 1,871minutos
Interpretação prática: um desvio-padrão em torno de 1,7 a 1,9 minuto sugere que, tipicamente, os tempos ficam a cerca de ~2 minutos da média (10 min), embora isso não seja uma regra rígida para todos os conjuntos.
Como usar variância/desvio-padrão para comparar conjuntos
Se dois conjuntos estão na mesma unidade (por exemplo, minutos) e representam o mesmo tipo de medida, você pode comparar seus desvios-padrão:
- Menor desvio-padrão → maior consistência (valores mais concentrados).
- Maior desvio-padrão → maior variabilidade (valores mais espalhados).
Exemplo de leitura: se a Turma A tem média 10 e desvio-padrão 1,8, e a Turma B tem média 10 e desvio-padrão 4,0, a Turma B é muito mais heterogênea, apesar do mesmo centro.
Cuidados essenciais ao interpretar medidas de dispersão
Sensibilidade a outliers
- Amplitude, variância e desvio-padrão podem aumentar muito por causa de um único valor extremo.
- A AIQ tende a ser mais estável quando há outliers.
Na prática: se você suspeita de outliers, olhe AIQ e mediana junto com desvio-padrão e média.
Comparar apenas em escalas compatíveis
- Não compare diretamente desvio-padrão de variáveis com unidades diferentes (ex.: minutos vs. reais).
- Mesmo com a mesma unidade, compare quando o significado é equivalente (ex.: tempos do mesmo processo, notas da mesma prova).
Ler dispersão junto com tendência central
- Dispersão sem centro pode enganar: um desvio-padrão de 2 pode ser pequeno se a média é 100, mas grande se a média é 5.
- Combine leituras típicas: (média, desvio-padrão) e (mediana, AIQ).
Variância em unidades ao quadrado
Use a variância principalmente para cálculo e comparação técnica; para comunicação, o desvio-padrão costuma ser mais intuitivo por estar na unidade original.