Quando usar dados brutos vs. dados agrupados em classes
Em variáveis quantitativas, você pode resumir os valores de duas formas principais:
- Tabela com dados brutos (sem classes): cada valor distinto aparece como uma “categoria” numérica com sua frequência.
- Tabela com dados agrupados em classes: os valores são reunidos em intervalos (classes), e você conta quantos caem em cada intervalo.
Use dados brutos quando
- Há poucos valores distintos (ex.: notas inteiras de 0 a 10, idade em anos com pouca variação).
- Você quer máxima fidelidade para calcular e interpretar medidas (média, mediana, moda, dispersão) sem aproximações.
- O objetivo é identificar valores específicos (ex.: “quantos tiraram 7?”).
Use dados agrupados quando
- Há muitos valores distintos (ex.: renda, tempo, altura com casas decimais).
- Você quer um resumo mais compacto para enxergar o padrão geral (concentração, caudas, assimetria).
- Você pretende construir um histograma ou comparar distribuições de forma visual.
Regra prática: se a tabela de dados brutos ficaria longa demais (muitas linhas) e dificultaria a leitura, agrupar em classes costuma ajudar.
Exemplo base (dados brutos)
Considere os tempos (em minutos) que 20 pessoas levaram para concluir uma tarefa:
12, 15, 15, 16, 18, 18, 19, 20, 21, 22, 22, 23, 24, 25, 25, 26, 28, 30, 31, 35Se você fizer uma tabela de dados brutos, cada valor distinto vira uma linha. Isso pode funcionar aqui (são poucos valores), mas em conjuntos maiores a tabela cresce rapidamente.
Passo a passo: construindo tabela de frequência com dados agrupados
Passo 1) Identifique mínimo, máximo e amplitude total
- Mínimo = 12
- Máximo = 35
- Amplitude total (range) = 35 − 12 = 23
Passo 2) Defina o número de classes (k) de modo prático
Não existe um único “k correto”. O objetivo é equilibrar:
- Ouça o áudio com a tela desligada
- Ganhe Certificado após a conclusão
- + de 5000 cursos para você explorar!
Baixar o aplicativo
- Poucas classes → resumo muito grosseiro (perde detalhes).
- Muitas classes → volta a ficar parecido com dados brutos (pouco ganho de síntese).
Duas regras práticas comuns:
- Regra da raiz: k ≈ √n. Aqui n = 20 → √20 ≈ 4,47 → use 4 ou 5 classes.
- Regra de Sturges: k ≈ 1 + 3,3·log10(n). Para n = 20: 1 + 3,3·1,301 ≈ 5,29 → use 5 classes.
Vamos usar k = 5 para o exemplo.
Passo 3) Calcule a amplitude de classe (h)
Uma forma prática:
h ≈ amplitude total / k = 23 / 5 = 4,6
Arredonde para um valor conveniente que facilite os intervalos. Aqui, use h = 5 minutos.
Passo 4) Construa intervalos sem ambiguidade
O ponto mais importante é garantir que cada valor caia em uma única classe. Para isso, use intervalos do tipo:
- Fechado à esquerda e aberto à direita: [a, b)
- Ou, se trabalhar com inteiros, pode usar limites inteiros com regra explícita (ex.: 12–16 inclui 12,13,14,15,16), mas precisa deixar isso claro.
Como os dados são inteiros, ainda assim é útil manter a convenção [a, b) para evitar dúvidas. Com h = 5 e começando no mínimo 12:
- [12, 17)
- [17, 22)
- [22, 27)
- [27, 32)
- [32, 37)
Esses intervalos cobrem todos os valores de 12 até 35.
Passo 5) Conte a frequência absoluta (fi)
fi é o número de observações que caem na classe.
- [12, 17): 12, 15, 15, 16 → fi = 4
- [17, 22): 18, 18, 19, 20, 21 → fi = 5
- [22, 27): 22, 22, 23, 24, 25, 25, 26 → fi = 7
- [27, 32): 28, 30, 31 → fi = 3
- [32, 37): 35 → fi = 1
Cheque: 4 + 5 + 7 + 3 + 1 = 20 (bate com n).
Passo 6) Calcule a frequência relativa (fr) e a porcentagem
fr é a proporção: fr = fi / n. Em porcentagem: 100·fr.
Passo 7) Calcule as frequências acumuladas (Fi e Fr acumulada)
- Fi (acumulada absoluta) soma as frequências até a classe.
- Fr acumulada soma as frequências relativas até a classe.
Tabela final (agrupada)
| Classe (min) | fi | fr | % | Fi | Fr acum. |
|---|---|---|---|---|---|
| [12, 17) | 4 | 0,20 | 20% | 4 | 0,20 |
| [17, 22) | 5 | 0,25 | 25% | 9 | 0,45 |
| [22, 27) | 7 | 0,35 | 35% | 16 | 0,80 |
| [27, 32) | 3 | 0,15 | 15% | 19 | 0,95 |
| [32, 37) | 1 | 0,05 | 5% | 20 | 1,00 |
Dicas práticas para montar classes “boas”
1) Escolha limites que façam sentido
- Prefira amplitudes “redondas” (2, 5, 10, 20…) quando possível.
- Se a variável tem unidade com padrão (ex.: dinheiro), pense em limites compatíveis (ex.: de 100 em 100).
2) Evite classes vazias demais
Se muitas classes ficam com fi = 0 ou 1, talvez você tenha classes demais (k alto) ou amplitude pequena.
3) Evite classes largas demais
Se quase tudo cai em 1–2 classes, você perdeu contraste. Aumente k ou diminua h.
4) Seja explícito sobre a regra de inclusão
Escreva o intervalo de forma que não exista “dupla contagem” nos limites. Exemplo: [22, 27) inclui 22, 23, 24, 25, 26, mas não inclui 27.
Alerta importante: perda de informação ao agrupar (e como isso pode distorcer medidas)
Agrupar em classes simplifica, mas remove detalhes. Isso pode afetar:
- Moda: em dados agrupados, você identifica “classe modal” (a classe com maior fi), mas não necessariamente o valor mais frequente.
- Mediana e quantis: frequentemente são estimados por interpolação dentro da classe, o que depende do formato do agrupamento.
- Média: muitas vezes é aproximada usando o ponto médio de cada classe; isso pode introduzir erro se os dados estiverem concentrados perto de uma borda da classe.
- Dispersão: variância/desvio padrão aproximados com pontos médios podem subestimar ou superestimar a variabilidade real.
Exemplo de distorção: se você usar classes muito largas, dois conjuntos diferentes podem gerar a mesma tabela agrupada, escondendo diferenças importantes (por exemplo, um conjunto com valores concentrados no início da classe e outro concentrado no fim).
Boa prática
- Se o objetivo é cálculo preciso de medidas, prefira dados brutos (ou mantenha os dados brutos disponíveis).
- Use dados agrupados principalmente para comunicação e visão geral.
Atividade prática: diferentes agrupamentos para o mesmo conjunto
Use novamente os 20 tempos (min):
12, 15, 15, 16, 18, 18, 19, 20, 21, 22, 22, 23, 24, 25, 25, 26, 28, 30, 31, 35Tarefa A) Monte duas tabelas agrupadas diferentes
- Agrupamento 1: use k = 4 classes. Dica: calcule h ≈ 23/4 = 5,75 e escolha um h conveniente (por exemplo, 6). Construa intervalos sem ambiguidade e calcule fi, fr, Fi.
- Agrupamento 2: use k = 6 classes. Dica: h ≈ 23/6 ≈ 3,83 e escolha h = 4. Construa intervalos sem ambiguidade e calcule fi, fr, Fi.
Tarefa B) Compare os resumos
- Em qual agrupamento fica mais fácil ver onde os dados se concentram?
- Qual agrupamento “esconde” mais a cauda (valores altos como 35)?
- A classe modal muda? A impressão de assimetria muda?
Tarefa C) Reflexão sobre medidas
- Calcule a média exata com os dados brutos.
- Depois, estime a média usando cada tabela agrupada (ponto médio da classe × fi, dividido por n).
- Compare os resultados e anote a diferença. Em qual agrupamento o erro foi maior?