Estatística Descritiva do Zero: tabelas de frequência para variáveis quantitativas e dados agrupados

Capítulo 5

Tempo estimado de leitura: 5 minutos

+ Exercício

Quando usar dados brutos vs. dados agrupados em classes

Em variáveis quantitativas, você pode resumir os valores de duas formas principais:

  • Tabela com dados brutos (sem classes): cada valor distinto aparece como uma “categoria” numérica com sua frequência.
  • Tabela com dados agrupados em classes: os valores são reunidos em intervalos (classes), e você conta quantos caem em cada intervalo.

Use dados brutos quando

  • poucos valores distintos (ex.: notas inteiras de 0 a 10, idade em anos com pouca variação).
  • Você quer máxima fidelidade para calcular e interpretar medidas (média, mediana, moda, dispersão) sem aproximações.
  • O objetivo é identificar valores específicos (ex.: “quantos tiraram 7?”).

Use dados agrupados quando

  • muitos valores distintos (ex.: renda, tempo, altura com casas decimais).
  • Você quer um resumo mais compacto para enxergar o padrão geral (concentração, caudas, assimetria).
  • Você pretende construir um histograma ou comparar distribuições de forma visual.

Regra prática: se a tabela de dados brutos ficaria longa demais (muitas linhas) e dificultaria a leitura, agrupar em classes costuma ajudar.

Exemplo base (dados brutos)

Considere os tempos (em minutos) que 20 pessoas levaram para concluir uma tarefa:

12, 15, 15, 16, 18, 18, 19, 20, 21, 22, 22, 23, 24, 25, 25, 26, 28, 30, 31, 35

Se você fizer uma tabela de dados brutos, cada valor distinto vira uma linha. Isso pode funcionar aqui (são poucos valores), mas em conjuntos maiores a tabela cresce rapidamente.

Passo a passo: construindo tabela de frequência com dados agrupados

Passo 1) Identifique mínimo, máximo e amplitude total

  • Mínimo = 12
  • Máximo = 35
  • Amplitude total (range) = 35 − 12 = 23

Passo 2) Defina o número de classes (k) de modo prático

Não existe um único “k correto”. O objetivo é equilibrar:

Continue em nosso aplicativo e ...
  • Ouça o áudio com a tela desligada
  • Ganhe Certificado após a conclusão
  • + de 5000 cursos para você explorar!
ou continue lendo abaixo...
Download App

Baixar o aplicativo

  • Poucas classes → resumo muito grosseiro (perde detalhes).
  • Muitas classes → volta a ficar parecido com dados brutos (pouco ganho de síntese).

Duas regras práticas comuns:

  • Regra da raiz: k ≈ √n. Aqui n = 20 → √20 ≈ 4,47 → use 4 ou 5 classes.
  • Regra de Sturges: k ≈ 1 + 3,3·log10(n). Para n = 20: 1 + 3,3·1,301 ≈ 5,29 → use 5 classes.

Vamos usar k = 5 para o exemplo.

Passo 3) Calcule a amplitude de classe (h)

Uma forma prática:

h ≈ amplitude total / k = 23 / 5 = 4,6

Arredonde para um valor conveniente que facilite os intervalos. Aqui, use h = 5 minutos.

Passo 4) Construa intervalos sem ambiguidade

O ponto mais importante é garantir que cada valor caia em uma única classe. Para isso, use intervalos do tipo:

  • Fechado à esquerda e aberto à direita: [a, b)
  • Ou, se trabalhar com inteiros, pode usar limites inteiros com regra explícita (ex.: 12–16 inclui 12,13,14,15,16), mas precisa deixar isso claro.

Como os dados são inteiros, ainda assim é útil manter a convenção [a, b) para evitar dúvidas. Com h = 5 e começando no mínimo 12:

  • [12, 17)
  • [17, 22)
  • [22, 27)
  • [27, 32)
  • [32, 37)

Esses intervalos cobrem todos os valores de 12 até 35.

Passo 5) Conte a frequência absoluta (fi)

fi é o número de observações que caem na classe.

  • [12, 17): 12, 15, 15, 16 → fi = 4
  • [17, 22): 18, 18, 19, 20, 21 → fi = 5
  • [22, 27): 22, 22, 23, 24, 25, 25, 26 → fi = 7
  • [27, 32): 28, 30, 31 → fi = 3
  • [32, 37): 35 → fi = 1

Cheque: 4 + 5 + 7 + 3 + 1 = 20 (bate com n).

Passo 6) Calcule a frequência relativa (fr) e a porcentagem

fr é a proporção: fr = fi / n. Em porcentagem: 100·fr.

Passo 7) Calcule as frequências acumuladas (Fi e Fr acumulada)

  • Fi (acumulada absoluta) soma as frequências até a classe.
  • Fr acumulada soma as frequências relativas até a classe.

Tabela final (agrupada)

Classe (min)fifr%FiFr acum.
[12, 17)40,2020%40,20
[17, 22)50,2525%90,45
[22, 27)70,3535%160,80
[27, 32)30,1515%190,95
[32, 37)10,055%201,00

Dicas práticas para montar classes “boas”

1) Escolha limites que façam sentido

  • Prefira amplitudes “redondas” (2, 5, 10, 20…) quando possível.
  • Se a variável tem unidade com padrão (ex.: dinheiro), pense em limites compatíveis (ex.: de 100 em 100).

2) Evite classes vazias demais

Se muitas classes ficam com fi = 0 ou 1, talvez você tenha classes demais (k alto) ou amplitude pequena.

3) Evite classes largas demais

Se quase tudo cai em 1–2 classes, você perdeu contraste. Aumente k ou diminua h.

4) Seja explícito sobre a regra de inclusão

Escreva o intervalo de forma que não exista “dupla contagem” nos limites. Exemplo: [22, 27) inclui 22, 23, 24, 25, 26, mas não inclui 27.

Alerta importante: perda de informação ao agrupar (e como isso pode distorcer medidas)

Agrupar em classes simplifica, mas remove detalhes. Isso pode afetar:

  • Moda: em dados agrupados, você identifica “classe modal” (a classe com maior fi), mas não necessariamente o valor mais frequente.
  • Mediana e quantis: frequentemente são estimados por interpolação dentro da classe, o que depende do formato do agrupamento.
  • Média: muitas vezes é aproximada usando o ponto médio de cada classe; isso pode introduzir erro se os dados estiverem concentrados perto de uma borda da classe.
  • Dispersão: variância/desvio padrão aproximados com pontos médios podem subestimar ou superestimar a variabilidade real.

Exemplo de distorção: se você usar classes muito largas, dois conjuntos diferentes podem gerar a mesma tabela agrupada, escondendo diferenças importantes (por exemplo, um conjunto com valores concentrados no início da classe e outro concentrado no fim).

Boa prática

  • Se o objetivo é cálculo preciso de medidas, prefira dados brutos (ou mantenha os dados brutos disponíveis).
  • Use dados agrupados principalmente para comunicação e visão geral.

Atividade prática: diferentes agrupamentos para o mesmo conjunto

Use novamente os 20 tempos (min):

12, 15, 15, 16, 18, 18, 19, 20, 21, 22, 22, 23, 24, 25, 25, 26, 28, 30, 31, 35

Tarefa A) Monte duas tabelas agrupadas diferentes

  • Agrupamento 1: use k = 4 classes. Dica: calcule h ≈ 23/4 = 5,75 e escolha um h conveniente (por exemplo, 6). Construa intervalos sem ambiguidade e calcule fi, fr, Fi.
  • Agrupamento 2: use k = 6 classes. Dica: h ≈ 23/6 ≈ 3,83 e escolha h = 4. Construa intervalos sem ambiguidade e calcule fi, fr, Fi.

Tarefa B) Compare os resumos

  • Em qual agrupamento fica mais fácil ver onde os dados se concentram?
  • Qual agrupamento “esconde” mais a cauda (valores altos como 35)?
  • A classe modal muda? A impressão de assimetria muda?

Tarefa C) Reflexão sobre medidas

  • Calcule a média exata com os dados brutos.
  • Depois, estime a média usando cada tabela agrupada (ponto médio da classe × fi, dividido por n).
  • Compare os resultados e anote a diferença. Em qual agrupamento o erro foi maior?

Agora responda o exercício sobre o conteúdo:

Ao construir uma tabela de frequência com dados agrupados, qual prática evita que um mesmo valor seja contado em duas classes diferentes?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Intervalos sem ambiguidade (por exemplo, [a, b)) evitam dupla contagem nos limites, pois cada observação pertence a uma única classe.

Próximo capitúlo

Estatística Descritiva do Zero: gráficos para descrever distribuições e categorias

Arrow Right Icon
Capa do Ebook gratuito Estatística Descritiva do Zero: Como Entender e Resumir Dados
38%

Estatística Descritiva do Zero: Como Entender e Resumir Dados

Novo curso

13 páginas

Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.