Estatística Descritiva do Zero: tabelas de frequência para variáveis qualitativas

Capítulo 4

Tempo estimado de leitura: 7 minutos

+ Exercício

O que é uma tabela de frequência para variáveis qualitativas

Uma tabela de frequência resume uma variável qualitativa (categorias) contando quantas observações caem em cada categoria e, normalmente, mostrando também a proporção que cada categoria representa no total. Ela é uma das formas mais diretas de responder perguntas como: “Qual categoria é mais comum?”, “Quais são raras?”, “Como as categorias se distribuem?”.

Para variáveis qualitativas, as frequências mais usadas são:

  • Frequência absoluta (n): número de casos em cada categoria.
  • Frequência relativa (f ou %): proporção em cada categoria, calculada por n / N (em %: (n / N) * 100).
  • Frequência acumulada: só faz sentido quando existe ordem natural entre as categorias (variável ordinal). Para categorias sem ordem (nominal), “acumular” é arbitrário e pode confundir.

Checklist do que uma boa tabela de frequência deve ter

  • Nome da variável e tamanho da amostra (N).
  • Categorias bem definidas (sem sobreposição).
  • Colunas com n e % (quase sempre).
  • Se ordinal: incluir acumuladas (n acumulado e/ou % acumulado).
  • Tratamento explícito de categorias raras (manter ou agrupar em “Outros” com justificativa).
  • Uma linha de Total (para conferir se soma N e 100%).

Como decidir a ordem das categorias

1) Ordem natural (recomendada para variáveis ordinais)

Use quando as categorias têm hierarquia/ordem intrínseca (ex.: “Ruim”, “Regular”, “Bom”, “Ótimo”). Isso facilita leitura e permite frequência acumulada.

2) Ordem alfabética (útil para listas longas e consulta)

Use quando não há ordem natural e o objetivo é facilitar localizar uma categoria específica (ex.: lista de bairros, marcas, estados).

3) Ordem por frequência (muito usada para destacar o que é mais comum)

Ordene do maior para o menor n (ou %). É ótima para interpretação rápida (“top categorias”), mas não use acumulada em variáveis nominais só porque está ordenado por frequência.

Continue em nosso aplicativo e ...
  • Ouça o áudio com a tela desligada
  • Ganhe Certificado após a conclusão
  • + de 5000 cursos para você explorar!
ou continue lendo abaixo...
Download App

Baixar o aplicativo

Categorias raras e a categoria “Outros”: quando e como usar

Em variáveis qualitativas com muitas categorias, algumas aparecem poucas vezes. Você tem duas opções principais:

  • Manter categorias raras separadas quando elas são importantes para a análise (mesmo com poucos casos) ou quando o público precisa ver todas as categorias.
  • Agrupar em “Outros” quando há muitas categorias com baixa frequência e o objetivo é comunicar o padrão geral sem poluir a tabela.

Como justificar “Outros” de forma objetiva

Defina um critério antes (ou explique o critério usado). Exemplos de critérios comuns:

  • Agrupar categorias com n < 2 (ou n < 5), dependendo do tamanho da amostra.
  • Agrupar categorias com % < 5%.
  • Manter as k categorias mais frequentes e agrupar o restante (ex.: “Top 5 + Outros”).

Ao usar “Outros”, deixe claro o que entrou nele (em texto ou nota). Se o material for para tomada de decisão, considere disponibilizar uma tabela detalhada em anexo.

Passo a passo: construindo uma tabela de frequência (nominal)

Exemplo 1 (variável nominal): meio de transporte usado para ir ao trabalho. Dados de N = 30 pessoas:

Ônibus, Carro, Metrô, Carro, Carro, Bicicleta, Ônibus, A pé, Carro, Metrô, Ônibus, Carro, Carro, Carro, Aplicativo, Ônibus, Metrô, Carro, A pé, Carro, Carro, Ônibus, Carro, Carro, Metrô, Carro, Patinete, Carro, Ônibus, Carro

Passo 1) Listar categorias e contar (frequência absoluta)

Contagens (n):

  • Carro: 15
  • Ônibus: 6
  • Metrô: 4
  • A pé: 2
  • Bicicleta: 1
  • Aplicativo: 1
  • Patinete: 1

Passo 2) Calcular frequência relativa (%)

Use % = (n / N) * 100 com N = 30. Exemplos:

  • Carro: (15/30)*100 = 50,0%
  • Ônibus: (6/30)*100 = 20,0%
  • Metrô: (4/30)*100 = 13,3%

Passo 3) Decidir se haverá “Outros” (e justificar)

Há três categorias com n = 1 (3,3% cada). Para comunicar melhor, vamos agrupar em Outros todas as categorias com n = 1 (critério: n = 1), mantendo as demais separadas.

Assim, Outros = Bicicleta + Aplicativo + Patinete = 3 casos (10,0%).

Passo 4) Escolher a ordem

Como não há ordem natural, vamos ordenar por frequência decrescente para destacar as categorias mais comuns.

Tabela final (com absoluta e relativa)

Meio de transporten%
Carro1550,0%
Ônibus620,0%
Metrô413,3%
Outros (Bicicleta, Aplicativo, Patinete)310,0%
A pé26,7%
Total30100,0%

Como escrever interpretações objetivas a partir da tabela

Interpretações objetivas descrevem o que a tabela mostra, sem “explicar causas” (isso exigiria análise adicional). Exemplos adequados:

  • Predominância: “Carro é o meio mais frequente, com 50,0% (15 de 30).”
  • Comparação direta: “Ônibus (20,0%) é mais comum do que metrô (13,3%).”
  • Concentração: “As duas categorias mais frequentes (Carro e Ônibus) somam 70,0%.”
  • Raridade (com critério): “Três meios aparecem apenas uma vez cada e foram agrupados em ‘Outros’, totalizando 10,0%.”

Evite interpretações que extrapolam: “As pessoas preferem carro porque o transporte público é ruim” (isso não está na tabela).

Passo a passo: tabela de frequência com acumulada (ordinal)

Exemplo 2 (variável ordinal): satisfação com o atendimento em uma loja, em N = 25 respostas:

Ruim, Regular, Bom, Ótimo, Bom, Bom, Regular, Ótimo, Bom, Regular, Bom, Ruim, Bom, Ótimo, Regular, Bom, Bom, Ótimo, Regular, Bom, Regular, Bom, Ótimo, Bom, Regular

Passo 1) Definir a ordem natural

Ruim < Regular < Bom < Ótimo.

Passo 2) Contar (n) e calcular (%)

Contagens:

  • Ruim: 2
  • Regular: 7
  • Bom: 10
  • Ótimo: 6

Percentuais:

  • Ruim: 2/25 = 8,0%
  • Regular: 7/25 = 28,0%
  • Bom: 10/25 = 40,0%
  • Ótimo: 6/25 = 24,0%

Passo 3) Calcular acumuladas (faz sentido porque é ordinal)

Acumulada soma progressivamente na ordem natural:

  • n acumulado: 2, 9, 19, 25
  • % acumulado: 8,0%, 36,0%, 76,0%, 100,0%

Tabela final (incluindo acumuladas)

Satisfaçãon%n acumulado% acumulado
Ruim28,0%28,0%
Regular728,0%936,0%
Bom1040,0%1976,0%
Ótimo624,0%25100,0%
Total25100,0%

Interpretações objetivas usando a acumulada

  • “A categoria mais frequente é ‘Bom’ (40,0%).”
  • “76,0% avaliaram como ‘Bom’ ou pior (até ‘Bom’ na acumulada).”
  • “24,0% avaliaram como ‘Ótimo’.”
  • “A proporção de avaliações pelo menos ‘Regular’ é 92,0% (100% − 8,0%).”

Erros comuns e como evitar

  • Somar percentuais e não dar 100%: pode ser arredondamento. Use 1 casa decimal e aceite pequenas diferenças (ex.: 99,9% ou 100,1%). Garanta que os n somem exatamente N.
  • Usar acumulada em variável nominal: acumulada depende de ordem interpretável; em nominal, a ordem é escolha do autor e pode induzir leitura errada.
  • “Outros” sem critério: sempre explique o critério (por n, por %, ou top-k).
  • Categorias muito detalhadas: se a tabela fica longa e pouco informativa, considere agrupar, mas sem esconder informação relevante.

Exercícios (com respostas esperadas)

Exercício 1 (nominal, com “Outros”)

Uma pesquisa com N = 40 pessoas perguntou o canal de compra preferido. Contagens:

  • Loja física: 14
  • Site: 12
  • App: 9
  • Telefone: 2
  • WhatsApp: 2
  • Marketplace: 1

Tarefa: (a) Monte a tabela com n e %. (b) Agrupe em “Outros” categorias com n ≤ 2 e justifique. (c) Escreva 3 interpretações objetivas.

Resposta esperada (Exercício 1)

(a) Percentuais:

  • Loja física: 14/40 = 35,0%
  • Site: 12/40 = 30,0%
  • App: 9/40 = 22,5%
  • Telefone: 2/40 = 5,0%
  • WhatsApp: 2/40 = 5,0%
  • Marketplace: 1/40 = 2,5%

(b) Critério: agrupar categorias com n ≤ 2 para reduzir categorias raras e destacar as principais. “Outros” = Telefone (2) + WhatsApp (2) + Marketplace (1) = 5 (12,5%).

Canal de compran%
Loja física1435,0%
Site1230,0%
App922,5%
Outros (Telefone, WhatsApp, Marketplace)512,5%
Total40100,0%

(c) Interpretações objetivas (exemplos):

  • “Loja física é o canal mais frequente (35,0%).”
  • “Site e App juntos somam 52,5%, indicando predominância de canais digitais.”
  • “Categorias raras (n ≤ 2) foram agrupadas em ‘Outros’ e representam 12,5%.”

Exercício 2 (ordinal, com acumulada)

Em N = 50 avaliações de um serviço, a pergunta foi: “Como você avalia a clareza das informações?”. Contagens:

  • Muito baixa: 3
  • Baixa: 7
  • Média: 15
  • Alta: 18
  • Muito alta: 7

Tarefa: (a) Monte a tabela com n, %, n acumulado e % acumulado na ordem natural. (b) Escreva 4 interpretações objetivas, sendo pelo menos 2 usando acumulada.

Resposta esperada (Exercício 2)

(a) Percentuais:

  • Muito baixa: 3/50 = 6,0%
  • Baixa: 7/50 = 14,0%
  • Média: 15/50 = 30,0%
  • Alta: 18/50 = 36,0%
  • Muito alta: 7/50 = 14,0%

Acumuladas (ordem natural):

  • n acumulado: 3, 10, 25, 43, 50
  • % acumulado: 6,0%, 20,0%, 50,0%, 86,0%, 100,0%
Clarezan%n acumulado% acumulado
Muito baixa36,0%36,0%
Baixa714,0%1020,0%
Média1530,0%2550,0%
Alta1836,0%4386,0%
Muito alta714,0%50100,0%
Total50100,0%

(b) Interpretações objetivas (exemplos):

  • “A categoria mais frequente é ‘Alta’ (36,0%).”
  • “Metade das avaliações está em ‘Média’ ou abaixo (50,0% na acumulada até ‘Média’).”
  • “86,0% avaliaram como ‘Alta’ ou abaixo (acumulada até ‘Alta’).”
  • “A proporção de avaliações pelo menos ‘Alta’ é 50,0% (36,0% + 14,0%).”

Exercício 3 (ordenação de categorias)

Você vai apresentar uma tabela de frequência para a variável nominal estado (UF) em um cadastro com muitas UFs diferentes. Tarefa: escolha a melhor ordenação (natural, alfabética ou por frequência) para cada objetivo e escreva uma frase de justificativa:

  • (a) Facilitar que alguém encontre rapidamente uma UF específica.
  • (b) Destacar quais UFs concentram mais cadastros.

Resposta esperada (Exercício 3)

  • (a) Alfabética: “Como o objetivo é localizar uma UF específica, a ordem alfabética reduz o tempo de busca.”
  • (b) Por frequência: “Como o objetivo é evidenciar concentração, ordenar do maior para o menor mostra imediatamente as UFs mais representativas.”

Agora responda o exercício sobre o conteúdo:

Ao montar uma tabela de frequência para uma variável qualitativa nominal, em qual situação faz sentido incluir frequência acumulada?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

A frequência acumulada exige uma ordem interpretável entre as categorias. Isso ocorre em variáveis ordinais (ordem natural). Em variáveis nominais, qualquer ordem é escolhida pelo autor, tornando a acumulada arbitrária e potencialmente enganosa.

Próximo capitúlo

Estatística Descritiva do Zero: tabelas de frequência para variáveis quantitativas e dados agrupados

Arrow Right Icon
Capa do Ebook gratuito Estatística Descritiva do Zero: Como Entender e Resumir Dados
31%

Estatística Descritiva do Zero: Como Entender e Resumir Dados

Novo curso

13 páginas

Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.