Estatística Descritiva do Zero: tipos de variáveis e escalas de medição

Capítulo 2

Tempo estimado de leitura: 9 minutos

+ Exercício

O que é uma variável (na prática)

Uma variável é uma característica que pode mudar de uma observação para outra. Se você está analisando clientes, por exemplo, cada cliente é uma unidade observada, e variáveis podem ser: cidade, plano contratado, idade, número de compras, tempo de entrega, nota de satisfação.

O ponto central deste capítulo é: o tipo de variável e a escala de medição determinam quais tabelas, gráficos e medidas fazem sentido. Usar uma medida inadequada (por exemplo, média para categorias como “cor do produto”) gera interpretações erradas.

Dois grandes grupos: qualitativas e quantitativas

1) Variáveis qualitativas (categóricas)

São variáveis que descrevem categorias (rótulos). Podem ser palavras, códigos ou números que funcionam apenas como identificação de uma categoria.

1.1) Qualitativa nominal

As categorias não têm ordem natural.

  • Exemplos do cotidiano: tipo sanguíneo (A, B, AB, O), cor do carro, bairro.
  • Exemplos de negócios: canal de aquisição (orgânico, anúncio, indicação), método de pagamento (PIX, cartão, boleto), categoria do produto.

O que costuma ser adequado: tabelas de frequência, proporções/percentuais, moda (categoria mais frequente).

Continue em nosso aplicativo e ...
  • Ouça o áudio com a tela desligada
  • Ganhe Certificado após a conclusão
  • + de 5000 cursos para você explorar!
ou continue lendo abaixo...
Download App

Baixar o aplicativo

O que não faz sentido: média, mediana e desvio-padrão (não existe “média” de categorias).

1.2) Qualitativa ordinal

As categorias têm ordem, mas a distância entre categorias não é numérica/constante.

  • Exemplos do cotidiano: nível de escolaridade (fundamental, médio, superior), grau de dor (leve, moderada, intensa).
  • Exemplos de negócios: satisfação (ruim, regular, bom, ótimo), prioridade de atendimento (baixa, média, alta), classificação de risco (baixo, médio, alto).

O que costuma ser adequado: tabelas de frequência, percentuais, gráficos ordenados (barras ordenadas), mediana e percentis (dependendo do caso), moda.

Cuidado: é comum transformar ordinal em números (1 a 5), mas isso não garante que a diferença entre 1→2 seja “igual” à diferença entre 4→5. Trate como ordinal a menos que você tenha justificativa forte para assumir intervalos equivalentes.

2) Variáveis quantitativas (numéricas)

Representam quantidades e permitem operações aritméticas com significado (somar, subtrair, calcular média).

2.1) Quantitativa discreta

Assume valores contáveis, geralmente inteiros (resultados de contagem).

  • Exemplos do cotidiano: número de filhos, quantidade de livros.
  • Exemplos de negócios: número de compras no mês, quantidade de chamados abertos, total de itens no carrinho.

O que costuma ser adequado: tabelas de frequência, gráficos de barras (ou colunas), medidas como média, mediana, variância/desvio-padrão (quando fizer sentido), e percentis.

2.2) Quantitativa contínua

Pode assumir qualquer valor em um intervalo (resultado de medição). Na prática, pode aparecer com decimais.

  • Exemplos do cotidiano: altura, peso, temperatura.
  • Exemplos de negócios: tempo de atendimento (minutos/segundos), valor gasto (R$ com centavos), tempo de entrega, taxa de conversão (proporção).

O que costuma ser adequado: histogramas, boxplots, medidas como média, mediana, desvio-padrão, quartis e percentis.

Escalas de medição: como elas mudam o que você pode fazer

Além de “qualitativa vs quantitativa”, é útil pensar na escala de medição, porque ela define quais comparações e operações são válidas.

EscalaO que significaExemplosO que é adequadoEvite
NominalCategoria sem ordemEstado civil, canal, corFrequências, percentuais, moda; barras/pizzaMédia/mediana; operações numéricas
OrdinalCategoria com ordemNPS por faixa, satisfação 1–5 (como ordem), nível de riscoFrequências; barras ordenadas; mediana/percentis (com cuidado)Assumir “distâncias iguais” sem justificativa
IntervalarDiferenças fazem sentido; zero é arbitrárioTemperatura em °C, datas (ano)Média, desvio-padrão; comparar diferençasComparar razões (“o dobro”) como se fosse válido
RazãoDiferenças e razões fazem sentido; zero é absolutoTempo, peso, receita, idade (em anos), distânciaTodas as medidas numéricas; razões (“o dobro”) fazem sentido

Observação importante: muitas variáveis de negócios são de razão (tempo, dinheiro, quantidade). Já escalas de satisfação (1 a 5) são frequentemente ordinais, mesmo que usem números.

Como escolher tabelas, gráficos e medidas (passo a passo)

Passo 1 — Pergunte: é categoria ou número?

  • Se a resposta é “categoria/rótulo”: qualitativa.
  • Se a resposta é “quantidade mensurável”: quantitativa.

Passo 2 — Se for qualitativa, existe ordem?

  • Sem ordem: nominal.
  • Com ordem: ordinal.

Passo 3 — Se for quantitativa, é contagem ou medição?

  • Contagem (inteiros): discreta.
  • Medição (pode ter decimais): contínua.

Passo 4 — Escolha representações adequadas

  • Nominal: tabela de frequências; gráfico de barras; percentuais; moda.
  • Ordinal: tabela de frequências; barras ordenadas; mediana/percentis (se fizer sentido); moda.
  • Discreta: barras; frequências; média/mediana; dispersão.
  • Contínua: histograma; boxplot; média/mediana; quartis; desvio-padrão.

Exemplos aplicados (cotidiano e negócios)

Exemplo 1 — “Tempo de entrega”

Tipo: quantitativa contínua (razão). Você pode calcular média, mediana, percentis (p90), desvio-padrão. Gráficos úteis: histograma e boxplot.

Armadilha comum: resumir apenas com a média e ignorar cauda longa. Em logística, percentis (p90/p95) costumam comunicar melhor o “pior caso típico”.

Exemplo 2 — “Plano do cliente” (Básico, Pro, Enterprise)

Tipo: geralmente qualitativa nominal (não há “ordem natural” universal; depende do contexto). Use frequências e barras.

Quando pode virar ordinal: se o negócio define claramente uma hierarquia (Básico < Pro < Enterprise) e você quer analisar migração/upgrade como “subir/descer” de nível. Ainda assim, a distância entre níveis não é numérica.

Exemplo 3 — “Satisfação (1 a 5)”

Tipo: na maioria dos casos, qualitativa ordinal (1=ruim … 5=ótimo). Use frequências por nota, barras ordenadas e mediana.

Quando algumas equipes usam média: para monitoramento rápido (ex.: média semanal). Isso pode ser útil operacionalmente, mas lembre que você está assumindo intervalos iguais entre notas. Se for reportar para decisão estratégica, prefira também distribuições e percentuais por faixa (ex.: % notas 4–5).

Exemplo 4 — “Idade” (o mesmo dado, usos diferentes)

Idade em anos (ex.: 37): quantitativa (razão). Permite média, mediana, desvio-padrão, histogramas.

Idade em faixas (ex.: 18–24, 25–34, 35–44): qualitativa ordinal. Permite frequências e barras ordenadas; mediana por faixa é possível, mas perde precisão.

Por que mudar a forma? Depende do objetivo: segmentação de marketing e comunicação costuma funcionar melhor com faixas; análise de risco/precificação pode exigir idade numérica.

Casos em que a variável pode ser tratada de maneiras diferentes

1) Valor monetário: número contínuo vs. faixas de ticket

  • Valor exato (R$): quantitativa contínua (razão). Bom para média, mediana, percentis, boxplot.
  • Faixas (até 50, 50–200, 200+): ordinal. Bom para segmentação e comunicação simples.

Trade-off: faixas simplificam, mas escondem variação dentro de cada faixa.

2) Tempo de atendimento: segundos vs. categorias operacionais

  • Segundos/minutos: contínua (razão), ideal para percentis e dispersão.
  • Status operacional (rápido/normal/lento): ordinal, útil para painéis e metas.

3) Localização: nominal vs. numérica (cuidado)

Cidade/estado: nominal. Mesmo que você codifique “SP=1, RJ=2”, isso não vira quantitativa; o código é apenas um rótulo.

Coordenadas (latitude/longitude): quantitativa contínua, mas exigem técnicas específicas (não é só fazer média simples sem pensar no contexto geográfico).

Exercícios guiados: classifique as variáveis

Exercício 1 — Classificação direta

Para cada item, responda: (a) qualitativa ou quantitativa? (b) se qualitativa: nominal ou ordinal? se quantitativa: discreta ou contínua? (c) qual gráfico/tabela e qual medida resumo você escolheria primeiro?

  • A) Número de reclamações por cliente no mês
  • B) Tempo de espera em uma fila (em minutos, com decimais)
  • C) Região do país (N, NE, CO, SE, S)
  • D) Nível de urgência (baixa, média, alta)
  • E) Receita mensal do cliente (R$)
  • F) Nota de atendimento (1 a 5)
  • G) Quantidade de páginas visitadas em uma sessão
  • H) Tipo de assinatura (mensal, anual)

Gabarito comentado (resumo):

  • A) Quantitativa discreta; barras/frequências; média/mediana.
  • B) Quantitativa contínua; histograma/boxplot; mediana e percentis (p90).
  • C) Qualitativa nominal; barras; percentuais e moda.
  • D) Qualitativa ordinal; barras ordenadas; mediana (categoria central) e percentuais por nível.
  • E) Quantitativa contínua (razão); boxplot/histograma; mediana, p75/p90, média (com cuidado com outliers).
  • F) Qualitativa ordinal (na maioria dos casos); barras; mediana e distribuição por nota.
  • G) Quantitativa discreta; barras/histograma (dependendo do range); média/mediana.
  • H) Qualitativa nominal; barras; percentuais.

Exercício 2 — A mesma variável, duas leituras possíveis

Você tem a variável idade em um cadastro.

Tarefa: escolha a melhor forma de tratar a variável em cada objetivo abaixo e diga por quê.

  • Objetivo 1: criar segmentos para campanhas (mensagens diferentes por público).
  • Objetivo 2: estimar relação entre idade e gasto mensal.
  • Objetivo 3: montar um painel simples para diretoria.

Respostas esperadas (direção):

  • Objetivo 1: faixas etárias (ordinal) para segmentação e comunicação.
  • Objetivo 2: idade numérica (quantitativa de razão) para preservar informação e permitir análises mais finas.
  • Objetivo 3: depende do nível de detalhe; frequentemente faixas (ordinal) + percentuais por faixa.

Exercício 3 — Identifique armadilhas de escala

Marque quais afirmações são problemáticas e explique o motivo.

  • 1) “A média do método de pagamento é 2,3, então o pagamento típico é cartão.”
  • 2) “A mediana da satisfação (1 a 5) é 4.”
  • 3) “A temperatura média subiu 2°C, então dobrou.”
  • 4) “O cliente A gastou o dobro do cliente B.”

Comentários:

  • 1) Problemática: método de pagamento é nominal; números seriam apenas códigos.
  • 2) Geralmente aceitável: satisfação é ordinal; mediana pode resumir a posição central.
  • 3) Problemática: °C é intervalar; diferenças fazem sentido, mas razão (“dobrou”) não.
  • 4) Aceitável se gasto é em escala de razão (R$), pois razão é interpretável.

Checklist rápido para não errar

  • Se é categoria, comece com frequências e percentuais.
  • Se é ordinal, mantenha a ordem nos gráficos e evite assumir intervalos iguais sem justificativa.
  • Se é numérica, pergunte se é contagem (discreta) ou medição (contínua).
  • Se você transformar uma variável (ex.: idade em faixas), registre o motivo: segmentação, comunicação, robustez, privacidade, etc.
  • Códigos numéricos para categorias não tornam a variável quantitativa.

Agora responda o exercício sobre o conteúdo:

Ao analisar a variável “método de pagamento” (PIX, cartão, boleto), qual é a forma mais adequada de resumir os dados e qual medida deve ser evitada?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

“Método de pagamento” é uma variável qualitativa nominal: categorias sem ordem. Faz sentido resumir por frequências/percentuais e moda. Média ou mediana não têm interpretação válida para rótulos.

Próximo capitúlo

Estatística Descritiva do Zero: organização e limpeza mínima para resumir dados

Arrow Right Icon
Capa do Ebook gratuito Estatística Descritiva do Zero: Como Entender e Resumir Dados
15%

Estatística Descritiva do Zero: Como Entender e Resumir Dados

Novo curso

13 páginas

Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.