O que é uma variável (na prática)
Uma variável é uma característica que pode mudar de uma observação para outra. Se você está analisando clientes, por exemplo, cada cliente é uma unidade observada, e variáveis podem ser: cidade, plano contratado, idade, número de compras, tempo de entrega, nota de satisfação.
O ponto central deste capítulo é: o tipo de variável e a escala de medição determinam quais tabelas, gráficos e medidas fazem sentido. Usar uma medida inadequada (por exemplo, média para categorias como “cor do produto”) gera interpretações erradas.
Dois grandes grupos: qualitativas e quantitativas
1) Variáveis qualitativas (categóricas)
São variáveis que descrevem categorias (rótulos). Podem ser palavras, códigos ou números que funcionam apenas como identificação de uma categoria.
1.1) Qualitativa nominal
As categorias não têm ordem natural.
- Exemplos do cotidiano: tipo sanguíneo (A, B, AB, O), cor do carro, bairro.
- Exemplos de negócios: canal de aquisição (orgânico, anúncio, indicação), método de pagamento (PIX, cartão, boleto), categoria do produto.
O que costuma ser adequado: tabelas de frequência, proporções/percentuais, moda (categoria mais frequente).
- Ouça o áudio com a tela desligada
- Ganhe Certificado após a conclusão
- + de 5000 cursos para você explorar!
Baixar o aplicativo
O que não faz sentido: média, mediana e desvio-padrão (não existe “média” de categorias).
1.2) Qualitativa ordinal
As categorias têm ordem, mas a distância entre categorias não é numérica/constante.
- Exemplos do cotidiano: nível de escolaridade (fundamental, médio, superior), grau de dor (leve, moderada, intensa).
- Exemplos de negócios: satisfação (ruim, regular, bom, ótimo), prioridade de atendimento (baixa, média, alta), classificação de risco (baixo, médio, alto).
O que costuma ser adequado: tabelas de frequência, percentuais, gráficos ordenados (barras ordenadas), mediana e percentis (dependendo do caso), moda.
Cuidado: é comum transformar ordinal em números (1 a 5), mas isso não garante que a diferença entre 1→2 seja “igual” à diferença entre 4→5. Trate como ordinal a menos que você tenha justificativa forte para assumir intervalos equivalentes.
2) Variáveis quantitativas (numéricas)
Representam quantidades e permitem operações aritméticas com significado (somar, subtrair, calcular média).
2.1) Quantitativa discreta
Assume valores contáveis, geralmente inteiros (resultados de contagem).
- Exemplos do cotidiano: número de filhos, quantidade de livros.
- Exemplos de negócios: número de compras no mês, quantidade de chamados abertos, total de itens no carrinho.
O que costuma ser adequado: tabelas de frequência, gráficos de barras (ou colunas), medidas como média, mediana, variância/desvio-padrão (quando fizer sentido), e percentis.
2.2) Quantitativa contínua
Pode assumir qualquer valor em um intervalo (resultado de medição). Na prática, pode aparecer com decimais.
- Exemplos do cotidiano: altura, peso, temperatura.
- Exemplos de negócios: tempo de atendimento (minutos/segundos), valor gasto (R$ com centavos), tempo de entrega, taxa de conversão (proporção).
O que costuma ser adequado: histogramas, boxplots, medidas como média, mediana, desvio-padrão, quartis e percentis.
Escalas de medição: como elas mudam o que você pode fazer
Além de “qualitativa vs quantitativa”, é útil pensar na escala de medição, porque ela define quais comparações e operações são válidas.
| Escala | O que significa | Exemplos | O que é adequado | Evite |
|---|---|---|---|---|
| Nominal | Categoria sem ordem | Estado civil, canal, cor | Frequências, percentuais, moda; barras/pizza | Média/mediana; operações numéricas |
| Ordinal | Categoria com ordem | NPS por faixa, satisfação 1–5 (como ordem), nível de risco | Frequências; barras ordenadas; mediana/percentis (com cuidado) | Assumir “distâncias iguais” sem justificativa |
| Intervalar | Diferenças fazem sentido; zero é arbitrário | Temperatura em °C, datas (ano) | Média, desvio-padrão; comparar diferenças | Comparar razões (“o dobro”) como se fosse válido |
| Razão | Diferenças e razões fazem sentido; zero é absoluto | Tempo, peso, receita, idade (em anos), distância | Todas as medidas numéricas; razões (“o dobro”) fazem sentido | — |
Observação importante: muitas variáveis de negócios são de razão (tempo, dinheiro, quantidade). Já escalas de satisfação (1 a 5) são frequentemente ordinais, mesmo que usem números.
Como escolher tabelas, gráficos e medidas (passo a passo)
Passo 1 — Pergunte: é categoria ou número?
- Se a resposta é “categoria/rótulo”: qualitativa.
- Se a resposta é “quantidade mensurável”: quantitativa.
Passo 2 — Se for qualitativa, existe ordem?
- Sem ordem: nominal.
- Com ordem: ordinal.
Passo 3 — Se for quantitativa, é contagem ou medição?
- Contagem (inteiros): discreta.
- Medição (pode ter decimais): contínua.
Passo 4 — Escolha representações adequadas
- Nominal: tabela de frequências; gráfico de barras; percentuais; moda.
- Ordinal: tabela de frequências; barras ordenadas; mediana/percentis (se fizer sentido); moda.
- Discreta: barras; frequências; média/mediana; dispersão.
- Contínua: histograma; boxplot; média/mediana; quartis; desvio-padrão.
Exemplos aplicados (cotidiano e negócios)
Exemplo 1 — “Tempo de entrega”
Tipo: quantitativa contínua (razão). Você pode calcular média, mediana, percentis (p90), desvio-padrão. Gráficos úteis: histograma e boxplot.
Armadilha comum: resumir apenas com a média e ignorar cauda longa. Em logística, percentis (p90/p95) costumam comunicar melhor o “pior caso típico”.
Exemplo 2 — “Plano do cliente” (Básico, Pro, Enterprise)
Tipo: geralmente qualitativa nominal (não há “ordem natural” universal; depende do contexto). Use frequências e barras.
Quando pode virar ordinal: se o negócio define claramente uma hierarquia (Básico < Pro < Enterprise) e você quer analisar migração/upgrade como “subir/descer” de nível. Ainda assim, a distância entre níveis não é numérica.
Exemplo 3 — “Satisfação (1 a 5)”
Tipo: na maioria dos casos, qualitativa ordinal (1=ruim … 5=ótimo). Use frequências por nota, barras ordenadas e mediana.
Quando algumas equipes usam média: para monitoramento rápido (ex.: média semanal). Isso pode ser útil operacionalmente, mas lembre que você está assumindo intervalos iguais entre notas. Se for reportar para decisão estratégica, prefira também distribuições e percentuais por faixa (ex.: % notas 4–5).
Exemplo 4 — “Idade” (o mesmo dado, usos diferentes)
Idade em anos (ex.: 37): quantitativa (razão). Permite média, mediana, desvio-padrão, histogramas.
Idade em faixas (ex.: 18–24, 25–34, 35–44): qualitativa ordinal. Permite frequências e barras ordenadas; mediana por faixa é possível, mas perde precisão.
Por que mudar a forma? Depende do objetivo: segmentação de marketing e comunicação costuma funcionar melhor com faixas; análise de risco/precificação pode exigir idade numérica.
Casos em que a variável pode ser tratada de maneiras diferentes
1) Valor monetário: número contínuo vs. faixas de ticket
- Valor exato (R$): quantitativa contínua (razão). Bom para média, mediana, percentis, boxplot.
- Faixas (até 50, 50–200, 200+): ordinal. Bom para segmentação e comunicação simples.
Trade-off: faixas simplificam, mas escondem variação dentro de cada faixa.
2) Tempo de atendimento: segundos vs. categorias operacionais
- Segundos/minutos: contínua (razão), ideal para percentis e dispersão.
- Status operacional (rápido/normal/lento): ordinal, útil para painéis e metas.
3) Localização: nominal vs. numérica (cuidado)
Cidade/estado: nominal. Mesmo que você codifique “SP=1, RJ=2”, isso não vira quantitativa; o código é apenas um rótulo.
Coordenadas (latitude/longitude): quantitativa contínua, mas exigem técnicas específicas (não é só fazer média simples sem pensar no contexto geográfico).
Exercícios guiados: classifique as variáveis
Exercício 1 — Classificação direta
Para cada item, responda: (a) qualitativa ou quantitativa? (b) se qualitativa: nominal ou ordinal? se quantitativa: discreta ou contínua? (c) qual gráfico/tabela e qual medida resumo você escolheria primeiro?
- A) Número de reclamações por cliente no mês
- B) Tempo de espera em uma fila (em minutos, com decimais)
- C) Região do país (N, NE, CO, SE, S)
- D) Nível de urgência (baixa, média, alta)
- E) Receita mensal do cliente (R$)
- F) Nota de atendimento (1 a 5)
- G) Quantidade de páginas visitadas em uma sessão
- H) Tipo de assinatura (mensal, anual)
Gabarito comentado (resumo):
- A) Quantitativa discreta; barras/frequências; média/mediana.
- B) Quantitativa contínua; histograma/boxplot; mediana e percentis (p90).
- C) Qualitativa nominal; barras; percentuais e moda.
- D) Qualitativa ordinal; barras ordenadas; mediana (categoria central) e percentuais por nível.
- E) Quantitativa contínua (razão); boxplot/histograma; mediana, p75/p90, média (com cuidado com outliers).
- F) Qualitativa ordinal (na maioria dos casos); barras; mediana e distribuição por nota.
- G) Quantitativa discreta; barras/histograma (dependendo do range); média/mediana.
- H) Qualitativa nominal; barras; percentuais.
Exercício 2 — A mesma variável, duas leituras possíveis
Você tem a variável idade em um cadastro.
Tarefa: escolha a melhor forma de tratar a variável em cada objetivo abaixo e diga por quê.
- Objetivo 1: criar segmentos para campanhas (mensagens diferentes por público).
- Objetivo 2: estimar relação entre idade e gasto mensal.
- Objetivo 3: montar um painel simples para diretoria.
Respostas esperadas (direção):
- Objetivo 1: faixas etárias (ordinal) para segmentação e comunicação.
- Objetivo 2: idade numérica (quantitativa de razão) para preservar informação e permitir análises mais finas.
- Objetivo 3: depende do nível de detalhe; frequentemente faixas (ordinal) + percentuais por faixa.
Exercício 3 — Identifique armadilhas de escala
Marque quais afirmações são problemáticas e explique o motivo.
- 1) “A média do método de pagamento é 2,3, então o pagamento típico é cartão.”
- 2) “A mediana da satisfação (1 a 5) é 4.”
- 3) “A temperatura média subiu 2°C, então dobrou.”
- 4) “O cliente A gastou o dobro do cliente B.”
Comentários:
- 1) Problemática: método de pagamento é nominal; números seriam apenas códigos.
- 2) Geralmente aceitável: satisfação é ordinal; mediana pode resumir a posição central.
- 3) Problemática: °C é intervalar; diferenças fazem sentido, mas razão (“dobrou”) não.
- 4) Aceitável se gasto é em escala de razão (R$), pois razão é interpretável.
Checklist rápido para não errar
- Se é categoria, comece com frequências e percentuais.
- Se é ordinal, mantenha a ordem nos gráficos e evite assumir intervalos iguais sem justificativa.
- Se é numérica, pergunte se é contagem (discreta) ou medição (contínua).
- Se você transformar uma variável (ex.: idade em faixas), registre o motivo: segmentação, comunicação, robustez, privacidade, etc.
- Códigos numéricos para categorias não tornam a variável quantitativa.