Estatística Descritiva do Zero: gráficos para descrever distribuições e categorias

Capítulo 6

Tempo estimado de leitura: 10 minutos

+ Exercício

Por que usar gráficos na estatística descritiva

Gráficos transformam tabelas e listas de valores em padrões visuais: comparação entre categorias, forma da distribuição, concentração, dispersão, assimetria e presença de valores extremos. A escolha do gráfico depende do tipo de variável (qualitativa ou quantitativa) e do objetivo analítico (comparar, entender distribuição, acompanhar acumulado, detectar outliers).

Gráficos para variáveis qualitativas: barras e colunas

Quando usar

  • Comparar frequências (absolutas) ou proporções (relativas) entre categorias.
  • Destacar categorias mais comuns e menos comuns.
  • Comparar grupos (barras agrupadas) ou composição (barras empilhadas), com cuidado para não dificultar a leitura.

Como ler

A altura (ou comprimento) da barra representa a frequência ou a proporção. A comparação é feita pela diferença visual entre barras.

Boas práticas

  • Eixo com zero: em gráficos de barras/colunas, o eixo numérico deve começar em 0 para não distorcer diferenças.
  • Ordenação: ordenar categorias por frequência facilita a leitura (especialmente com muitas categorias). Para categorias com ordem natural (ex.: pequeno/médio/grande), respeite a ordem.
  • Rótulos claros: nome da variável e unidade (ex.: %). Se usar proporção, explicite se é % do total ou % dentro de cada grupo.
  • Evite excesso de cores: use cor para destacar algo específico; caso contrário, uma paleta simples melhora a leitura.
  • Espaçamento consistente: barras com mesma largura e espaços regulares.

Erros comuns

  • Escala truncada (começar o eixo em 30 em vez de 0) sem aviso: exagera diferenças.
  • 3D: dificulta comparar alturas e pode enganar a percepção.
  • Muitas categorias: vira “pente”. Considere agrupar categorias raras em “Outros” (com critério) ou usar barras horizontais com ordenação.

Passo a passo prático (barras/colunas)

  1. Defina se o eixo será frequência ou proporção (e mantenha isso consistente).
  2. Liste as categorias e seus valores (contagem ou %).
  3. Escolha orientação: horizontal se os rótulos forem longos; vertical se forem curtos.
  4. Comece o eixo numérico em 0 e escolha uma escala com intervalos regulares.
  5. Ordene as barras (se não houver ordem natural).
  6. Inclua título do eixo, unidade e, se necessário, rótulos de valores nas barras (sem poluir).

Gráficos para variáveis quantitativas: distribuição e forma

Para variáveis numéricas, o foco costuma ser entender a distribuição: onde os valores se concentram, quão espalhados estão, se há assimetria e se existem valores extremos. Os gráficos abaixo são complementares: alguns mostram contagens por intervalos (histograma), outros enfatizam a forma (polígono), o acumulado (ogiva) ou resumo robusto (boxplot).

Histograma

Quando usar

  • Visualizar a distribuição de uma variável quantitativa (contínua ou discreta com muitos valores).
  • Identificar assimetria, multimodalidade (mais de um pico), lacunas e concentração.

Como ler

O eixo x é dividido em classes (intervalos). A altura da barra representa a frequência (ou densidade) de observações dentro de cada intervalo. Diferente do gráfico de barras, aqui as barras encostam (intervalos contíguos).

Escolha de classes (boas práticas)

  • Mesma largura de classe (na maioria dos casos) para facilitar comparação.
  • Número de classes: poucas classes escondem detalhes; muitas classes criam ruído. Um ponto de partida comum é entre 5 e 20 classes, dependendo do tamanho da amostra.
  • Regra de Sturges (ponto de partida): k = 1 + log2(n), onde k é o número de classes e n o tamanho da amostra. Útil para amostras pequenas/médias, mas não é obrigatória.
  • Largura da classe: h = (max - min) / k. Ajuste para valores “redondos” (ex.: 5, 10, 20) quando fizer sentido.
  • Alinhamento dos limites: escolha limites que façam sentido para a unidade (ex.: idades em anos, preços em reais). Evite limites “quebrados” que confundem (ex.: 19,73–24,73) se não houver necessidade.
  • Consistência: para comparar dois histogramas, use as mesmas classes e a mesma escala.

Erros comuns

  • Confundir histograma com barras: em histograma, as classes são intervalos numéricos e as barras encostam.
  • Classes desiguais sem ajustar: se usar larguras diferentes, a altura deve representar densidade (área proporcional à frequência). Caso contrário, o gráfico engana.
  • Escala truncada no eixo y sem aviso: pode exagerar diferenças entre classes.
  • Excesso de classes com amostra pequena: cria “serrilhado” e induz interpretações erradas.

Passo a passo prático (histograma)

  1. Calcule min, max e n da variável.
  2. Escolha k (por exemplo, usando k = 1 + log2(n) como ponto de partida).
  3. Calcule a largura h = (max - min) / k e ajuste para um valor conveniente.
  4. Defina os limites das classes (ex.: 0–10, 10–20, 20–30...).
  5. Conte quantas observações caem em cada classe.
  6. Desenhe as barras encostadas, com eixo x indicando intervalos e eixo y indicando frequência (ou %).
  7. Revise: o gráfico está muito “liso” (poucas classes) ou muito “denteado” (muitas classes)? Ajuste k e reavalie.

Polígono de frequência

Quando usar

  • Enfatizar a forma da distribuição com uma linha.
  • Comparar duas ou mais distribuições no mesmo gráfico (linhas sobrepostas), mantendo as mesmas classes.

Como construir

Use as mesmas classes do histograma e marque, para cada classe, o ponto no meio do intervalo (ponto médio) com altura igual à frequência da classe. Em seguida, conecte os pontos com segmentos de reta. Para “fechar” o polígono, pode-se adicionar pontos com frequência zero antes da primeira classe e depois da última.

Continue em nosso aplicativo e ...
  • Ouça o áudio com a tela desligada
  • Ganhe Certificado após a conclusão
  • + de 5000 cursos para você explorar!
ou continue lendo abaixo...
Download App

Baixar o aplicativo

Boas práticas e erros comuns

  • Use classes iguais às do histograma para coerência.
  • Evite comparar linhas com classes diferentes: a comparação fica inválida.
  • Legenda clara ao sobrepor distribuições.

Ogiva (curva de frequência acumulada)

Quando usar

  • Responder perguntas do tipo: “qual porcentagem está abaixo de X?” ou “qual valor delimita os 80% menores?”.
  • Visualizar crescimento acumulado e localizar percentis/mediana de forma aproximada.

Como ler

No eixo x estão os limites das classes (geralmente o limite superior). No eixo y está a frequência acumulada (ou % acumulada). A curva é não decrescente: só sobe ou fica constante.

Passo a passo prático (ogiva)

  1. Use as mesmas classes do histograma.
  2. Calcule a frequência de cada classe.
  3. Some cumulativamente para obter a frequência acumulada (ou % acumulada).
  4. Marque pontos nos limites superiores das classes com a altura acumulada.
  5. Conecte os pontos com segmentos de reta.
  6. Para estimar um percentil (ex.: P90), encontre 90% no eixo y, trace até a curva e desça ao eixo x.

Erros comuns

  • Misturar frequência acumulada com frequência simples no mesmo eixo sem deixar explícito.
  • Não indicar se é contagem ou %: a interpretação muda.

Boxplot (diagrama de caixa)

Quando usar

  • Resumir distribuição com foco em mediana, dispersão e outliers.
  • Comparar distribuições entre grupos (vários boxplots lado a lado).

Como ler

  • A linha dentro da caixa é a mediana.
  • As bordas da caixa são Q1 e Q3 (intervalo interquartil, IQR = Q3 − Q1).
  • Os “bigodes” costumam ir até o último ponto dentro de Q1 − 1,5*IQR e Q3 + 1,5*IQR (convenção comum).
  • Pontos além dos bigodes são marcados como potenciais outliers (não significa erro; significa valor incomum).

Boas práticas

  • Mesma escala no eixo y ao comparar grupos.
  • Indique a regra de outlier se não for a padrão (1,5*IQR).
  • Combine com gráfico de pontos quando a amostra for pequena, para não esconder a estrutura dos dados.

Erros comuns

  • Interpretar bigodes como mínimo e máximo sempre: depende da convenção usada.
  • Usar boxplot sozinho com n muito pequeno: pode sugerir uma “forma” que não está sustentada pelos dados.

Gráfico de pontos (dot plot / strip plot)

Quando usar

  • Amostras pequenas ou médias, quando você quer ver cada observação.
  • Comparar grupos com transparência (pontos com leve jitter) para evitar sobreposição.

Como ler

Cada ponto é um valor. A concentração de pontos indica onde os dados se acumulam. É excelente para perceber agrupamentos, lacunas e valores extremos sem “agrupar em classes”.

Boas práticas

  • Jitter (pequeno deslocamento) quando muitos pontos têm o mesmo valor.
  • Transparência para enxergar sobreposição.
  • Ordenar grupos por mediana ou média quando houver comparação.

Erros comuns

  • Poluição visual com n muito grande: nesse caso, prefira histograma/densidade/boxplot.

Boas práticas gerais de construção (para qualquer gráfico)

Eixos, escalas e rótulos

  • Nomeie os eixos com a variável e a unidade (ex.: “Renda mensal (R$)”).
  • Escalas regulares: intervalos constantes no eixo numérico ajudam a leitura.
  • Começo do eixo: barras/colunas devem começar em zero; histogramas geralmente também, mas o mais importante é não distorcer a percepção (se truncar, sinalize claramente).
  • Legibilidade: evite rótulos inclinados demais; prefira barras horizontais quando necessário.
  • Contexto mínimo: informe se o eixo y é contagem, % ou densidade.

Erros comuns que prejudicam a interpretação

  • 3D e efeitos visuais: criam distorção e dificultam comparação.
  • Escala truncada sem aviso: pode sugerir diferenças muito maiores do que são.
  • Comparar gráficos com escalas diferentes (especialmente em painéis): induz conclusões erradas.
  • Cores sem significado: usar muitas cores apenas “para enfeitar” aumenta carga cognitiva.
  • Classes diferentes em histogramas comparados: invalida a comparação visual.

Roteiro para escolher o gráfico correto (com base no objetivo)

1) Qual é o tipo de variável?

  • Qualitativa (categorias) → use barras/colunas.
  • Quantitativa (números) → siga para o objetivo analítico.

2) Qual é o objetivo analítico principal?

  • Ver a forma da distribuição (picos, assimetria, lacunas) → histograma (e opcionalmente polígono de frequência).
  • Comparar formas de duas distribuiçõespolígono de frequência (mesmas classes) ou histogramas lado a lado com mesma escala.
  • Responder “quanto está abaixo/acima de X” e localizar percentis → ogiva.
  • Resumir e comparar grupos rapidamente (mediana, dispersão, outliers) → boxplot.
  • Ver cada observação (n pequeno/médio) e detectar padrões finos → gráfico de pontos.

3) Há comparação entre grupos?

  • Se sim, garanta mesma escala e mesma regra (classes no histograma; definição de outlier no boxplot).
  • Para categorias em grupos: barras agrupadas (comparação) ou empilhadas (composição), preferindo proporções quando os tamanhos dos grupos diferem.

4) O gráfico pode induzir erro?

  • Verifique se barras começam em zero.
  • Evite 3D e efeitos.
  • Se precisar truncar escala, sinalize explicitamente e avalie se há alternativa melhor.

Exemplos rápidos de aplicação (sem depender de tabelas anteriores)

Exemplo 1: Categoria de produto (qualitativa)

Objetivo: comparar quais categorias vendem mais. Gráfico recomendado: barras ordenadas da maior para a menor frequência. Eixo y começando em zero e rótulos curtos ou barras horizontais se os nomes forem longos.

Exemplo 2: Tempo de entrega (quantitativa)

Objetivo: entender a distribuição e se há atrasos extremos. Comece com histograma (escolhendo classes coerentes com a unidade, por exemplo intervalos de 1 dia ou 2 dias). Em seguida, use boxplot para destacar mediana e potenciais outliers. Se a pergunta for “qual % entrega em até 3 dias?”, use ogiva para ler o acumulado.

Exemplo 3: Notas de uma turma pequena (quantitativa, n baixo)

Objetivo: ver cada nota e possíveis agrupamentos. Use gráfico de pontos. Se quiser um resumo rápido para comparar com outra turma, adicione um boxplot ao lado mantendo a mesma escala.

Agora responda o exercício sobre o conteúdo:

Você quer responder à pergunta “qual porcentagem dos valores está abaixo de X?” e localizar aproximadamente percentis em uma variável quantitativa. Qual gráfico é mais indicado?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

A ogiva representa a frequência (ou %) acumulada ao longo dos limites das classes, permitindo ler “quanto está abaixo de X” e estimar percentis ao localizar um valor no eixo y e projetar para o eixo x.

Próximo capitúlo

Estatística Descritiva do Zero: medidas de tendência central (média, mediana e moda)

Arrow Right Icon
Capa do Ebook gratuito Estatística Descritiva do Zero: Como Entender e Resumir Dados
46%

Estatística Descritiva do Zero: Como Entender e Resumir Dados

Novo curso

13 páginas

Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.