Por que usar gráficos na estatística descritiva
Gráficos transformam tabelas e listas de valores em padrões visuais: comparação entre categorias, forma da distribuição, concentração, dispersão, assimetria e presença de valores extremos. A escolha do gráfico depende do tipo de variável (qualitativa ou quantitativa) e do objetivo analítico (comparar, entender distribuição, acompanhar acumulado, detectar outliers).
Gráficos para variáveis qualitativas: barras e colunas
Quando usar
- Comparar frequências (absolutas) ou proporções (relativas) entre categorias.
- Destacar categorias mais comuns e menos comuns.
- Comparar grupos (barras agrupadas) ou composição (barras empilhadas), com cuidado para não dificultar a leitura.
Como ler
A altura (ou comprimento) da barra representa a frequência ou a proporção. A comparação é feita pela diferença visual entre barras.
Boas práticas
- Eixo com zero: em gráficos de barras/colunas, o eixo numérico deve começar em 0 para não distorcer diferenças.
- Ordenação: ordenar categorias por frequência facilita a leitura (especialmente com muitas categorias). Para categorias com ordem natural (ex.: pequeno/médio/grande), respeite a ordem.
- Rótulos claros: nome da variável e unidade (ex.: %). Se usar proporção, explicite se é % do total ou % dentro de cada grupo.
- Evite excesso de cores: use cor para destacar algo específico; caso contrário, uma paleta simples melhora a leitura.
- Espaçamento consistente: barras com mesma largura e espaços regulares.
Erros comuns
- Escala truncada (começar o eixo em 30 em vez de 0) sem aviso: exagera diferenças.
- 3D: dificulta comparar alturas e pode enganar a percepção.
- Muitas categorias: vira “pente”. Considere agrupar categorias raras em “Outros” (com critério) ou usar barras horizontais com ordenação.
Passo a passo prático (barras/colunas)
- Defina se o eixo será frequência ou proporção (e mantenha isso consistente).
- Liste as categorias e seus valores (contagem ou %).
- Escolha orientação: horizontal se os rótulos forem longos; vertical se forem curtos.
- Comece o eixo numérico em 0 e escolha uma escala com intervalos regulares.
- Ordene as barras (se não houver ordem natural).
- Inclua título do eixo, unidade e, se necessário, rótulos de valores nas barras (sem poluir).
Gráficos para variáveis quantitativas: distribuição e forma
Para variáveis numéricas, o foco costuma ser entender a distribuição: onde os valores se concentram, quão espalhados estão, se há assimetria e se existem valores extremos. Os gráficos abaixo são complementares: alguns mostram contagens por intervalos (histograma), outros enfatizam a forma (polígono), o acumulado (ogiva) ou resumo robusto (boxplot).
Histograma
Quando usar
- Visualizar a distribuição de uma variável quantitativa (contínua ou discreta com muitos valores).
- Identificar assimetria, multimodalidade (mais de um pico), lacunas e concentração.
Como ler
O eixo x é dividido em classes (intervalos). A altura da barra representa a frequência (ou densidade) de observações dentro de cada intervalo. Diferente do gráfico de barras, aqui as barras encostam (intervalos contíguos).
Escolha de classes (boas práticas)
- Mesma largura de classe (na maioria dos casos) para facilitar comparação.
- Número de classes: poucas classes escondem detalhes; muitas classes criam ruído. Um ponto de partida comum é entre 5 e 20 classes, dependendo do tamanho da amostra.
- Regra de Sturges (ponto de partida):
k = 1 + log2(n), ondeké o número de classes eno tamanho da amostra. Útil para amostras pequenas/médias, mas não é obrigatória. - Largura da classe:
h = (max - min) / k. Ajuste para valores “redondos” (ex.: 5, 10, 20) quando fizer sentido. - Alinhamento dos limites: escolha limites que façam sentido para a unidade (ex.: idades em anos, preços em reais). Evite limites “quebrados” que confundem (ex.: 19,73–24,73) se não houver necessidade.
- Consistência: para comparar dois histogramas, use as mesmas classes e a mesma escala.
Erros comuns
- Confundir histograma com barras: em histograma, as classes são intervalos numéricos e as barras encostam.
- Classes desiguais sem ajustar: se usar larguras diferentes, a altura deve representar densidade (área proporcional à frequência). Caso contrário, o gráfico engana.
- Escala truncada no eixo y sem aviso: pode exagerar diferenças entre classes.
- Excesso de classes com amostra pequena: cria “serrilhado” e induz interpretações erradas.
Passo a passo prático (histograma)
- Calcule
min,maxenda variável. - Escolha
k(por exemplo, usandok = 1 + log2(n)como ponto de partida). - Calcule a largura
h = (max - min) / ke ajuste para um valor conveniente. - Defina os limites das classes (ex.: 0–10, 10–20, 20–30...).
- Conte quantas observações caem em cada classe.
- Desenhe as barras encostadas, com eixo x indicando intervalos e eixo y indicando frequência (ou %).
- Revise: o gráfico está muito “liso” (poucas classes) ou muito “denteado” (muitas classes)? Ajuste
ke reavalie.
Polígono de frequência
Quando usar
- Enfatizar a forma da distribuição com uma linha.
- Comparar duas ou mais distribuições no mesmo gráfico (linhas sobrepostas), mantendo as mesmas classes.
Como construir
Use as mesmas classes do histograma e marque, para cada classe, o ponto no meio do intervalo (ponto médio) com altura igual à frequência da classe. Em seguida, conecte os pontos com segmentos de reta. Para “fechar” o polígono, pode-se adicionar pontos com frequência zero antes da primeira classe e depois da última.
- Ouça o áudio com a tela desligada
- Ganhe Certificado após a conclusão
- + de 5000 cursos para você explorar!
Baixar o aplicativo
Boas práticas e erros comuns
- Use classes iguais às do histograma para coerência.
- Evite comparar linhas com classes diferentes: a comparação fica inválida.
- Legenda clara ao sobrepor distribuições.
Ogiva (curva de frequência acumulada)
Quando usar
- Responder perguntas do tipo: “qual porcentagem está abaixo de X?” ou “qual valor delimita os 80% menores?”.
- Visualizar crescimento acumulado e localizar percentis/mediana de forma aproximada.
Como ler
No eixo x estão os limites das classes (geralmente o limite superior). No eixo y está a frequência acumulada (ou % acumulada). A curva é não decrescente: só sobe ou fica constante.
Passo a passo prático (ogiva)
- Use as mesmas classes do histograma.
- Calcule a frequência de cada classe.
- Some cumulativamente para obter a frequência acumulada (ou % acumulada).
- Marque pontos nos limites superiores das classes com a altura acumulada.
- Conecte os pontos com segmentos de reta.
- Para estimar um percentil (ex.: P90), encontre 90% no eixo y, trace até a curva e desça ao eixo x.
Erros comuns
- Misturar frequência acumulada com frequência simples no mesmo eixo sem deixar explícito.
- Não indicar se é contagem ou %: a interpretação muda.
Boxplot (diagrama de caixa)
Quando usar
- Resumir distribuição com foco em mediana, dispersão e outliers.
- Comparar distribuições entre grupos (vários boxplots lado a lado).
Como ler
- A linha dentro da caixa é a mediana.
- As bordas da caixa são Q1 e Q3 (intervalo interquartil, IQR = Q3 − Q1).
- Os “bigodes” costumam ir até o último ponto dentro de
Q1 − 1,5*IQReQ3 + 1,5*IQR(convenção comum). - Pontos além dos bigodes são marcados como potenciais outliers (não significa erro; significa valor incomum).
Boas práticas
- Mesma escala no eixo y ao comparar grupos.
- Indique a regra de outlier se não for a padrão (1,5*IQR).
- Combine com gráfico de pontos quando a amostra for pequena, para não esconder a estrutura dos dados.
Erros comuns
- Interpretar bigodes como mínimo e máximo sempre: depende da convenção usada.
- Usar boxplot sozinho com n muito pequeno: pode sugerir uma “forma” que não está sustentada pelos dados.
Gráfico de pontos (dot plot / strip plot)
Quando usar
- Amostras pequenas ou médias, quando você quer ver cada observação.
- Comparar grupos com transparência (pontos com leve jitter) para evitar sobreposição.
Como ler
Cada ponto é um valor. A concentração de pontos indica onde os dados se acumulam. É excelente para perceber agrupamentos, lacunas e valores extremos sem “agrupar em classes”.
Boas práticas
- Jitter (pequeno deslocamento) quando muitos pontos têm o mesmo valor.
- Transparência para enxergar sobreposição.
- Ordenar grupos por mediana ou média quando houver comparação.
Erros comuns
- Poluição visual com n muito grande: nesse caso, prefira histograma/densidade/boxplot.
Boas práticas gerais de construção (para qualquer gráfico)
Eixos, escalas e rótulos
- Nomeie os eixos com a variável e a unidade (ex.: “Renda mensal (R$)”).
- Escalas regulares: intervalos constantes no eixo numérico ajudam a leitura.
- Começo do eixo: barras/colunas devem começar em zero; histogramas geralmente também, mas o mais importante é não distorcer a percepção (se truncar, sinalize claramente).
- Legibilidade: evite rótulos inclinados demais; prefira barras horizontais quando necessário.
- Contexto mínimo: informe se o eixo y é contagem, % ou densidade.
Erros comuns que prejudicam a interpretação
- 3D e efeitos visuais: criam distorção e dificultam comparação.
- Escala truncada sem aviso: pode sugerir diferenças muito maiores do que são.
- Comparar gráficos com escalas diferentes (especialmente em painéis): induz conclusões erradas.
- Cores sem significado: usar muitas cores apenas “para enfeitar” aumenta carga cognitiva.
- Classes diferentes em histogramas comparados: invalida a comparação visual.
Roteiro para escolher o gráfico correto (com base no objetivo)
1) Qual é o tipo de variável?
- Qualitativa (categorias) → use barras/colunas.
- Quantitativa (números) → siga para o objetivo analítico.
2) Qual é o objetivo analítico principal?
- Ver a forma da distribuição (picos, assimetria, lacunas) → histograma (e opcionalmente polígono de frequência).
- Comparar formas de duas distribuições → polígono de frequência (mesmas classes) ou histogramas lado a lado com mesma escala.
- Responder “quanto está abaixo/acima de X” e localizar percentis → ogiva.
- Resumir e comparar grupos rapidamente (mediana, dispersão, outliers) → boxplot.
- Ver cada observação (n pequeno/médio) e detectar padrões finos → gráfico de pontos.
3) Há comparação entre grupos?
- Se sim, garanta mesma escala e mesma regra (classes no histograma; definição de outlier no boxplot).
- Para categorias em grupos: barras agrupadas (comparação) ou empilhadas (composição), preferindo proporções quando os tamanhos dos grupos diferem.
4) O gráfico pode induzir erro?
- Verifique se barras começam em zero.
- Evite 3D e efeitos.
- Se precisar truncar escala, sinalize explicitamente e avalie se há alternativa melhor.
Exemplos rápidos de aplicação (sem depender de tabelas anteriores)
Exemplo 1: Categoria de produto (qualitativa)
Objetivo: comparar quais categorias vendem mais. Gráfico recomendado: barras ordenadas da maior para a menor frequência. Eixo y começando em zero e rótulos curtos ou barras horizontais se os nomes forem longos.
Exemplo 2: Tempo de entrega (quantitativa)
Objetivo: entender a distribuição e se há atrasos extremos. Comece com histograma (escolhendo classes coerentes com a unidade, por exemplo intervalos de 1 dia ou 2 dias). Em seguida, use boxplot para destacar mediana e potenciais outliers. Se a pergunta for “qual % entrega em até 3 dias?”, use ogiva para ler o acumulado.
Exemplo 3: Notas de uma turma pequena (quantitativa, n baixo)
Objetivo: ver cada nota e possíveis agrupamentos. Use gráfico de pontos. Se quiser um resumo rápido para comparar com outra turma, adicione um boxplot ao lado mantendo a mesma escala.