Dados, variáveis e observações: o que você está medindo
Em Estatística, dado é o valor observado (registrado) para uma característica de interesse. Essa característica é a variável. Cada registro associado a um elemento pesquisado (pessoa, domicílio, empresa, município) é uma observação.
Exemplo prático: em uma pesquisa com 8 domicílios, a variável “número de moradores” pode gerar os dados: 2, 4, 3, 3, 1, 5, 2, 4. Cada número é um dado; cada domicílio é uma observação.
Variável x categoria x unidade
- Variável: “renda mensal do domicílio (R$)”.
- Unidade de medida: reais (R$).
- Categorias (quando qualitativa): “situação do domicílio: urbano/rural”.
Tipos de dados e variáveis
Qualitativos (categóricos)
Representam qualidades ou categorias. Não faz sentido fazer operações aritméticas como soma e média (em geral).
- Nominal: categorias sem ordem natural (ex.: UF, sexo, cor/raça, tipo de domicílio).
- Ordinal: categorias com ordem (ex.: escolaridade: fundamental < médio < superior; nível de satisfação: baixo < médio < alto).
Quantitativos (numéricos)
Representam quantidades mensuráveis. Permitem operações aritméticas.
- Discretos: resultam de contagem; assumem valores inteiros (ex.: número de moradores, número de filhos, quantidade de cômodos).
- Contínuos: resultam de medida; podem assumir qualquer valor em um intervalo (ex.: altura, peso, tempo de deslocamento, renda quando tratada como medida contínua).
Como identificar pelo enunciado (dica de prova)
- Se o enunciado fala em contar (quantos?), tende a ser discreta.
- Se fala em medir (quanto mede? quanto tempo? qual valor?), tende a ser contínua.
- Se são rótulos (categoria/UF/cor), é qualitativa nominal.
- Se há ordem entre categorias (nível, grau, faixa de satisfação), é qualitativa ordinal.
Escalas de mensuração (nominal, ordinal, intervalar e razão)
A escala de mensuração indica quais comparações e operações fazem sentido para a variável.
Continue em nosso aplicativo
Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.
ou continue lendo abaixo...Baixar o aplicativo
Nominal
Somente classificação em categorias. Comparações do tipo “igual/diferente”.
- Exemplos: UF, estado civil, tipo de ocupação.
- Representações comuns: tabela de frequências, gráfico de barras, gráfico de setores (pizza).
Ordinal
Há ordem, mas as distâncias entre categorias não são necessariamente iguais.
- Exemplos: escolaridade, nível de satisfação.
- Representações comuns: tabela de frequências, barras (preferencialmente ordenadas), gráfico de colunas.
Intervalar
Diferenças são significativas, mas o zero não representa ausência real da característica (zero “convencional”).
- Exemplo clássico: temperatura em °C (0°C não significa ausência de temperatura).
- Operações: soma e diferença fazem sentido; razões (dobro/metade) não são interpretáveis de forma direta.
Razão
Possui zero absoluto (ausência). Permite comparações por razão (dobro, metade).
- Exemplos: renda, idade, número de moradores, distância, tempo.
- Operações: todas as operações usuais e razões são interpretáveis.
Organização de dados: do conjunto bruto à tabela
Organizar dados significa resumir o conjunto bruto para facilitar leitura, comparação e análise. O caminho mais comum é: dados brutos → tabela de frequências → representação gráfica.
Etapas práticas de organização
- 1) Identificar a variável e o tipo: qualitativa/quantitativa; discreta/contínua; escala.
- 2) Definir a forma de resumo: tabela simples (valores individuais) ou agrupada (classes/intervalos).
- 3) Calcular frequências: absoluta, relativa e acumulada (quando aplicável).
- 4) Escolher representação adequada: barras, setores, histograma, polígono de frequências, ogiva etc.
Tabela de frequência simples (não agrupada)
Usada quando os valores distintos são poucos (qualitativa ou quantitativa discreta com poucos valores).
Componentes mais comuns
- Frequência absoluta (fi): número de ocorrências do valor/categoria.
- Frequência relativa (fr): fi dividido pelo total (n). Pode ser em proporção ou porcentagem.
- Frequência acumulada (Fi): soma das frequências até aquele valor (faz sentido para ordinais e quantitativas).
- Frequência relativa acumulada (Fr): Fi/n.
Passo a passo (exemplo com variável discreta)
Dados (número de moradores em 12 domicílios): 1, 2, 2, 3, 4, 2, 1, 3, 2, 5, 4, 3.
- 1) Listar valores distintos em ordem: 1, 2, 3, 4, 5.
- 2) Contar ocorrências (fi): 1→2; 2→4; 3→3; 4→2; 5→1.
- 3) Calcular fr = fi/n: dividir por 12.
- 4) Calcular acumuladas (Fi e Fr): somar progressivamente.
Variável: número de moradores (discreta) n = 12
x fi fr Fi Fr
1 2 2/12=0,167 2 0,167
2 4 4/12=0,333 6 0,500
3 3 3/12=0,250 9 0,750
4 2 2/12=0,167 11 0,917
5 1 1/12=0,083 12 1,000Leitura típica: “50% dos domicílios têm até 2 moradores” (Fr na linha x=2).
Passo a passo (exemplo com variável qualitativa)
Dados (meio de transporte para o trabalho em 10 pessoas): Ônibus, Carro, Ônibus, Metrô, A pé, Ônibus, Carro, Ônibus, A pé, Metrô.
- 1) Listar categorias: A pé, Carro, Metrô, Ônibus (ordem alfabética ou lógica).
- 2) Contar fi e calcular fr.
Categoria fi fr
A pé 2 0,20
Carro 2 0,20
Metrô 2 0,20
Ônibus 4 0,40
Total 10 1,00Observação: frequência acumulada não é obrigatória para nominal (não há ordem natural).
Tabela de frequência agrupada (classes) para dados quantitativos
Usada quando há muitos valores distintos, principalmente em variáveis contínuas (ou discretas com grande amplitude). Em vez de listar cada valor, agrupamos em classes (intervalos).
Conceitos: classes, limites e amplitude
- Classe: intervalo que reúne valores (ex.: 1500 a 2000).
- Limite inferior (Li) e superior (Ls): extremos da classe.
- Amplitude de classe (h): largura do intervalo (Ls − Li).
- Amplitude total (A): maior valor − menor valor.
- Ponto médio (xi): (Li + Ls)/2 (útil em alguns cálculos e gráficos).
Como escolher o número de classes (k)
Em provas, pode ser dado no enunciado. Quando não for, uma regra prática comum é a regra de Sturges: k ≈ 1 + 3,3·log10(n). Outra abordagem simples é escolher k entre 5 e 10 para amostras moderadas, buscando classes com interpretação clara.
Passo a passo completo (exemplo com renda)
Dados (renda mensal em R$ de 20 domicílios): 1200, 1350, 1400, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 2000, 2100, 2200, 2300, 2400, 2600, 2800, 3000.
- 1) Identificar mínimo e máximo: min=1200, max=3000 → A=1800.
- 2) Definir k: por simplicidade, k=6 classes.
- 3) Calcular amplitude de classe: h ≈ A/k = 1800/6 = 300.
- 4) Montar classes: [1200,1500), [1500,1800), [1800,2100), [2100,2400), [2400,2700), [2700,3000].
- 5) Contar fi em cada classe.
- 6) Calcular fr e acumuladas.
Renda (R$) fi fr Fi Fr
[1200, 1500) 3 0,15 3 0,15
[1500, 1800) 7 0,35 10 0,50
[1800, 2100) 3 0,15 13 0,65
[2100, 2400) 3 0,15 16 0,80
[2400, 2700) 2 0,10 18 0,90
[2700, 3000] 2 0,10 20 1,00Interpretação típica: “50% dos domicílios têm renda menor que R$ 1800” (Fr até a classe [1500,1800)).
Cuidados comuns em classes
- Intervalos semiabertos: usar [Li, Ls) evita dupla contagem nas fronteiras; a última classe pode ser fechada à direita.
- Classes com mesma amplitude: facilita comparação e construção de histograma.
- Classes sem lacunas e sem sobreposição: todo valor deve cair em exatamente uma classe.
Representações gráficas adequadas
Para variáveis qualitativas (nominal/ordinal)
- Gráfico de barras/colunas: melhor escolha na maioria dos casos; permite comparar categorias.
- Gráfico de setores (pizza): útil para composição (partes do todo) com poucas categorias.
- Para ordinal: manter a ordem natural das categorias no eixo.
Para variáveis quantitativas discretas
- Barras/colunas: quando há poucos valores distintos.
- Polígono de frequências: pode ser usado para visualizar tendência quando valores são sequenciais.
Para variáveis quantitativas contínuas (ou agrupadas em classes)
- Histograma: principal gráfico para distribuição por classes; as barras representam intervalos contíguos.
- Polígono de frequências: liga os pontos médios das classes com suas frequências.
- Ogiva (curva acumulada): representa frequências acumuladas; útil para percentis/mediana por leitura gráfica.
Diferença importante: no histograma as barras são coladas (intervalos contínuos). Em gráfico de barras para categorias, as barras podem ser separadas.
Exercícios (construção de tabelas e interpretação de enunciados)
Exercício 1 — Tabela simples (qualitativa nominal)
Em uma equipe com 18 pessoas, o tipo de vínculo foi registrado: Efetivo, Temporário, Efetivo, Estágio, Efetivo, Temporário, Efetivo, Efetivo, Estágio, Temporário, Efetivo, Temporário, Efetivo, Efetivo, Temporário, Estágio, Efetivo, Temporário.
Tarefas:
- a) Identifique o tipo de variável e a escala de mensuração.
- b) Construa uma tabela de frequências (fi e fr).
- c) Indique qual gráfico é mais adequado e por quê.
Exercício 2 — Tabela simples (quantitativa discreta)
Número de filhos em 15 pessoas: 0, 1, 2, 2, 1, 0, 3, 2, 1, 1, 0, 4, 2, 3, 1.
Tarefas:
- a) Classifique a variável (qualitativa/quantitativa; discreta/contínua).
- b) Monte a tabela com x, fi, fr, Fi e Fr.
- c) Responda: qual a proporção de pessoas com até 2 filhos?
Exercício 3 — Agrupamento em classes (quantitativa contínua)
Tempos de deslocamento ao trabalho (min) de 25 pessoas: 12, 15, 18, 20, 22, 25, 27, 28, 30, 32, 35, 36, 38, 40, 42, 45, 47, 50, 52, 55, 58, 60, 65, 70, 75.
Tarefas:
- a) Calcule a amplitude total A.
- b) Escolha k=7 classes e calcule h≈A/k.
- c) Defina as classes (intervalos) e construa a tabela com fi e fr.
- d) Indique o gráfico mais adequado para representar a distribuição.
Exercício 4 — Interpretação de enunciados (armadilhas comuns)
Para cada item, identifique o tipo de variável e a melhor forma de organização (tabela simples ou agrupada):
- a) “Idade em anos completos” registrada para 200 pessoas.
- b) “UF de nascimento” em um cadastro com 5.000 registros.
- c) “Renda mensal (R$)” de 60 domicílios, com valores entre 900 e 12.000.
- d) “Grau de instrução” (fundamental, médio, superior, pós) em 120 pessoas.
Checklist de escolha correta de tabela e gráfico por tipo de variável
Qualitativa nominal
- Tabela: frequências por categoria (fi, fr).
- Gráfico: barras/colunas; setores se poucas categorias e foco em composição.
- Evitar: histograma (não há continuidade numérica).
Qualitativa ordinal
- Tabela: frequências por categoria em ordem + acumuladas (opcional e útil).
- Gráfico: barras/colunas ordenadas.
- Evitar: pizza quando há muitas categorias e a ordem é importante.
Quantitativa discreta
- Tabela: simples se poucos valores; agrupada se muitos valores distintos ou grande amplitude.
- Gráfico: barras/colunas; polígono de frequências quando valores sequenciais.
- Observação: barras podem ser separadas (valores pontuais).
Quantitativa contínua
- Tabela: geralmente agrupada em classes.
- Gráfico: histograma (principal); polígono de frequências; ogiva para acumuladas.
- Observação: classes contíguas e sem sobreposição.