Estatística Descritiva do Zero: posição e separatrizes (quartis, decis e percentis)

Capítulo 9

Tempo estimado de leitura: 6 minutos

+ Exercício

O que são separatrizes (medidas de posição)

Separatrizes são medidas de posição que dividem um conjunto de dados (ou uma distribuição) em partes com a mesma proporção de observações. Elas respondem perguntas do tipo: “qual valor separa os 25% menores dos demais?” ou “a partir de que valor estão os 10% maiores?”.

As separatrizes mais usadas são:

  • Quartis: dividem em 4 partes iguais (25% cada). Q1, Q2, Q3.
  • Decis: dividem em 10 partes iguais (10% cada). D1, D2, ..., D9.
  • Percentis: dividem em 100 partes iguais (1% cada). P1, P2, ..., P99.

Observação importante: existem variações metodológicas para localizar quartis/percentis (principalmente em dados não agrupados). Em relatórios, é boa prática declarar o método (por exemplo, “percentis pelo método da interpolação linear” ou “percentis pela posição (n+1)p”).

Como interpretar frases do tipo “percentil 90”

Percentil 90 (P90) é um valor tal que aproximadamente 90% dos dados ficam abaixo ou iguais a ele, e 10% ficam acima dele.

  • Se uma pessoa está no P90 de uma prova, significa que ela teve nota maior ou igual à de cerca de 90% dos participantes (está entre os 10% melhores).
  • Se o tempo de entrega de um serviço tem P90 = 5 dias, significa que cerca de 90% das entregas ocorrem em até 5 dias, e 10% demoram mais do que isso.

O mesmo raciocínio vale para quartis e decis: Q1 é o percentil 25 (P25), Q2 é o percentil 50 (P50, a mediana), Q3 é o percentil 75 (P75).

Continue em nosso aplicativo e ...
  • Ouça o áudio com a tela desligada
  • Ganhe Certificado após a conclusão
  • + de 5000 cursos para você explorar!
ou continue lendo abaixo...
Download App

Baixar o aplicativo

Separatrizes em dados não agrupados (lista de valores)

Passo 1: ordenar os dados

Coloque os valores em ordem crescente. As separatrizes dependem da posição na lista ordenada.

Passo 2: escolher um método de localização

Há vários métodos. Dois muito comuns em materiais introdutórios são:

  • Método A (posição com n+1): posição teórica L = (n + 1) · p, onde p é a proporção (ex.: p=0,90 para P90). Se L não for inteiro, faz-se interpolação entre os valores vizinhos.
  • Método B (posição com n): posição teórica L = n · p (ou variações com arredondamentos). Também pode usar interpolação.

O ponto-chave: o valor pode mudar um pouco dependendo do método, especialmente em amostras pequenas. O importante é ser consistente e declarar o método.

Método A na prática (com interpolação linear)

Considere os dados (já ordenados):

2, 3, 5, 6, 9, 10, 12, 13, 15, 18  (n = 10)

Exemplo 1: calcular P90

  • p = 0,90
  • Posição: L = (n+1)·p = 11·0,90 = 9,9
  • Isso significa: P90 está entre o 9º e o 10º valores.
  • 9º valor = 15; 10º valor = 18
  • Parte decimal = 0,9. Interpolação linear: P90 = 15 + 0,9·(18−15) = 15 + 2,7 = 17,7

Interpretação: cerca de 90% dos valores estão em até 17,7; cerca de 10% acima de 17,7.

Exemplo 2: calcular Q1 (P25)

  • p = 0,25
  • L = 11·0,25 = 2,75
  • Entre o 2º e o 3º valores: 2º=3, 3º=5
  • Q1 = 3 + 0,75·(5−3) = 3 + 1,5 = 4,5

Exemplo 3: calcular a mediana Q2 (P50)

  • p = 0,50
  • L = 11·0,50 = 5,5
  • Entre o 5º e o 6º valores: 5º=9, 6º=10
  • Q2 = 9 + 0,5·(10−9) = 9,5

Observações práticas (dados não agrupados)

  • Quando L é inteiro (ex.: L=7), a separatriz pode ser o 7º valor diretamente (dependendo do método adotado).
  • Quando L não é inteiro, a interpolação linear é uma forma comum de obter um valor “entre” observações.
  • Em planilhas e softwares, diferentes funções podem usar definições diferentes de percentil. Em relatórios, prefira registrar algo como: Percentis calculados por interpolação linear na posição (n+1)p.

Separatrizes em dados agrupados (tabela de frequências por classes)

Quando os dados estão agrupados em classes (intervalos), não sabemos os valores individuais, apenas quantos caem em cada intervalo. Nesse caso, as separatrizes são estimadas assumindo distribuição aproximadamente uniforme dentro de cada classe.

Ideia central: localizar a classe do percentil

Para encontrar, por exemplo, o P90, você procura a classe onde a frequência acumulada ultrapassa 90% do total.

Fórmula prática (interpolação dentro da classe)

Para uma separatriz de proporção p (ex.: 0,90), use:

Sp = L_inf + ((p·N − F_ant) / f_classe) · h

  • Sp: separatriz desejada (Pp, Qk, Dk etc.)
  • L_inf: limite inferior da classe onde a separatriz cai
  • N: total de observações
  • F_ant: frequência acumulada até a classe anterior
  • f_classe: frequência da classe onde a separatriz cai
  • h: amplitude (largura) da classe

Exemplo completo (dados agrupados)

Suponha uma distribuição de salários (em milhares) agrupada:

ClassefF (acum.)
[1, 3)55
[3, 5)914
[5, 7)1226
[7, 9)834
[9, 11)640

Aqui, N = 40 e a amplitude de classe é h = 2.

Exemplo 1: encontrar P75 (que é o Q3)

  • p·N = 0,75·40 = 30
  • Procure na coluna acumulada F onde aparece o 30: até a classe [5,7) temos 26; até [7,9) temos 34. Então o P75 está na classe [7, 9).
  • Parâmetros: L_inf=7; F_ant=26; f_classe=8; h=2
  • P75 = 7 + ((30 − 26)/8)·2 = 7 + (4/8)·2 = 7 + 1 = 8

Interpretação: cerca de 75% dos salários estão em até 8 (mil), e 25% acima disso.

Exemplo 2: encontrar P90

  • p·N = 0,90·40 = 36
  • Até [7,9) temos 34; até [9,11) temos 40. Então P90 está na classe [9, 11).
  • Parâmetros: L_inf=9; F_ant=34; f_classe=6; h=2
  • P90 = 9 + ((36 − 34)/6)·2 = 9 + (2/6)·2 = 9 + 0,666... = 9,67 (aprox.)

Interpretação: aproximadamente 90% dos salários estão em até 9,67 (mil); 10% acima disso.

Observações importantes (dados agrupados)

  • O resultado é uma estimativa, pois não temos os valores individuais.
  • Se as classes tiverem amplitudes diferentes, use o h específico da classe encontrada.
  • Assim como em dados não agrupados, podem existir variações de convenção (por exemplo, usar p·(N+1) em vez de p·N). Declare o procedimento.

Quartis, decis e percentis: um “mapa” de equivalências

MedidaEquivalência em percentilInterpretação
Q1P2525% dos dados ≤ Q1
Q2P5050% dos dados ≤ Q2 (mediana)
Q3P7575% dos dados ≤ Q3
D1P1010% dos dados ≤ D1
D9P9090% dos dados ≤ D9

Conexão com boxplot: distribuição, concentração e assimetria

O boxplot é um gráfico diretamente construído a partir de separatrizes, especialmente dos quartis:

  • A caixa vai de Q1 até Q3.
  • A linha dentro da caixa marca a mediana (Q2).
  • A distância Q3 − Q1 é a amplitude interquartil (AIQ ou IQR), que mede a dispersão dos 50% centrais.

Como isso ajuda a entender a distribuição e a concentração:

  • Se a caixa é curta, os 50% centrais estão concentrados (pouca variação no miolo).
  • Se a mediana está mais perto de Q1 do que de Q3 (ou vice-versa), sugere assimetria (mais “espaço” em um lado).
  • Comparar boxplots de grupos (por exemplo, turmas, regiões, produtos) permite comparar nível (mediana), concentração (AIQ) e caudas (extensão para valores altos/baixos).

Leitura rápida de um boxplot usando percentis

  • Q1 (P25): “limite” dos 25% menores.
  • Mediana (P50): ponto central.
  • Q3 (P75): “limite” dos 25% maiores dentro da caixa.
  • P90 (ou D9) não aparece automaticamente em todo boxplot, mas é uma separatriz útil para entender a cauda superior (os 10% maiores), especialmente em métricas como tempo de atendimento, latência e renda.

Agora responda o exercício sobre o conteúdo:

Ao interpretar o percentil 90 (P90) de uma variável, qual afirmação descreve corretamente seu significado?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

O P90 é uma separatriz: cerca de 90% dos dados ficam ≤ a esse valor e aproximadamente 10% ficam acima. Ele marca o início da faixa dos 10% maiores.

Próximo capitúlo

Estatística Descritiva do Zero: boxplot, assimetria e identificação de valores atípicos

Arrow Right Icon
Capa do Ebook gratuito Estatística Descritiva do Zero: Como Entender e Resumir Dados
69%

Estatística Descritiva do Zero: Como Entender e Resumir Dados

Novo curso

13 páginas

Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.