Capa do Ebook gratuito Analista do IBGE: Estudo Avançado em Estatística, Geografia e Políticas Públicas

Analista do IBGE: Estudo Avançado em Estatística, Geografia e Políticas Públicas

Novo curso

15 páginas

Integração Estatística–Geografia para Analista do IBGE: análise espacial e indicadores territoriais

Capítulo 13

Tempo estimado de leitura: 13 minutos

+ Exercício

Este capítulo conecta métodos quantitativos à leitura espacial, mostrando como a localização e a vizinhança alteram a interpretação de indicadores. Em análises territoriais, não basta saber “quanto” um fenômeno ocorre: importa “onde”, “em que escala” e “em relação a quais áreas vizinhas”.

1) Dados espaciais e suas representações

1.1 Tipos de geometria: ponto, linha, polígono e raster

Em bases geoespaciais, a informação territorial é representada por geometrias. A escolha do tipo de dado afeta o que pode ser medido e como o fenômeno será analisado.

  • Ponto: representa ocorrências localizadas (ex.: escolas, postos de saúde, estabelecimentos). Útil para densidades, proximidade e acessibilidade.
  • Linha: representa redes e fluxos (ex.: rodovias, rios, linhas de ônibus). Útil para conectividade, tempo de deslocamento e barreiras.
  • Polígono: representa áreas (ex.: municípios, setores censitários, unidades de conservação). Útil para taxas por área, agregação de atributos e comparação entre unidades.
  • Raster: grade de células com valores (ex.: uso e cobertura da terra, temperatura de superfície, altitude). Útil para fenômenos contínuos e análises de superfície.

1.2 Atributos, chaves e integridade espacial

Dados espaciais combinam geometria e atributos (tabela). Para integrar estatística e geografia, é essencial garantir: (a) chave de ligação consistente (código de município, setor etc.); (b) correspondência temporal (ano de referência); (c) consistência de limites territoriais (mudanças de malha ao longo do tempo).

Exemplo prático: ao mapear taxa de desemprego municipal em dois anos, verifique se houve criação/desmembramento de municípios. Se a malha mudou, a comparação direta pode induzir erro; pode ser necessário harmonizar para uma malha comum.

2) Unidades territoriais, escala e problemas de agregação

2.1 Unidades territoriais: o que são e por que importam

Unidades territoriais são recortes espaciais usados para coletar, organizar e divulgar dados (ex.: setor censitário, distrito, município, região imediata/intermediária, UF). Elas definem a escala da análise e influenciam padrões observados.

Continue em nosso aplicativo

Você poderá ouvir o audiobook com a tela desligada, ganhar gratuitamente o certificado deste curso e ainda ter acesso a outros 5.000 cursos online gratuitos.

ou continue lendo abaixo...
Download App

Baixar o aplicativo

2.2 MAUP (Modifiable Areal Unit Problem)

O MAUP descreve como resultados estatísticos mudam quando alteramos a forma de agregação espacial. Ele tem dois componentes:

  • Efeito de escala: mudar o nível de agregação (setor → município → UF) altera variâncias, correlações e padrões.
  • Efeito de zoneamento: mesmo na mesma escala, mudar o desenho das zonas (como agrupar setores em “áreas”) pode mudar conclusões.

Implicação: uma correlação entre renda e escolaridade pode ser forte em nível municipal, mas fraca em nível de setor, ou vice-versa. Isso não é “erro do dado”; é sensibilidade ao recorte territorial.

2.3 Falácia ecológica (ecological fallacy)

Falácia ecológica ocorre quando inferimos comportamento individual a partir de dados agregados. Um município com alta taxa de analfabetismo e alta taxa de desemprego não implica que os desempregados sejam, individualmente, os analfabetos. A associação pode ser explicada por composição demográfica, estrutura produtiva, migração, entre outros fatores.

Como evitar: (a) explicitar o nível de inferência (territorial, não individual); (b) quando necessário, usar microdados ou modelos multinível; (c) comparar padrões em mais de uma escala e discutir estabilidade.

3) Dependência espacial e autocorrelação

3.1 Por que “independência” falha em dados territoriais

Muitos métodos estatísticos assumem independência entre observações. Em geografia, áreas vizinhas tendem a ser semelhantes (ou, em alguns casos, contrastantes) por difusão, compartilhamento de infraestrutura, clima, redes econômicas e políticas regionais. Essa estrutura é chamada de dependência espacial.

3.2 Matriz de vizinhança (W): a base operacional

Para medir autocorrelação espacial, definimos quem é vizinho de quem por uma matriz W. As escolhas mais comuns:

  • Contiguidade: vizinhos compartilham fronteira (rook) ou fronteira/vértice (queen).
  • Distância: vizinhos dentro de um raio (ex.: 50 km) ou k-vizinhos mais próximos.
  • Ponderação: pesos binários (0/1) ou decrescentes com distância; frequentemente normalizados por linha (cada área soma 1).

Risco: resultados de autocorrelação podem mudar com W. Por isso, a justificativa metodológica deve explicar por que a vizinhança escolhida faz sentido para o fenômeno (mobilidade, contágio, mercado de trabalho, bacia hidrográfica etc.).

3.3 Moran Global (I): autocorrelação espacial média

O Moran Global avalia se valores altos/baixos tendem a se agrupar no espaço. Interpretação típica:

  • I > 0: autocorrelação positiva (agrupamento de semelhantes: alto-alto e baixo-baixo).
  • I ≈ 0: padrão aleatório (sem estrutura espacial detectável).
  • I < 0: autocorrelação negativa (vizinhos contrastantes: alto-baixo).

Quando aplicar: como diagnóstico inicial antes de regressões territoriais, para verificar se há estrutura espacial relevante no indicador (taxa, índice, residual de modelo).

Passo a passo prático (fluxo de trabalho):

  • 1) Defina a unidade territorial (ex.: municípios) e o período.
  • 2) Calcule o indicador (ex.: taxa de informalidade).
  • 3) Escolha e documente a matriz W (ex.: contiguidade queen, normalizada).
  • 4) Calcule Moran Global para o indicador.
  • 5) Faça teste de significância por permutação (ex.: 999 permutações) para avaliar se o padrão difere do aleatório.
  • 6) Se significativo, avance para análise local (LISA) e/ou modelos espaciais.

3.4 Moran Local (LISA): onde estão os clusters

O Moran Local identifica agrupamentos e outliers espaciais, permitindo mapear padrões do tipo:

  • Alto-Alto (HH): áreas altas cercadas por altas (hot spots).
  • Baixo-Baixo (LL): áreas baixas cercadas por baixas (cold spots).
  • Alto-Baixo (HL): outlier alto cercado por baixos.
  • Baixo-Alto (LH): outlier baixo cercado por altos.

Cuidados: (a) múltiplos testes (muitos municípios testados simultaneamente) aumentam falsos positivos; considere correções ou interpretação conservadora; (b) LISA depende de W; (c) clusters podem refletir efeitos de composição (idade, urbanização) e não causalidade direta.

4) Noções de modelos com dependência espacial (nível conceitual)

4.1 Por que modelar a dependência espacial

Se há autocorrelação espacial, erros de um modelo “não espacial” podem ficar correlacionados entre vizinhos, afetando inferência (p-valores, intervalos) e interpretação. Modelos espaciais buscam representar explicitamente essa estrutura.

4.2 Dois arquétipos: defasagem espacial e erro espacial

Sem entrar em derivação matemática, há duas ideias centrais:

  • Modelo de defasagem espacial (spatial lag): o valor do fenômeno em uma área depende do valor em áreas vizinhas (efeito de interação/difusão). Ex.: crescimento do emprego em um município influenciado por municípios próximos.
  • Modelo de erro espacial (spatial error): a dependência está em fatores omitidos com padrão espacial (variáveis não observadas, como qualidade institucional regional, clima, acessibilidade), gerando erros correlacionados.

Como escolher (heurística interpretativa):

  • Se o mecanismo plausível é interação direta entre áreas (spillover), considere defasagem espacial.
  • Se o mecanismo é omissão de fatores regionais ou choques compartilhados, considere erro espacial.

Diagnóstico prático: após ajustar um modelo não espacial, avalie autocorrelação espacial dos resíduos (Moran nos resíduos). Resíduos autocorrelacionados sugerem necessidade de especificação espacial ou de variáveis explicativas adicionais com estrutura territorial.

4.3 Interpretação: efeitos diretos e indiretos

Em modelos com defasagem espacial, mudanças em uma área podem repercutir em vizinhas (efeitos indiretos) e retornar (feedback). A interpretação deve distinguir:

  • Efeito direto: impacto na própria área.
  • Efeito indireto (spillover): impacto em áreas vizinhas via estrutura W.
  • Efeito total: soma de direto + indireto.

Em relatórios técnicos, explicite se o objetivo é previsão territorial, explicação de padrões regionais ou avaliação de políticas com possíveis transbordamentos.

5) Construção de indicadores territoriais e mapas temáticos

5.1 Indicadores territoriais: do numerador/denominador ao significado espacial

Indicadores territoriais frequentemente são taxas, proporções, razões ou índices compostos calculados por unidade geográfica. A leitura espacial exige atenção a três pontos: (a) comparabilidade entre áreas; (b) estabilidade estatística; (c) coerência com o fenômeno.

Exemplo: taxa de mortalidade infantil municipal = óbitos de menores de 1 ano / nascidos vivos. Em municípios pequenos, pequenas variações absolutas geram grandes oscilações na taxa, o que pode distorcer mapas.

5.2 Passo a passo: construindo um indicador territorial robusto

  • 1) Defina o conceito: o que o indicador pretende medir e em qual unidade territorial.
  • 2) Escolha numerador e denominador coerentes (evite denominadores que não representem população em risco).
  • 3) Padronize quando necessário (por 1.000, 10.000, 100.000) para facilitar leitura.
  • 4) Trate instabilidade em pequenas áreas: considere médias móveis temporais, agregação de anos, ou suavização (conceitualmente: reduzir ruído sem apagar padrão).
  • 5) Documente a base territorial (malha, ano, mudanças de limites).
  • 6) Valide com estatísticas simples (mínimo, máximo, percentis) e inspeção de outliers antes de mapear.

5.3 Mapas coropléticos: quando usar e quando evitar

Mapas coropléticos (polígonos coloridos por classes) são adequados para taxas, proporções e indicadores normalizados. Evite usar coroplético para contagens absolutas (ex.: número de casos), pois áreas grandes tendem a parecer “mais importantes” apenas por tamanho/população.

Alternativas: (a) símbolos proporcionais para contagens; (b) mapas de densidade (kernel) para pontos; (c) raster para superfícies contínuas.

5.4 Classificação, legenda e escolhas cartográficas

A classificação define como valores numéricos viram classes de cor. Escolhas comuns:

  • Quantis: mesma quantidade de áreas por classe. Bom para comparar posições relativas, mas pode exagerar diferenças pequenas.
  • Intervalos iguais: classes com mesma amplitude. Bom para interpretação absoluta, mas pode concentrar muitas áreas em poucas classes se a distribuição for assimétrica.
  • Quebras naturais (Jenks): classes que minimizam variação interna. Bom para destacar agrupamentos na distribuição, mas dificulta comparação entre mapas de períodos diferentes se as quebras mudam.
  • Classes definidas por critério: limites substantivos (ex.: metas, padrões normativos). Bom para políticas públicas e monitoramento.

Regras práticas de legenda:

  • Use 5 a 7 classes como padrão; muitas classes dificultam leitura.
  • Prefira paletas sequenciais para variáveis ordenadas (baixa→alta) e divergentes quando há um ponto de referência (ex.: variação em torno de zero).
  • Indique claramente unidade e período (ex.: “por 10 mil hab., 2022”).
  • Trate valores ausentes e áreas sem dado com cor neutra e legenda explícita.

5.5 Riscos de distorção e como mitigá-los

  • Área visual vs população: municípios extensos podem dominar o mapa. Mitigue com cartogramas (quando apropriado) ou complementos (gráficos, tabelas).
  • Comparação temporal enganosa: usar quebras diferentes em cada ano impede comparação. Para séries, fixe classes ou use escala contínua consistente.
  • Outliers: um valor extremo “puxa” intervalos iguais. Considere transformação (log) ou classes por percentis, sempre justificando.
  • Pequenas áreas instáveis: taxas em populações pequenas geram “manchas” aleatórias. Considere agregação temporal ou suavização e sinalize a decisão metodológica.

6) Integração tabela–mapa: roteiro analítico para inferir padrões regionais

6.1 Do descritivo territorial ao diagnóstico espacial

Uma rotina eficiente combina: (a) tabela de estatísticas por unidade; (b) mapa do indicador; (c) diagnóstico de autocorrelação; (d) interpretação substantiva com hipóteses plausíveis.

Roteiro prático:

  • 1) Produza uma tabela com: indicador, população/denominador, e medidas de incerteza/estabilidade (quando houver).
  • 2) Faça um mapa coroplético do indicador (com classificação justificada).
  • 3) Calcule Moran Global para verificar se há agrupamento espacial.
  • 4) Se houver, mapeie LISA para localizar clusters e outliers.
  • 5) Cruze com variáveis contextuais (urbanização, estrutura produtiva, acessibilidade, biomas) para formular explicações.
  • 6) Se o objetivo for modelagem, verifique Moran nos resíduos de um modelo base e discuta necessidade de especificação espacial.

7) Exercícios aplicados (tabelas + mapas + justificativa metodológica)

Exercício 1: MAUP e estabilidade de padrões

Contexto: você tem uma taxa (por exemplo, proporção de domicílios com saneamento adequado) em nível de setor censitário e também agregada para município.

  • a) Construa duas tabelas: uma em nível de setor e outra em nível municipal, com média, mediana, desvio e percentis do indicador.
  • b) Produza dois mapas coropléticos (setor e município) usando a mesma paleta e número de classes. Compare visualmente os padrões.
  • c) Item discursivo: explique como o efeito de escala do MAUP pode alterar a percepção de desigualdade territorial. Indique qual nível é mais adequado para uma política de infraestrutura local e justifique.

Exercício 2: Falácia ecológica em interpretação de associação

Contexto: em nível municipal, observa-se que municípios com maior proporção de população jovem têm maior taxa de desemprego.

  • a) Faça um mapa bivariado simples (ou dois mapas lado a lado) para proporção de jovens e taxa de desemprego.
  • b) Calcule Moran Global para cada variável e descreva se há agrupamento.
  • c) Item discursivo: por que não é válido concluir que “jovens estão desempregados” apenas a partir do padrão municipal? Liste duas explicações alternativas (composição setorial, migração, escolarização, informalidade etc.) e proponha um dado adicional que ajudaria a testar a hipótese.

Exercício 3: Moran Global e LISA para identificar clusters

Contexto: indicador municipal de vulnerabilidade (taxa ou índice) para um ano.

  • a) Defina uma matriz W por contiguidade queen e outra por k-vizinhos (k=5). Calcule Moran Global para ambas.
  • b) Compare os resultados e discuta sensibilidade à definição de vizinhança.
  • c) Calcule Moran Local (LISA) e produza um mapa de clusters (HH, LL, HL, LH) com indicação de significância.
  • d) Item discursivo: escolha um cluster HH e um outlier HL e proponha hipóteses territoriais plausíveis para cada caso, explicitando por que a hipótese é espacial (relacionada à vizinhança) e não apenas local.

Exercício 4: Escolhas cartográficas e risco de distorção

Contexto: taxa municipal de um fenômeno raro (baixa contagem em muitos municípios).

  • a) Faça três mapas do mesmo indicador: quantis, intervalos iguais e quebras naturais. Mantenha 5 classes.
  • b) Em uma tabela, registre os limites de classe de cada método e quantos municípios caem em cada classe.
  • c) Item discursivo: qual método comunica melhor o fenômeno para gestores públicos e por quê? Discuta o risco de “manchas” em municípios pequenos e proponha uma estratégia para reduzir instabilidade (agregar anos, suavizar, ou mudar unidade territorial), justificando a escolha.

Exercício 5: Diagnóstico para decisão de modelo espacial (conceitual)

Contexto: você ajustou um modelo explicativo para um indicador municipal (por exemplo, taxa de informalidade) com covariáveis socioeconômicas e obteve resíduos.

  • a) Calcule Moran Global dos resíduos com uma matriz W justificada.
  • b) Se houver autocorrelação, descreva qual tipo de mecanismo é mais plausível: interação (spillover) ou fatores omitidos regionais.
  • c) Item discursivo: indique se você consideraria um modelo de defasagem espacial ou de erro espacial e apresente a justificativa metodológica, incluindo como interpretaria efeitos diretos e indiretos no caso de defasagem.

Agora responda o exercício sobre o conteúdo:

Ao comparar uma taxa municipal em dois anos, observa-se que alguns municípios foram criados ou desmembrados entre os períodos. Qual procedimento é mais adequado para evitar interpretações equivocadas ao mapear e comparar os resultados?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

Mudanças de limites alteram a unidade de análise e podem distorcer comparações. Garantir chaves, ano de referência e consistência territorial, harmonizando para uma malha comum quando necessário, reduz erros de interpretação.

Próximo capitúlo

Questões objetivas para Analista do IBGE: resolução comentada em Estatística, Geografia e Políticas Públicas

Arrow Right Icon
Baixe o app para ganhar Certificação grátis e ouvir os cursos em background, mesmo com a tela desligada.