1 Introdução

A autocorrelação espacial é uma técnica da análise exploratória espacial que caracteriza a dependência de atributos no espaço, ou seja, o quanto um atributo de uma região está relacionado ao mesmo atributo de regiões vizinhas. Para a análise a seguir será utilizado o índice de autocorrelação espacial Moran’s I.

O índice Moran’s I é o indicador mais utilizado atualmente e funciona de forma similar a Correlação de Pearson, onde o valor varia entre -1 e 1, significando que para resultados próximos a esses valores existem alta autocorrelação espacial (Tendência a clusterização), e para resultados próximos a 0 não existem autocorrelação espacial (Padrões aleatórios).

2 Abordagem

Para a análise de autocorrelação espacial com o índice Moran’s I, utilizou-se o atributo PcMedRev (Preço Médio de Revenda) da amostra da semana 26-Abr-2020 a 02-Mai-2020 dos dados do Levantamento de Preços e de Margens de Comercialização de Combustíveis realizado pela ANP.

A partir dessa amostra, composta por 458 munícipios como é possível observar na imagem acima, contruiu-se 6 matrizes de vizinhança com intuito de avaliar o resultado para diferentes configurações. Todas as matrizes foram construidas ponderadas pela distância, dado que existem muitos polígonos sem contiguidade com outros. Na seção seguinte observam-se os connectivity graphs de cada uma delas e análises desenvolvidas.

2.1 Arquivos com as matrizes de vizinha

As análises de autocorrelação foram realizadas na ferramenta GeoDa, utilizando o shapefile gas_prices_hist e com as matrizes de vizinhança disponíveis no GitHub.

3 Análises

3.1 Primeira Análise

3.1.1 Matriz de Vizinhança

Para esta primeira análise desenvolveu-se uma matriz de vizinhança por distância, com largura de banda de 5.7 e distância euclidiana. Nota-se pelo seu connectivity graph que a matriz ficou bastante densa onde há concentração maior de polígonos, isso se deve ao fato de existirem municípios com centenas de vizinhos.

3.1.2 Autocorrelação Espacial

Observa-se no gráfico de dispersão do Moran’s I um valor de .15 para autocorrelação espacial, ou seja, significa dizer que 15.2% da variação do preço médio de revenda é explicado pela geografia. Apesar de mais da metade dos municípios terem um p-valor significante, a autocorrelação alcançou um valor baixo, o que pode estar relacionado à sua matriz de vizinhança devido ao grande número de vizinhos como comentado anteriormente.

3.2 Segunda Análise

3.2.1 Matriz de Vizinhança

Na segunda análise desenvolveu-se uma matriz de vizinhança utilizando kernel adaptativo com 8 vizinhos e função de decaimento gaussiano. Nota-se pelo seu connectivity graph que, comparado com a matriz da análise anterior, existe um equilíbrio maior no número de ligações.

3.2.2 Autocorrelação Espacial

Observa-se no gráfico de dispersão do Moran’s I um valor de .57 para autocorrelação espacial, ou seja, significa dizer que 57.6% da variação do preço médio de revenda é explicado pela geografia. Observa-se no Lisa Significance Map que 242 municípios tem p-valor significante, e no Lisa Cluster Map padrões alto-alto, baixo-baixo se formam no norte, nordeste, sudeste e sul do país, indicando, em conjunto com o Moran’s I, uma dependência espacial forte do atributo preço médio de revenda.

3.3 Terceira Análise

3.3.1 Matriz de Vizinhança

Para esta terceira análise desenvolveu-se uma matriz de vizinhança utilizando KNN (k-nearest neighbors) com 3 vizinhos.

3.3.2 Autocorrelação Espacial

Observa-se no gráfico de dispersão do Moran’s I um valor de .60 para autocorrelação espacial, ou seja, significa dizer que 60.3% da variação do preço médio de revenda é explicado pela geografia. Observa-se no Lisa Significance Map que 123 municípios tem p-valor significante, e no Lisa Cluster Map padrões alto-alto, baixo-baixo nas mesmas áreas das análises anteriores, indicando, em conjunto com o Moran’s I, uma dependência espacial forte do atributo preço médio de revenda.

3.4 Quarta Análise

3.4.1 Matriz de Vizinhança

Para esta quarta análise desenvolveu-se uma matriz de vizinhança utilizando KNN (k-nearest neighbors) com 4 vizinhos.

3.4.2 Autocorrelação Espacial

Observa-se no gráfico de dispersão do Moran’s I um valor de .58 para autocorrelação espacial, ou seja, significa dizer que 58.8% da variação do preço médio de revenda é explicado pela geografia. Observa-se no Lisa Significance Map que 156 municípios tem p-valor significante, e no Lisa Cluster Map padrões similares das análises anteriores, indicando, em conjunto com o Moran’s I, uma dependência espacial ainda forte do atributo preço médio de revenda.

3.5 Quinta Análise

3.5.1 Matriz de Vizinhança 5

Para esta quinta análise desenvolveu-se uma matriz de vizinhança utilizando KNN (k-nearest neighbors) com 6 vizinhos.

3.5.2 Autocorrelação Espacial

É possível observar no gráfico de dispersão do Moran’s I um valor de .55 para autocorrelação espacial, ou seja, significa dizer que 55% da variação do preço médio de revenda é explicado pela geografia. Observa-se no Lisa Significance Map que 201 municípios tem p-valor significante, ou seja, em comparação com os KNNs anteriores, ao se aumentar o número de vizinhos, o número de municípios significantes também aumenta, em contrapartida o Moran’s I diminui.

3.6 Sexta Análise

3.6.1 Matriz de Vizinhança

Para esta sexta análise desenvolveu-se uma matriz de vizinhança utilizando KNN (k-nearest neighbors) com 8 vizinhos.

3.6.2 Autocorrelação Espacial

É possível observar no gráfico de dispersão do Moran’s I um valor de .52 para autocorrelação espacial, ou seja, significa dizer que 52.2% da variação do preço médio de revenda é explicado pela geografia. Observa-se no Lisa Significance Map que 232 municípios tem p-valor significante, corroborando o que foi dito anteriormente sobre o aumento do número de vizinhos. Apesar disso, o Moran’s I ainda alcançou um valor interessante para este estudo.

4 Observações acerca das análises realizadas

A análise de autocorrelação espacial do preço médio de revenda da gasolina desenvolvida neste trabalho mostrou que existe uma dependência espacial significativa na amostra de municípios usada, variando no intervalo de 52% à 60% do Moran’s I para matrizes de vizinhança entre 3 e 8 vizinhos, com e sem kernel adaptativo.

Utilizando uma matriz baseada em largura de banda, o índice de autocorrelação diminui de forma acentuada, dado que para o software usado (GeoDa), com o menor valor posível de largura de banda (5.7) foi gerado uma matriz com ligações excessivas, alguns municípios chegando na casa das centenas de vizinhos.

Portanto acredita-se que esse fato tenha impactado no índice de autocorrelação. Matrizes de vizinhança por contiguidade não foram analisadas já que muitos municípios não teriam vizinhos, tornando essa opção ineficaz para esta análise.

5 Autocorrelação espacial das variáveis independentes

Abaixo a análise de autocorrelação espacial das variáveis independentes utilizando a matriz de vizinhança com maior I de Moran na análise de autocorrelação espacial do preço médio da gasolina comum (KNN = 3).

Distância Média das Distribuidoras Desvio Padrão da Distância das Distribuidoras
Distância Mínima das Distribuidoras Distância Máxima das Distribuidoras
Distância Média das Refinarias Desvio Padrão das Distâncias das Refinarias
Distância Mínima das Refinarias Distância Máxima das Refinarias
Variação no PIB de 2016 para 2017 Variação no PIB per Capita de 2016 para 2017