COMO CORRIGIR AUTOCORRELAÇÃO ESPACIAL NUM MODELO MISTO?

Muitas vezes quando alguém está analisando dados distribuídos em subparcelas ou subamostras contíguas dentro de um bloco amostral ou transecção, um dos principais vieses a ser considerado é a pseudorepetição espacial. Neste caso, você precisa de um tipo de modelo chamado modelo misto que leva em consideração o viés de você possuir dados distribuídos em pseudoréplicas (ex: subparcelas). Muitos pesquisadores utilizam o GLMM (Generalized linear mixed models) na expectativa de conduzir uma análise estatística mais confiável. Como Dormann et al. (2007)  mostram e argumentam, o GLMM pode ser uma forma de lidar com efeitos de autocorrelação espacial causados por pseudoreplicações, mas não necessariamente é a mais eficaz para corrigir esse  efeito.

Um tipo de modelo de regressão mais eficiente que o GLMM neste aspecto é o LME (Linear mixed effects) do pacote “nlme”, o qual embasou primariamente o que veio a ser desenvolvido para o GLMM no pacote “lme4”. Não entraremos em detalhes específicos, mas há vários elementos que diferem o “nlme” e “lme4” e determinam as diferenças em eficiência entre LME e o GLMM. Mas, por exemplo, o “nlme” possui um aparato estatístico mais bem desenvolvido e robusto que permite ao LME corrigir efeitos de autocorrelações de forma geral devido a permitir especificar estruturas de correlação entre os resíduos, sendo a estrutura de correlação espacial exponencial (corExp) a mais usada. Apesar de seus modelos serem limitados a distribuição de erros gaussiana (normal), o pacote “nlme” permite modelar potencial heterocedasticidade e ajustar funções não-lineares. O pacote “lme4”, por outro lado é mais ágil computacionalmente, sendo mais amplo por permitir generalização para outras distribuições de erros (ex: poisson, binomial, negativo binomial)  e recomendo principalmente para grandes banco de dados e quando vários efeitos aleatórios são considerados no modelo GLMM. No entanto, o “lme4” não permite especificar estruturas de correlação entre resíduos (a não ser pelos próprios efeitos aleatórios) ou lidar com heterocedasticidade como o “nlme” faz.

Nessa figura temos exemplo  de um modelo LME sem a estrutura de correlação entre resíduos:

Já nessa figura abaixo temos exemplo de modelo nulo e “output” de um LME conduzido com uma estrutura de correlação espacial exponencial (CorExp) incluída:

Uma forma de ainda aumentar a robustez estatística, utilizando o LME (selecionado como método base a “Maxmium Likelihood”) é fazendo um análise prévia do modelo desejado através de LM (Linear Models) para verificar se há significativa autocorrelação espacial. Esta verificação se faz inserindo esse LM no teste de Moran’s I usando o pacote “lctools”. Para isso, no seu arquivo de dados importado para o R, as subamostras (ex: subparcelas em estudos florestais) devem ter discriminadas duas colunas X e Y relativa às coordenadas UTM obtidas a partir das suas coordenadas geográficas originais. A partir dessas coordenadas UTM X e Y serão geradas coordenadas únicas para cada linha de dados e permitirá que o LM inserido no teste de Moran’s I aponte o nível (positiva ou negativa) e significância de autocorrelação espacial no seu modelo. O problema principal causado pela autocorrelação espacial nesse caso é agrupar resíduos no modelo, fazendo valores maiores se agruparem a maiores e menores a menores (autocorrelação positiva) ou aproximando valores maiores de valores menores e vice-versa (autocorrelação espacial negativa). A principal consequência desses efeitos de autocorrelação e aumento de erros estatísticos do tipo I, ou seja, rejeitar a hipótese nula quando ela é verdadeira, levando o executor da análise a considerar uma falsa relação significativa entre variável dependente e preditiva (s). Dessa forma, se após conduzir o teste I de Moran e o mesmo apontar significância (p<0.05) você deve inserir na sintaxe do seu LME a função “corExp”, por exemplo. Isto irá aumentar e inserir um fator de correção no LME, garantindo que você obtenha relações com p-valores confiáveis e robustos.

Esta publicação ajudou você a entender um pouco melhor sobre modelos mistos?

Você precisa de ajuda nessa escolha, criação, execução e interpretação d resultados nesse tipo de modelagem?

Deixe a Beta Analítica ajudá-lo (a) nessa tarefa =)