R² para modelos lineares generalizados


Uma dúvida muito comum em modelos lineares generalizados (GLMs) é: existe um equivalente ao R² dos modelos lineares clássicos?
A resposta curta é: não exatamente.

Nos modelos lineares tradicionais (LMs), o R² representa a proporção da variância explicada pelo modelo utilizando mínimos quadrados ordinários (OLS). Já os GLMs utilizam outra lógica de estimação, normalmente baseada em máxima verossimilhança, o que faz com que o R² clássico não seja diretamente aplicável.

Por isso, em GLMs utilizamos medidas alternativas conhecidas como pseudo-R², R² generalizados ou índices de deviance explicada.Entre os pseudo-R² mais utilizados para regressão logística (GLM binomial) estão:
• McFadden;
• Cox & Snell;
• Nagelkerke;
• Tjur;
• Efron.

Esses índices variam conforme o método de cálculo e possuem interpretações análogas — mas não idênticas — ao R² tradicional. Para GLMs de forma mais ampla, uma medida bastante útil é o D² (deviance explained), baseado na relação entre a residual deviance e a null deviance do modelo:

D2 = 1 − Residual Deviance Null Deviance

Esse índice pode ser aplicado em diferentes famílias de GLMs e é implementado, por exemplo, no pacote modEvA do R.Além disso, o D² tende a permitir comparações mais consistentes entre modelos GLM por seguir uma lógica padronizada baseada na deviance. Ainda assim, comparações mais robustas continuam sendo recomendadas principalmente quando os modelos utilizam:
• o mesmo banco de dados;
• a mesma variável resposta;
• e distribuições estatísticas equivalentes ou semelhantes.

Já para modelos de contagem, como GLMs Poisson, existem abordagens mais específicas implementadas em pacotes como rsq, que fornecem coeficientes de determinação generalizados para GLMs e GLMMs.Mas atenção: pseudo-R² diferentes não devem ser comparados diretamente como se fossem equivalentes ao R² clássico. Comparações só fazem sentido quando:
• os modelos usam o mesmo banco de dados;
• possuem o mesmo objetivo analítico;
• e utilizam o mesmo tipo de pseudo-R².

Na prática, pseudo-R² são ferramentas úteis para avaliação relativa de ajuste e desempenho, mas devem ser interpretados com cautela e sempre dentro do contexto do modelo utilizado.

Achou esse conteúdo interessante? Confira então o vídeo no nosso canal no YouTube onde é mostrado na prática os cálculos de pseudo-R² para GLMs:

https://youtu.be/yr5EF0ERtmI?si=oEhpUvFqvtKI4FeA

A Beta Analítica pode ajudar você na escolha, execução e interpretação de modelos estatísticos e métricas de desempenho aplicadas aos seus dados.

Rolar para cima