Um dos pressupostos da regressão linear múltipla é que a variância da variável dependente, Y, deve ser constante para os valores das variáveis preditoras X1, X2, …, Xn.
Outra maneira de pensar o mesmo fenômeno é que os erros do modelo (resíduos) devem ser constantes, independente dos valores da variável de resultado (Y).
Esse fenômeno é chamado de homocedasticidade ou homogeneidade de variância. Quando não acontece, diz-se que os dados apresentam heterocedasticidade ou heterogeneidade de variância.
Neste post apresentamos três formas de verificar a homogeneidade de variância, um pressuposto importante das regressões. Procure realizar os três métodos. Desta maneira, você terá mais confiança nos resultados das suas análises. Vamos lá!
Como analisar a homocedasticidade por meio do gráfico de Resíduos e Valores Ajustados?
Com o gráfico a seguir ficará mais fácil de entender. Vamos plotar um gráfico de dispersão, por meio de uma Regressão Linear Múltipla. Se você precisar refrescar a memória sobre como a regressão funciona, sugiro os artigos no blog sobre regressão linear e regressão linear simples.
No gráfico, o eixo x representa os valores projetados da variável dependente (Y) por meio da Regressão Linear Múltipla. Já o eixo y representa os resíduos, ou seja, quão distante do valor real estão os valores projetados.
Ao analisar o gráfico acima, é possível perceber que os resíduos não são homogêneos para todos os valores de Y. Há uma maior presença de resíduos negativos próximo dos valores ajustados 4 e 6. Ao mesmo tempo, os resíduos tendem a ser mais positivos abaixo do valor ajustado de 4 e acima de 6.
Como analisar a homocedasticidade por meio do gráfico de Probabilidade Normal dos Resíduos?
Uma outra maneira de observar a heterocedasticidade é por meio do gráfico de Probabilidade Normal dos Resíduos.
Neste gráfico, ainda é possível visualizar os resíduos no eixo y. Mas no eixo x temos os quantis esperados dos resíduos. Este valor esperado existe uma vez que erros aleatórios seguem uma distribuição normal, portanto, se os resíduos não tem distribuição normal, significa que não há homogeneidade de variância.
Neste exemplo, é possível observar que os erros se afastam da linha esperada (a linha sólida), indicando que os erros não são homogêneos, principalmente nos extremos.
Como analisar a homocedasticidade por meio de um teste de normalidade?
Como explicado no gráfico anterior, erros aleatórios devem seguir uma distribuição normal. Desta forma, podemos realizar um teste de normalidade nos resíduos, o teste de Shapiro-Wilk ou Kolmogorov-Smirnov.
Ambos os testes têm como hipótese nula que os dados são normais. Como resultado, valores de p < 0,05 indicam que os resíduos não são normais.
Como citar este post
Damásio, B. (2021, 9 de março). O que é homoscedasticidade na regressão linear? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/como-verificar-a-homogeneidade-de-variancia-na-regressao-linear/