Quando realizamos uma Regressão Linear Múltipla, precisamos escolher entre 5 métodos de entrada de dados (Enter, Forward, Stepwise, Backward e Remove). Cada um deles é exibido na Figura 1, logo abaixo.
Cada um possui características diferentes com suas vantagens e desvantagens. Vamos entender em detalhes?
Método Enter
No método Enter, todas as variáveis são inseridas de uma vez só, em um único bloco. A partir dessa entrada, se avalia quais os preditores são significativos e quais não são.
Vantagem: Simplicidade do modelo
Desvantagem: Apresenta mais problemas de multicolineariedade. Não apresenta o R2, portanto você não sabe a % explicada que cada preditor explica do desfecho.
Método Stepwise
Nesse método, a entrada é feita por etapas. O primeiro modelo inclui a variável mais forte (com base na significância do F). Após a entrada da variável mais forte, automaticamente é feita nova entrada com os preditores remanescentes, sempre seguindo a ordem do mais forte. Essas entradas acontecem até que todas as variáveis significativas estejam no modelo final.
Vantagem: Você obtém um modelo mais parcimonioso e o R2 de cada variável.
Desvantagem: A significância de F sofre efeito do tamanho amostral.
Método Forward (Avançar)
A lógica é identica ao Stepwise, mas dessa vez as variáveis inseridas passo-a-passo, com base na correlação parcial da VI com a VD. Preditores que tenham maior correlação parcial com o desfecho irão entrar no modelo.
Vantagem: Você obtém um modelo mais parcimonioso e o R2 de cada variável.
Desvantagem: Sofre influência das variáveis do modelo.
Método Backward (Retroceder)
Assim como no método Enter, as variáveis são inseridas de uma vez, porém as vVariáveis excluídas passo a-passo. A variáveis mais fraca é excluida do modelo e uma nova regressão é realizada, até que permaneçam apenas variáveis significativas.
Vantagem: Elimina possíveis erros de inserção dos métodos stepwise e forward.
Método Remove (Remover)
Nesse método é o pesquisador que escolhe quais variáveis devem ser excluídas para comparar os modelos.
Vantagem: Pesquisador testa os modelos que gostaria.
Desvantagem: Escolhas arbitrárias podem ser perigosas.
Como você viu, todos métodos se diferenciam e nenhum é perfeito. Porém, tecnicamente, o método Backward é considerado mais adequado pois ele contra erros que podem acontecer nos outros métodos.
Porém, os métodos passo a passo fornecem o R2, ao optar por esse tipo de método de entrada, dê preferencia ao Forward ao invés do Stepwise.
Conclusão
Espero que esse post tenha sido útil.
Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Como citar este post
França, A. (2022, 29 de janeiro). Método de entrada da regressão linear múltipla. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/metodos-de-entrada-da-regressao-linear-multipla/