Neste post, falaremos sobre o teste de Shapiro-Wilk, uma técnica estatística usada para avaliar a normalidade dos dados. Além disso, descreveremos quais são as hipóteses nula e alternativa que o teste assume, apresentaremos exemplos de distribuições submetidas ao teste de normalidade e como interpretar seus resultados.
Por que se importar com a normalidade dos dados?
Primeiramente, ressaltamos que vários testes estatísticos fazem algum tipo de pressuposto acerca da normalidade das observações. Por exemplo, o teste t para grupos independentes assume que os dados em cada grupo têm distribuição aproximadamente normal, enquanto a regressão linear assume que os resíduos são normalmente distribuídos.
Desse modo, pesquisadores comumente precisam inspecionar a normalidade de variáveis, de modo a emitir um julgamento sobre a adequabilidade da aplicação de modelos estatísticos aos dados em mãos.
No entanto, é importante mencionar que, mesmo em caso de violações do pressuposto de normalidade, existem técnicas adequadas para a análise de dados. Por exemplo, em caso de dados sem distribuição normal, pesquisadores podem lançar mão de bootstrapping, de testes não paramétricos e de modelos lineares generalizados.
Qual é a hipótese nula do teste de Shapiro-Wilk?
O teste de Shapiro-Wilk tem como objetivo avaliar se uma distribuição dos dados se aproxima de uma distribuição normal. Essa distribuição, também conhecida como distribuição gaussiana, é frequentemente usada para modelar fenômenos naturais em ciências, como, por exemplo, a altura das pessoas de uma população. A Figura 1 ilustra a distribuição normal.
Podemos querer saber, por exemplo, se as idades dos participantes da nossa amostra se distribuem normalmente. Para isso, podemos usar o teste de Shapiro-Wilk, que tem as seguintes hipóteses nula e alternativa:
- Hipótese nula: a variável de interesse é oriunda de uma população com distribuição normal;
- Hipótese alternativa: a variável de interesse não é oriunda de uma população com distribuição normal.
O teste de Shapiro-Wilk produz a estatística W, que terá um valor de p a ela associado. Se o valor de p for menor que nosso nível de significância (geralmente, definido como 0,05), então rejeitamos a hipótese nula. Em outras palavras, afirmaremos que nossos dados se afastam significativamente de uma distribuição normal. A Figura 2 resume a tomada de decisão baseada no teste.
Exemplos de aplicação do teste de Shapiro-Wilk
A Figura 3 apresenta os histogramas de três conjuntos de dados hipotéticos. Cada painel da Figura 3 se baseia em 300 observações.
O painel esquerdo representa dados amostrados de uma distribuição normal (µ = 0, σ = 1). Por outro lado, o painel central consiste em uma transformação das variáveis do painel anterior, em que cada valor foi elevado ao quadrado. A multiplicação de duas distribuições normais gera uma distribuição de qui-quadrado, com forte assimetria positiva. Por fim, o painel direito representa dados amostrados de uma distribuição uniforme [0, 1[.
O que esperamos de um teste estatístico? Idealmente, ele deveria rejeitar a hipótese nula quando os dados realmente diferirem de uma distribuição normal (distribuições qui-quadrado e uniforme), mas não rejeitá-la quando os dados aderirem a uma distribuição normal.
Como interpretar e reportar os resultados do teste de Shapiro-Wilk?
A Figura 4 apresenta os resultados do teste de Shapiro-Wilk gerados pelo SPSS. Se você quer aprender a solicitar a análise no SPSS, então confira nosso tutorial sobre o tema.
O SPSS se refere ao valor de p como Sig. Além disso, o termo Estatística se refere à estatística W do teste de Shapiro-Wilk. Por fim, o termo df é a abreviação de degrees of freedom (graus de liberdade, em português).
Nos exemplos da Figura 4, temos os seguintes resultados:
- Distribuição normal (Figura 3, painel esquerdo): W(300) = 0,99, p = 0,31;
- Distribuição qui-quadrado (Figura 3, painel central): W(300) = 0,60, p < 0,001;
- Distribuição uniforme (Figura 3, painel direito): W(300) = 0,94, p < 0,001.
Resumidamente, os testes atingiram significância estatística para as distribuições qui-quadrado e uniforme, que eram, de fato, as que apresentavam maior afastamento de uma distribuição normal. Sendo assim, concluímos que a primeira distribuição não difere significativamente de uma distribuição normal, enquanto as duas últimas se afastam significativamente da distribuição normal.
Quando devo usar o teste de Shapiro-Wilk?
Conduzir o teste de Shapiro-Wilk é simples e fácil. No entanto, esse teste possui limitações. Assim como os demais testes de normalidade, o teste de Shapiro-Wilk tem baixo poder estatístico para detectar desvios da normalidade em amostras pequenas. Em outras palavras, isso quer dizer que ele muitas vezes falha em acusar falta de normalidade quando deveria fazê-lo.
Por outro lado, em amostras grandes, ele costuma apresentar significância estatística para pequenos desvios da normalidade (Miot, 2017). Isto é, mesmo desvios sutis da normalidade, e que não representam preocupações importantes para o pesquisador, seriam indicados como afastamentos significativos de uma distribuição normal.
Sendo assim, os resultados do teste devem ser interpretados com cautela. Recomendamos, portanto, que a inspeção da normalidade seja feita preferencialmente usando uma variedade de opções, incluindo análises da assimetria e da curtose da distribuição, análises gráficas (e.g., Q-Q plot) e inspeção de casos extremos.
Conclusão
Neste post, explicamos o que é o teste de Shapiro–Wilk, quais são suas hipóteses nula e alternativa, e quando ele deve ser utilizado. Além disso, por meio de três exemplos de distribuições, mostramos como interpretar e reportar os resultados desse teste.
Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Miot, H. A. (2017). Avaliação da normalidade dos dados em estudos clínicos e experimentais. Jornal Vascular Brasileiro, 16(2), 88–91. https://doi.org/10.1590/1677-5449.041117
Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33.
Como citar este post
Lima, M. (2021, 3 de maio). O que é o teste de Shapiro-Wilk? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-o-teste-de-shapiro-wilk/
Respostas de 2
Gostaria de saber qual o número aproximado de elementos na amostra para que o teste de Shapiro-Wilk seja considerado aplicável.
Oi, Rafael. Estudos indicam que o teste de Shapiro-Wilk não desempenha bem em amostras menores (N <= 30). Em um desses estudos (Razali & Wah, 2011), para distribuições assimétricas (que é realmente quando queremos rejeitar o pressuposto de normalidade), o teste de Shapiro-Wilk começou a desempenhar bem em amostras a partir de 50 casos. Então a partir de 50 casos você pode começar a utilizar esse teste. Equipe Psicometria Online. Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21-33.