O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Home » Blog » O que é o teste de Shapiro-Wilk?

Compartilhe nas Redes Sociais

O que é o teste de Shapiro-Wilk?

Neste post, falaremos sobre o teste de Shapiro-Wilk, uma técnica estatística usada para avaliar a normalidade dos dados. Além disso, descreveremos quais são as hipóteses nula e alternativa que o teste assume, apresentaremos exemplos de distribuições submetidas ao teste de normalidade e como interpretar seus resultados.

Por que se importar com a normalidade dos dados?

Primeiramente, ressaltamos que vários testes estatísticos fazem algum tipo de pressuposto acerca da normalidade das observações. Por exemplo, o teste t para grupos independentes assume que os dados em cada grupo têm distribuição aproximadamente normal, enquanto a regressão linear assume que os resíduos são normalmente distribuídos.

Desse modo, pesquisadores comumente precisam inspecionar a normalidade de variáveis, de modo a emitir um julgamento sobre a adequabilidade da aplicação de modelos estatísticos aos dados em mãos.

No entanto, é importante mencionar que, mesmo em caso de violações do pressuposto de normalidade, existem técnicas adequadas para a análise de dados. Por exemplo, em caso de dados sem distribuição normal, pesquisadores podem lançar mão de bootstrapping, de testes não paramétricos e de modelos lineares generalizados.

Qual é a hipótese nula do teste de Shapiro-Wilk?

O teste de Shapiro-Wilk tem como objetivo avaliar se uma distribuição dos dados se aproxima de uma distribuição normal. Essa distribuição, também conhecida como distribuição gaussiana, é frequentemente usada para modelar fenômenos naturais em ciências, como, por exemplo, a altura das pessoas de uma população. A Figura 1 ilustra a distribuição normal.

exemplo de distribuição normal teórica. — *Figura 1. Distribuição normal teórica.*

Podemos querer saber, por exemplo, se as idades dos participantes da nossa amostra se distribuem normalmente. Para isso, podemos usar o teste de Shapiro-Wilk, que tem as seguintes hipóteses nula e alternativa:

Hipótese nula: a variável de interesse é oriunda de uma população com distribuição normal;
Hipótese alternativa: a variável de interesse não é oriunda de uma população com distribuição normal.

O teste de Shapiro-Wilk produz a estatística W, que terá um valor de p a ela associado. Se o valor de p for menor que nosso nível de significância (geralmente, definido como 0,05), então rejeitamos a hipótese nula. Em outras palavras, afirmaremos que nossos dados se afastam significativamente de uma distribuição normal. A Figura 2 resume a tomada de decisão baseada no teste.

possíveis decisões tomadas a partir dos resultados do teste de Shapiro-Wilk. — *Figura 2. Tomada de decisão no teste de Shapiro-Wilk.*

Exemplos de aplicação do teste de Shapiro-Wilk

A Figura 3 apresenta os histogramas de três conjuntos de dados hipotéticos. Cada painel da Figura 3 se baseia em 300 observações.

três distribuições distintas para serem avaliadas por meio do teste de Shapiro-Wilk. — *Figura 3. Exemplos de distribuições de dados.*

O painel esquerdo representa dados amostrados de uma distribuição normal (µ = 0, σ = 1). Por outro lado, o painel central consiste em uma transformação das variáveis do painel anterior, em que cada valor foi elevado ao quadrado. A multiplicação de duas distribuições normais gera uma distribuição de qui-quadrado, com forte assimetria positiva. Por fim, o painel direito representa dados amostrados de uma distribuição uniforme [0, 1[.

O que esperamos de um teste estatístico? Idealmente, ele deveria rejeitar a hipótese nula quando os dados realmente diferirem de uma distribuição normal (distribuições qui-quadrado e uniforme), mas não rejeitá-la quando os dados aderirem a uma distribuição normal.

Como interpretar e reportar os resultados do teste de Shapiro-Wilk?

A Figura 4 apresenta os resultados do teste de Shapiro-Wilk gerados pelo SPSS. Se você quer aprender a solicitar a análise no SPSS, então confira nosso tutorial sobre o tema.

saída do teste de Shapiro-Wilk no SPSS. — *Figura 4. Resultados do teste de Shapiro-Wilk no SPSS.*

O SPSS se refere ao valor de p como Sig. Além disso, o termo Estatística se refere à estatística W do teste de Shapiro-Wilk. Por fim, o termo df é a abreviação de degrees of freedom (graus de liberdade, em português).

Nos exemplos da Figura 4, temos os seguintes resultados:

Distribuição normal (Figura 3, painel esquerdo): W(300) = 0,99, p = 0,31;
Distribuição qui-quadrado (Figura 3, painel central): W(300) = 0,60, p < 0,001;
Distribuição uniforme (Figura 3, painel direito): W(300) = 0,94, p < 0,001.

Resumidamente, os testes atingiram significância estatística para as distribuições qui-quadrado e uniforme, que eram, de fato, as que apresentavam maior afastamento de uma distribuição normal. Sendo assim, concluímos que a primeira distribuição não difere significativamente de uma distribuição normal, enquanto as duas últimas se afastam significativamente da distribuição normal.

Quando devo usar o teste de Shapiro-Wilk?

Conduzir o teste de Shapiro-Wilk é simples e fácil. No entanto, esse teste possui limitações. Assim como os demais testes de normalidade, o teste de Shapiro-Wilk tem baixo poder estatístico para detectar desvios da normalidade em amostras pequenas. Em outras palavras, isso quer dizer que ele muitas vezes falha em acusar falta de normalidade quando deveria fazê-lo.

Por outro lado, em amostras grandes, ele costuma apresentar significância estatística para pequenos desvios da normalidade (Miot, 2017). Isto é, mesmo desvios sutis da normalidade, e que não representam preocupações importantes para o pesquisador, seriam indicados como afastamentos significativos de uma distribuição normal.

Sendo assim, os resultados do teste devem ser interpretados com cautela. Recomendamos, portanto, que a inspeção da normalidade seja feita preferencialmente usando uma variedade de opções, incluindo análises da assimetria e da curtose da distribuição, análises gráficas (e.g., Q-Q plot) e inspeção de casos extremos.

Conclusão

Neste post, explicamos o que é o teste de Shapiro–Wilk, quais são suas hipóteses nula e alternativa, e quando ele deve ser utilizado. Além disso, por meio de três exemplos de distribuições, mostramos como interpretar e reportar os resultados desse teste.

Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5^th ed.). Sage.

Miot, H. A. (2017). Avaliação da normalidade dos dados em estudos clínicos e experimentais. Jornal Vascular Brasileiro, 16(2), 88–91. https://doi.org/10.1590/1677-5449.041117

Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33.

Como citar este post

Lima, M. (2021, 3 de maio). O que é o teste de Shapiro-Wilk? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-o-teste-de-shapiro-wilk/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Respostas de 2

Rafael dos Reis disse:

05/04/2023 às 17:16

Gostaria de saber qual o número aproximado de elementos na amostra para que o teste de Shapiro-Wilk seja considerado aplicável.

Responder
1. Marcos Lima disse:
  
  03/06/2024 às 13:03
  
  Oi, Rafael. Estudos indicam que o teste de Shapiro-Wilk não desempenha bem em amostras menores (N <= 30). Em um desses estudos (Razali & Wah, 2011), para distribuições assimétricas (que é realmente quando queremos rejeitar o pressuposto de normalidade), o teste de Shapiro-Wilk começou a desempenhar bem em amostras a partir de 50 casos. Então a partir de 50 casos você pode começar a utilizar esse teste. Equipe Psicometria Online. Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21-33.
  
  Responder