O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é correlação?

Marcos Lima

fev 2, 2021

Você sabe o que é correlação? Neste post, explicaremos esse importante conceito de metodologia científica.

Qual é a definição de correlação?

Pesquisadores quantitativos frequentemente apresentam resultados que indicam correlação entre variáveis. Por exemplo, considere o construto consciência fonológica, a capacidade de perceber e manipular os sons da linguagem falada.

Psicólogos do desenvolvimento têm demonstrado que a consciência fonológica se correlaciona positivamente com escores em tarefas de vocabulário em crianças de 4 anos. Isto é, crianças com níveis mais altos de consciência fonológica também têm maiores vocabulários.

Mas o que é correlação? Em síntese, a correlação pode ser entendida como um conceito estatístico que se refere à relação ou dependência estatística entre duas variáveis.

Quando duas variáveis estão correlacionadas, a mudança em uma variável se associa a mudanças na outra variável (e vice-versa). Retomando o exemplo anterior, aumentos nos níveis de consciência fonológica levam à predição de que também observaremos aumentos nos vocabulários das crianças.

Contudo, é importante notar que a correlação não indica qual é a direção teórica da relação entre as variáveis. Por exemplo, maior consciência fonológica facilita a aprendizagem de novas palavras? Ou, por outro lado, é um vocabulário mais rico leva a uma maior consciência fonológica? Apenas com base na correlação, no entanto, somos incapazes de distinguir qual dessas possibilidades (ou se alguma outra) é a resposta correta. Em outras palavras, uma correlação é insuficiente para justificar afirmações de relações causais entre variáveis.

O que é correlação de Pearson?

O que é?

Como já vimos, a correlação é um conceito estatístico. A magnitude da correlação entre variáveis pode quantificada, por exemplo, por meio de diferentes técnicas estatísticas. Entre elas, a mais conhecida é o coeficiente de correlação de Pearson, que quantifica a dependência linear entre variáveis.

Essa técnica também pode ser chamada de r de Pearson, correlação produto–momento de Pearson ou, mais coloquialmente, de correlação de Pearson. Esse coeficiente é padronizado de modo a gerar uma medida cujos valores estão entre –1 e +1.

Veja também:

Quais são as informações fornecidas pelo coeficiente de correlação?

Um coeficiente de correlação pode indicar uma relação:

  • Positiva: quando o aumento em uma variável está associado ao aumento na outra variável. Por exemplo, altura e peso: quanto maior é a altura, maior tende a ser o peso de uma pessoa;
  • Negativa: quando o aumento em uma variável está associado ao decréscimo na outra variável. Por exemplo, exercício e nível de estresse: quanto maior é o engajamento em exercícios, menor tende a ser o nível de estresse;
  • Nula: quando as duas variáveis são estatisticamente independentes. Por exemplo, tamanho do pé e inteligência: não existe uma relação (quer positiva ou negativa) entre tamanho do pé e inteligência.

Além de informar sobre a presença e a direção (positiva ou negativa) das variáveis, o valor absoluto do coeficiente informa sobre a força da dependência estatística entre variáveis: valores mais próximos dos extremos (quer –1 ou +1) indicam correlações mais fortes, enquanto valores mais próximos de 0 indicam correlações mais fracas ou inexistentes.

Isso significa que, quando as variáveis estão fortemente relacionadas, a mudança em uma variável é altamente preditiva da magnitude da mudança na outra variável. Por outro lado, relações mais fracas contêm maior ruído, isto é, levam a uma maior incerteza sobre o aumento correspondente na outra variável.

Um coeficiente igual a 1 indicaria uma correlação perfeita, onde o aumento em uma variável é totalmente preditivo do valor observado na outra variável. Por exemplo, um caso de correlação perfeita é o das idades de duas pessoas, coletadas sempre no primeiro dia de cada ano. Na prática, contudo, correlações perfeitas são inexistentes em ciências humanas e sociais.

Qual é a relação do coeficiente de correlação com o diagrama de dispersão dos dados?

Os painéis da Figura 1 contêm diagramas de dispersão ilustrando diferentes magnitudes de correlação. Nesse contexto, o eixo x representa uma variável, o eixo y representa outra variável. Além disso, cada ponto representa os escores de um caso nas variáveis apresentadas nos dois eixos. Portanto, um diagrama de dispersão é útil por indicar visualmente se há alguma tendência na relação entre duas variáveis.

diferentes tamanhos de correlação.
Figura 1. Diagramas de dispersão e suas respectivas correlações.

Note que, no caso de correlações perfeitas (–1 e +1), os pontos se alinham em uma reta diagonal. À medida que o valor do coeficiente de correlação vai diminuindo, os pontos tendem a se desalinhar cada vez mais, até formar um padrão elíptico quando r = 0, o que sugere a ausência de relação linear entre variáveis.

Como interpretar a força da correlação?

Não existe consenso sobre como interpretar a força da correlação, mas existem algumas recomendações gerais disponíveis na literatura. Cohen (1992) sugere os seguintes pontos de corte:

  • r = |±0,10| → correlação fraca;
  • r = |±0,30| → correlação moderada;
  • r = |±0,50| → correlação forte.

Por outro lado, Rumsey (2023) traz a seguinte sugestão de tamanhos de efeito:

  • r = |±1| → relação linear perfeita;
  • r = |±0,70| → relação linear forte;
  • r = |±0,50| → relação linear moderada;
  • r = |±0,30| → relação linear fraca;
  • r = 0 → ausência de relação linear.

Note que as interpretações são simétricas, independentemente de o coeficiente ser positivo ou negativo. Além disso, as sugestões acima não são prescritivas. Isto quer dizer, portanto, que pesquisadores devem sempre interpretar seus coeficientes à luz da literatura de suas respectivas áreas de pesquisa.

Como avaliar a correlação através do coeficiente de determinação?

O valor bruto do coeficiente de correlação, r, indica a força da relação entre variáveis. Entretanto, podemos ter uma melhor noção de seu significado através do coeficiente de determinação, dado por r2. Em outras palavras, podemos pensar nesse coeficiente como uma medida de tamanho de efeito da correlação. Além disso, o r2, se multiplicado por 100, fornece uma medida percentual de quanta variância uma variável explica da outra. Essa medida é chamada de variãncia explicada ou compartilhada entre variáveis.

Por exemplo, se r = 0,10, então 1% da variância de uma variável pode ser explicada pela outra, pois r2 = 0,102 = 0,01. Por outro lado, se r = 0,30, então 9% da variância de uma variável pode ser explicada pela outra, pois r2 = 0,302 = 0,09. Outros valores são apresentados na Figura 2.

Figura 2. Relação entre o r de Pearson e o coeficiente de determinação (r2).

Em síntese, interpretar o r2 pode trazer maior clareza sobre o quanto os construtos encontram-se relacionados.

Reforçando, é importante que se tenha em mente que sugestões de interpretação são sempre arbitrárias. É possível que, em um contexto de competições esportivas de alto rendimento, um r2 = 0,09 tenha relevância prática, enquanto em um contexto de treinamento cognitivo, um r2 = 0,36 seja de pouca aplicabilidade, devido aos custos financeiros e de tempo para implementação do treinamento.

A mensagem final é que, para determinar se o tamanho de efeito é forte ou não, é preciso sempre olhar o contexto de pesquisa ou de aplicação no qual ele está inserido.

Conclusão

Neste post, você aprendeu o que é correlação, um conceito fundamental de metodologia científica, sobre o qual se alicerçam diversas técnicas estatísticas mais sofisticadas, como, por exemplo, a análise de regressão múltipla e a modelagem por equações estruturais. Por fim, você aprendeu o que é e como interpretar os coeficientes de correlação e de determinação.

No entanto, o coeficiente de correlação de Pearson apresentado nesse post não é o único existente. Algumas alternativas não paramétricas à correlação de Pearson incluem, por exemplo, os coeficientes ρ (letra grega rho) de Spearman e τ (letra grega tau) de Kendall, que mensuram a relação monotônica entre variáveis.

Gostou desse conteúdo? Precisa aprender análise de dados? Então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Cohen, J. (1992). Statistical power analysis. Current Directions in Psychological Science, 1(3), 98–101. https://doi.org/10.1111/1467-8721.ep10768783

Rumsey, D. J. (2023, 6 de fevereiro). What is r value correlation? Dummies. https://www.dummies.com/article/academics-the-arts/math/statistics/how-to-interpret-a-correlation-coefficient-r-169792/

Como citar este post

Lima, M. (2021, 2 de fevereiro). O que é correlação? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-correlacao/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

 

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

 

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Qual é a diferença entre covariância e correlação?

O que são médias marginais?

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é regressão linear múltipla?

Postados recentemente

Como escrever uma revisão sistemática? A declaração PRISMA

Como definir a ordem de autoria do artigo científico?

Como realizar o teste de Shapiro-Wilk no JASP?

Bolsas de mestrado e de doutorado: como conseguir?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias