O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Qual é a diferença entre covariância e correlação?

Marcos Lima

fev 18, 2024

Em muitas situações da pesquisa científica, deparamo-nos com os conceitos de covariância e de correlação. Por isso, é importante que pesquisadores desde cedo compreendam o significado e a diferença entre esses dois conceitos.

Por exemplo, considere que pesquisadores estão interessados em investigar se existe relação entre o tempo dedicado à elaboração de um projeto de pesquisa e a nota obtida nesse mesmo projeto. Nesse cenário, o interesse é avaliar se as variáveis covariam ou se correlacionam.

Você sabe o que significa covariância e correlação? Conhece a principal diferença entre esses dois conceitos? Neste post, traduziremos esses conceitos em uma linguagem acessível, fornecendo uma visão abrangente e intuitiva sobre eles.

O que é um diagrama de dispersão?

Antes de mais nada, um diagrama de dispersão pode ser entendido como uma representação gráfica que salienta a relação existente entre duas variáveis quantitativas.

Por exemplo, o diagrama de dispersão da Figura 1 ilustra a relação entre o tempo dedicado à elaboração de um projeto de pesquisa e a nota obtida nesse projeto.

Ilustra a utilidade de um diagrama de dispersão para descrever a relação entre duas variáveis quantitativas.
Figura 1. Exemplo de diagrama de dispersão. Pontos indicados pelas setas são mencionados no texto.

Em um diagrama de dispersão, cada ponto representa os escores obtidos para uma dada observação em duas variáveis distintas. Por exemplo, o ponto indicado pela seta vermelha da Figura 1 representa o candidato da amostra que menos tempo se dedicou à elaboração de seu projeto de pesquisa (5,36 horas), tendo ele obtido uma nota relativamente baixa (3,59 de 10) em seu projeto.

Por outro lado, o ponto indicado pela seta verde representa o candidato que dedicou mais tempo à elaboração de seu projeto (44,33 horas), tendo ele obtido uma nota relativamente alta (8,21 de 10) em seu projeto. Um diagrama de dispersão é uma representação gráfica útil para a identificação visual preliminar de tendências nos dados.

O que é covariância?

A covariância é uma medida que expressa o grau de interdependência entre duas variáveis. Pode-se pensar na covariância como um índice de variabilidade conjunta, que indica se a variabilidade das duas variáveis possui alguma tendência.

Tomando como referência a Figura 1, você pode notar que os pontos apresentam uma tendência crescente: à medida que o tempo dedicado à elaboração do projeto aumenta, a nota obtida no projeto também tende a aumentar. Essa tendência é indicada pela linha pontilhada, que sumariza a relação entre as duas variáveis. Nesse exemplo, a covariância entre variáveis é de 10,81.

No entanto, se considerássemos o tempo dedicado a atividades de lazer e a nota obtida no projeto, seria possível que candidatos que dedicam maior tempo a atividades de lazer tendem a obter notas menores no projeto. Isso indicaria uma tendência decrescente, denotada por uma covariância com valor negativo.

Em geral, pesquisadores não costumam reportar nem interpretar os valores da covariância, pois esses valores dependem da unidade de medida das variáveis. Por exemplo, se as notas dos projetos tivessem sido dadas em uma escala de 0 a 100, isso aumentaria do primeiro exemplo de 10,81 para aproximadamente 1.081.

Claramente, a dependência que a covariância tem da unidade de medida usada na pesquisa é uma desvantagem, pois não queremos usar uma estatística cujo valor mudará drasticamente se medirmos nossa variável em quilômetros ou em milhas, por exemplo.

Em síntese, o que queremos é uma medida que seja independente da unidade de medida e, ao mesmo tempo, de fácil interpretação. Como veremos a seguir, a correlação satisfaz essas propriedades.

Qual é a diferença da correlação para a covariância?

A correlação é uma medida que expressa o grau de interdependência entre duas variáveis em uma métrica que independe da unidade de mensuração. Note que o trecho em negrito é o que distingue a definição da correlação da definição da covariância.

A correlação pode ser pensada como uma padronização do valor da covariância, resultando em um índice que varia entre –1 e +1. Desse modo, o valor da correlação fornece duas informações cruciais.

  • O sinal da correlação indica a direção da relação entre variáveis. Um sinal positivo indica que, à medida que uma variável aumenta, a outra também tende a aumentar. Um sinal negativo indica que, à medida que uma variável aumenta, a outra tende a diminuir;
  • O valor numérico da correlação indica a força da relação entre as variáveis. Quanto mais próximo de –1 ou +1, mais forte é a relação entre as variáveis; e quanto mais próximo de zero, mais fraca é essa relação.

É importante enfatizar que os termos positivo e negativo se referem apenas à direção da relação das variáveis, e não a um julgamento de valor sobre a relação observada.

Como interpretar o coeficiente de correlação?

No exemplo do projeto de pesquisa (Figura 1), a correlação é de r = 0,71, onde r denota o coeficiente de correlação de Pearson. Na ausência de sinal, considere que o símbolo de positivo, “+”, está implícito no coeficiente. Em caso de relação negativa, o símbolo de negativo, “–”, deverá ser explicitamente apresentado.

Uma correlação de r = 0,71 indica uma relação positiva e forte entre o tempo dedicado à elaboração de um projeto de pesquisa e a nota obtida. Além disso, ressaltamos que esse valor é invariante a transformações lineares das variáveis. Por exemplo, mesmo que as notas fossem expressas entre 0 e 100, ou que o tempo dedicado ao projeto fosse expresso em minutos, o r obtido ainda seria o mesmo.

Qual é a relação entre o diagrama de dispersão e o coeficiente de correlação?

Os diagramas de dispersão da Figura 2 ilustram outros padrões nos dados e seus respectivos coeficientes de correlação.

Ilustra como diferentes coeficientes de correlação estão associados a diferentes padrões gráficos no diagrama de dispersão.
Figura 2. Exemplos de diagramas de dispersão ilustrando diferentes valores de correlação.

O painel superior mostra variáveis com correlações negativas (conforme uma variável aumenta, a outra diminui), enquanto o painel inferior apresenta variáveis com correlações positivas (conforme uma variável aumenta, a outra também aumenta).

Note que, se a força da relação entre variáveis aumenta (independentemente do sinal), então os dados tendem a se alinhar em uma reta diagonal. Conforme os valores diminuem, os dados tendem a não apresentar um padrão tão claro. Por fim, quando a correlação é nula (r = 0), temos a ausência de relação linear entre variáveis (Figura 3).

Ilustra a ausência de tendência em um diagrama de dispersão com variáveis com correlação nula.
Figura 3. Exemplo de correlação nula (r próximo a zero).

Por fim, é importante ressaltar que o coeficiente de correlação de Pearson captura apenas a interdependência linear entre duas variáveis. Em outras palavras, essa estatística subestima relações não lineares. Além disso, existem outros índices de correlação comumente usados na pesquisa científica, como o ρ (rhô) de Spearman e o τ (tau) de Kendall.

Conclusão

Neste post, você aprendeu o que é covariância, o que é correlação e qual é a principal diferença entre esses conceitos. Além disso, você foi introduzido ao diagrama de dispersão, que auxilia na interpretação visual preliminar dos dados

Você também compreendeu as duas informações fornecidas pelo coeficiente de correlação: a direção e a magnitude da relação entre variáveis. Desse modo, esperamos que, daqui em diante, você seja capaz de interpretar relatos de estudos científicos que mencionam os conceitos de covariância e de correlação.

Caso queira aprender mais sobre correlação, recomendamos que leia nosso post sobre correlação de Pearson. Você também pode acompanhar nosso conteúdo sobre esse tema em nosso canal do YouTube.

Gostou desse conteúdo? Precisa aprender análise de dados? Então faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.

Howell, D. C. (2013). Correlation and regression. In D. C. Howell, Statistical methods for psychology (8th ed., pp. 252–302).

Como citar este post

Lima, M. (2024, 18 de fevereiro). Qual é a diferença entre covariância e correlação? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/covariancia-e-correlacao/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Qual é a diferença entre sensibilidade e especificidade?

O que são médias marginais?

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Conteúdo

Mais lidos

O que é correlação de Pearson?

O que é o teste de Shapiro-Wilk?

Teste t de Student

Qual é a diferença entre R e RStudio?

Postados recentemente

Como montar e organizar o banco de dados no SPSS?

O que é ensaio clínico randomizado?

Como fazer o cálculo de tamanho amostral no G*Power?

Qual é a diferença entre sensibilidade e especificidade?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias