O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é correlação tetracórica?

Marcos Lima

dez 31, 2024

Neste post, você aprenderá o que é correlação tetracórica. A fim de facilitar sua compreensão, apresentaremos um exemplo simples, acompanhado de representações gráficas e tabulares. Desse modo, nosso foco é a compreensão conceitual da técnica. Esperamos, com isso, que você consiga compreender esse importante conceito da análise quantitativa de dados.

Os dados típicos de instrumentos de autorrelato

Em ciências sociais e comportamentais, é comum que pesquisadores utilizem a pesquisa por survey e instrumentos de autorrelato, a fim de investigar opiniões, atitudes, preferências, valores, traços de personalidade e sintomas dos respondentes.

Por exemplo, os respondentes podem avaliar os itens “Eu gosto de trabalhar em equipe” e “Acredito que o trabalho em equipe gera melhores resultados” por meio das alternativas “Discordo” e “Concordo”. Em tais casos, é comum que pesquisadores atribuam os valores 0 e 1 às categorias “Discordo” e “Concordo”, respectivamente.

A Figura 1 apresenta as respostas de cinco respondentes, de um banco de dados simulados com 500 casos.

banco de dados que pode ser submetido à análise de correlação tetracórica.
Figura 1. Dados típicos de instrumento de autorrelato. Nas colunas dos Itens 1 e 2, 1 = Discordo e 2 = Concordo.

A correlação de Pearson entre as respostas de nossos 500 participantes simulados foi de 0,41. Contudo, veremos a seguir que a correlação tetracórica é mais adequada, sobretudo se assumirmos variáveis latentes subjacentes às respostas a esses itens.

O que é a correlação tetracórica?

A correlação tetracórica (rtet) é uma medida da associação entre duas variáveis dicotômicas. Ela assume que, por trás dessas variáveis observadas, existem variáveis latentes que seguem uma distribuição normal bivariada.

Em outras palavras, a correlação tetracórica tenta estimar qual seria a correlação entre as variáveis observadas se elas tivessem sido medidas de forma contínua, ao invés de dicotômica.

Qual é a lógica da correlação tetracórica?

Por exemplo, vamos considerar novamente os Itens 1 e 2 apresentados na seção anterior. Embora as respostas em nossa escala sejam dicotômicas (“Discordo” vs. “Concordo”), supomos que, por trás dessas respostas, as atitudes em relação ao trabalho em equipe sigam distribuições contínuas.

Agora, imagine que nossa amostra de 500 participantes tivesse respondido aos itens usando uma escala contínua (analógica). Nesse caso, a Figura 2 ilustra uma possível relação entre as variáveis contínuas.

associação latente que pode ser estimada pela correlação tetracórica.
Figura 2. Diagrama de dispersão relacionando os Itens 1 e 2 em uma escala contínua.

A Figura 2 sugere uma relação linear positiva entre os Itens 1 e 2. No entanto, como sabemos, as respostas foram dadas em uma escala dicotômica.

Desse modo, podemos assumir que um limiar subjacente às variáveis latentes contínuas é o que determina se o participante responde “Discordo” ou “Concordo” aos enunciados dos itens.

A Figura 3 ilustra essa ideia. Nela, plotamos as distribuições latentes contínuas subjacentes aos Itens 1 e 2. As linhas pontilhadas representam os limiares de transição entre as categorias de respostas. Um participante com um escore abaixo do limiar de um item responderá “Discordo”, enquanto um participante com um escore acima do limiar de um item responderá “Concordo”.

lógica da correlação tetracórica.
Figura 3. Lógica da correlação tetracórica.

Sendo assim, o padrão contínuo, representado no diagrama de dispersão da Figura 3, resume-se a quatro quadrantes, com os padrões possíveis de respostas, indicados pelos cruzamentos de “Discordo” e “Concordo” nos Itens 1 e 2. Isso é o equivalente à tabela de contingências 2 × 2 das frequências observadas em nossos dados (Figura 4).

tabela de contingência cruzada.
Figura 4. Tabela de contingências 2 × 2.

Qual problema a correlação tetracórica busca solucionar?

A correlação tetracórica busca estimar a correlação de Pearson entre as variáveis latentes subjacentes às respostas observadas, com base nessas respostas. Primeiramente, estimamos os limiares subjacentes às transições de respostas (em nosso exemplo, de “Discordo” para “Concordo”).

Em seguida, com base nos limiares estimados e na tabela de contingências 2 × 2, estimamos a correlação de Pearson das variáveis latentes, por meio da estimação pela máxima verossimilhança.

Por exemplo, na simulação de nossos dados, assumimos uma correlação latente entre os Itens 1 e 2 de 0,70. Contudo, nossos dados amostrais (N = 500) indicaram uma correlação ligeiramente menor, r = 0,69.

Depois disso, dicotomizamos nossas variáveis, a fim de simular os padrões de respostas dicotômicas dos participantes. A correlação de Pearson entre essas variáveis foi de 0,41, isto é, o baixo número de categorias atenuou nossa estimativa.

Por outro lado, usando a correlação tetracórica, obtivemos uma estimativa de rtet = 0,63, que foi uma estimativa muito mais próxima do valor populacional original (rho = 0,70), que aquela usando a correlação de Pearson.

Qual é a utilidade da correlação tetracórica?

Em psicometria, variáveis dicotômicas são frequentemente usadas para medir traços psicológicos. Esses traços, como neuroticismo ou extroversão, são comumente considerados como variáveis latentes contínuas, que seguem uma distribuição normal.

A correlação tetracórica, então, quantifica o grau de associação entre essas variáveis dicotômicas, assumindo que, subjacentes a essas medidas, temos variáveis latentes contínuas. Em outras palavras, a correlação tetracórica é útil para estimar qual seria a correlação entre essas variáveis se fossem medidas de forma contínua e com distribuições normais bivariadas.

Além disso, a correlação tetracórica é amplamente utilizada em análise fatorial com dados ordinais, pois ela permite substituir a matriz de correlação de Pearson por uma matriz que reflete a associação entre as variáveis dicotômicas. Desse modo, podemos reproduzir melhor o modelo de mensuração verdadeiro em análises fatoriais.

Saiba mais: Análise fatorial exploratória ou análise fatorial confirmatória: qual escolher?

análise fatorial exploratória versus análise fatorial confirmatória.

Conclusão

Neste post, você aprendeu sobre a correlação tetracórica. Recomendamos que você também conheça a correlação policórica, uma generalização da correlação tetracórica, aplicada para variáveis politômicas ordinais.

Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Holgado-Tello, F. P., Chacón-Moscoso, S., Barbero-García, I., & Vila-Abad, E. (2010). Polychoric versus Pearson correlations in exploratory and confirmatory factor analysis of ordinal variables. Quality & Quantity, 44, 153–166. https://doi.org/10.1007/s11135-008-9190-y

Olsson, U. (1979). Maximum likelihood estimation of the polychoric correlation coefficient. Psychometrika, 44(4), 443–460. https://doi.org/10.1007/BF02296207

Como citar este post

Lima, M. (2024, 31 de dezembro). O que é correlação tetracórica? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-correlacao-tetracorica/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Regressão linear e regressão logística: quais são suas diferenças?

Conheça o teste z, o teste t e o teste F

E-book Análises Bi e Multivariadas: Definições e Usos

Conteúdo

Mais lidos

O que é correlação de Pearson?

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Teste t de Student

Postados recentemente

Qual é o papel da matemática na carreira de psicometrista?

Regressão linear e regressão logística: quais são suas diferenças?

Conheça o teste z, o teste t e o teste F

O que é o coeficiente kappa de Cohen?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias