Neste post, você aprenderá o que é correlação policórica. A fim de facilitar sua compreensão, apresentaremos um exemplo simples, acompanhado de representações gráficas e tabulares. Desse modo, nosso foco é a compreensão conceitual da técnica. Esperamos, com isso, que você consiga compreender esse importante conceito da análise quantitativa de dados.
O que são variáveis politômicas ordinais?
As variáveis politômicas ordinais são aquelas que possuem três ou mais categorias distintas, que podem ser ordenadas, mas que não são contínuas.
Por exemplo, os respondentes podem avaliar os itens “Eu gosto de trabalhar em equipe” e “Acredito que o trabalho em equipe gera melhores resultados” por meio das alternativas da Tabela 1.
1 | Discordo totalmente |
2 | Discordo parcialmente |
3 | Não concordo, nem discordo |
4 | Concordo parcialmente |
5 | Concordo totalmente |
Nesta escala, os valores 1, 2, 3, 4 e 5 não têm um representação numérica direta. Sendo assim, seria incorreto afirmar que a concordância de quem assinala a alternativa 4 é o dobro da concordância de quem assinala a alternativa 2.
No entanto, podemos ordenar as categorias. Por exemplo, podemos ordenar da menor concordância para a maior concordância. Dessa forma, sabemos que “Concordo parcialmente” implica maior concordância que “Não concordo, nem discordo”. Em contrapartida, seria errado ordenarmos as alternativas conforme a Tabela 2.
1 | Não concordo, nem discordo |
2 | Discordo parcialmente |
3 | Discordo totalmente |
4 | Concordo totalmente |
5 | Concordo parcialmente |
Para concluir, existem variáveis que politômicas, mas que não são ordinais. Por exemplo, a religião é uma variável categórica politômica (i.e., tem mais de duas categorias), cujas alternativas de resposta podem apenas ser dispostas em sequências arbitrárias.
Os dados típicos de instrumentos de autorrelato
Em ciências sociais e comportamentais, é comum que pesquisadores utilizem a pesquisa por survey e instrumentos de autorrelato para investigar opiniões, atitudes, preferências, valores, traços de personalidade e sintomas dos respondentes.
Por exemplo, os respondentes podem avaliar os itens “Eu gosto de trabalhar em equipe” e “Acredito que o trabalho em equipe gera melhores resultados” por meio de uma escala de cinco pontos, de 1 (Discordo totalmente) a 5 (Concordo totalmente).
A Figura 1 apresenta as respostas de cinco respondentes, de um banco de dados simulados com 1.000 casos.
A correlação de Pearson entre as respostas de nossos 1.000 participantes simulados foi de 0,39. Contudo, veremos a seguir que a correlação policórica é mais adequada, sobretudo se assumirmos variáveis latentes subjacentes às respostas a esses itens.
O que é a correlação policórica?
A correlação policórica (rpoly) é uma medida da associação entre duas variáveis politômicas ordinais. Ela assume que, por trás dessas variáveis observadas, existem variáveis latentes que seguem uma distribuição normal bivariada.
Em outras palavras, a correlação policórica tenta estimar qual seria a correlação entre as variáveis observadas se elas tivessem sido medidas de forma contínua, ao invés de politômica ordinal, como em escalas Likert e tipo Likert.
Veja também: Entenda o que é escala Likert
Qual é a lógica da correlação policórica?
Consideremos os Itens 1 e 2 apresentados anteriormente. Embora as respostas sejam politômicas ordinais, supomos que, por trás dessas respostas, as atitudes em relação ao trabalho em equipe seguem distribuições normais bivariadas.
Se os participantes tivessem respondido a uma escala contínua (analógica), a relação entre as variáveis poderia ser ilustrada por um padrão linear positivo, como mostrado na Figura 2.
A Figura 2 sugere uma relação linear positiva entre os Itens 1 e 2. No entanto, na realidade, as respostas foram dadas em uma escala com cinco alternativas.
Ao usar uma escala politômica com k pontos, assumimos a existência de k − 1 limiares que delimitam as transições entre categorias de resposta adjacentes. Esses limiares definem intervalos do escore latente contínuo associados a cada categoria de resposta.
Por exemplo, no Item 1, temos os limiares a1, a2, a3 e a4; no Item 2, os limiares b1, b2, b3 e b4. O valor do escore latente do participante determina sua resposta.
A Figura 3 sumariza essa ideia. Nela, plotamos as distribuições latentes contínuas subjacentes aos Itens 1 e 2. As linhas pontilhadas representam os limiares de transição entre as categorias de respostas de cada item.
Por exemplo, considere um participante com escore latente de 0,5 no Item 1 e de 1,5 no Item 2. No Item 1, o participante responderá “Concordo parcialmente” (4), pois a3 < 0,5 < a4; no Item 2, ele responderá “Concordo totalmente” (5), pois 1,5 > b4.
A tabela de contingências associando os padrões de respostas a dois itens
Como os Itens 1 e 2 possuem cinco categorias de resposta cada, podemos sumarizar o padrão contínuo da Figura 3 em uma tabela de contingências 5 × 5 das frequências observadas em nossos dados (Figura 4).
Conforme veremos a seguir, nosso objetivo é, com base na tabela de contingências, tentar “recuperar” as distribuições das variáveis latentes subjacentes ao padrão de respostas e, a partir delas, estimar o coeficiente de correlação entre essas variáveis latentes.
Qual problema a correlação policórica busca solucionar?
A correlação policórica busca estimar a correlação de Pearson entre as variáveis latentes subjacentes às respostas observadas, com base nessas respostas. Primeiramente, estimamos os k – 1 limiares subjacentes às transições de respostas de cada item. Em nosso exemplo, estimamos (5 – 1)² = 16 limiares para os Itens 1 e 2.
Em seguida, com base nos limiares estimados e na tabela de contingências 5 × 5, estimamos a correlação de Pearson das variáveis latentes, por meio da estimação pela máxima verossimilhança.
Por exemplo, na simulação de nossos dados, assumimos uma correlação latente entre os Itens 1 e 2 de rho = 0,50. Contudo, nossos dados amostrais (N = 1.000) indicaram uma correlação ligeiramente menor, r = 0,46.
Depois disso, discretizamos nossas variáveis, a fim de simular os padrões de respostas politômicas ordinais dos participantes. A correlação de Pearson entre essas variáveis foi de 0,39, isto é, o baixo número de categorias subestimou nosso parâmetro de interesse.
Por outro lado, usando a correlação policórica, obtivemos uma estimativa de rpoly = 0,44, que foi uma estimativa muito mais próxima do valor populacional original (rho = 0,50), que aquela usando a correlação de Pearson.
Qual é a utilidade da correlação policórica?
Em psicometria, variáveis politômicas ordinais são frequentemente usadas em instrumentos de autorrelato para medir traços psicológicos. Esses traços, como neuroticismo ou extroversão, são comumente considerados como variáveis latentes contínuas, que seguem uma distribuição normal.
A correlação policórica, portanto, quantifica o grau de associação entre essas variáveis politômicas ordinais, assumindo que, subjacentes a essas medidas, temos variáveis latentes contínuas. Em outras palavras, a correlação policórica é útil para estimar qual seria a correlação entre essas variáveis se fossem medidas de forma contínua e com distribuições normais bivariadas.
Além disso, a correlação policórica é amplamente utilizada em análise fatorial com dados ordinais. Ela permite substituir a matriz de correlação de Pearson por uma matriz que reflete a associação entre as variáveis politômicas ordinais, o que tende a reproduzir melhor o modelo de mensuração verdadeiro em análises fatoriais.
Saiba mais: Análise fatorial exploratória ou análise fatorial confirmatória: qual escolher?
Conclusão
Neste post, você aprendeu sobre a correlação policórica. Recomendamos que você também conheça a correlação tetracórica, um caso particular da correlação policórica aplicado a variáveis dicotômicas.
Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Holgado-Tello, F. P., Chacón-Moscoso, S., Barbero-García, I., & Vila-Abad, E. (2010). Polychoric versus Pearson correlations in exploratory and confirmatory factor analysis of ordinal variables. Quality & Quantity, 44, 153–166. https://doi.org/10.1007/s11135-008-9190-y
Olsson, U. (1979). Maximum likelihood estimation of the polychoric correlation coefficient. Psychometrika, 44(4), 443–460. https://doi.org/10.1007/BF02296207
Como citar este post
Lima, M. (2024, 31 de dezembro). O que é correlação policórica? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-correlacao-policorica/