Neste post, falaremos sobre o coeficiente phi, uma medida de associação comumente apresentada nos resultados de análises de dados categóricos.
Qual é a definição do coeficiente phi?
O coeficiente phi (a letra grega φ) é uma medida de associação entre duas variáveis binárias. Em outras palavras, para que o coeficiente φ seja uma medida de associação viável, é necessário que ambas as variáveis de interesse tenham apenas duas categorias (e.g., vivo/morto, infectado/não infectado, aprovado/reprovado).
É comum apresentarmos essa medida de tamanho de efeito juntamente à estatística do teste qui-quadrado de independência. Enquanto o teste qui-quadrado permite rejeitar ou não a hipótese nula de independência entre duas variáveis, o coeficiente φ busca quantificar a força da associação entre as variáveis.
Qual é a diferença entre o coeficiente phi e a correlação tetracórica?
O coeficiente phi surgiu como uma maneira de quantificar a associação entre variáveis binárias, em oposição à correlação tetracórica, que também se aplica a variáveis binárias, mas com uma importante diferença. A correlação tetracórica, no entanto, assume que as variáveis contínuas foram artificialmente mensuradas de maneira binária.
Por exemplo, suponha que os conhecimentos dos estudantes em português e em matemática, ao nível latente, sejam expressos por duas variáveis normalmente distribuídas. No entanto, em uma pesquisa, perguntamos ao participante apenas se ele foi aprovado ou reprovado em cada uma das disciplinas. Desse modo, subjacente à aprovação ou reprovação, temos o conhecimento latente dos participantes em cada disciplina.
Em síntese, a principal diferença entre o coeficiente phi e a correlação tetracórica diz respeito a assumirmos (no caso da correlação tetracórica) ou não assumirmos (no caso do coeficiente phi) variáveis contínuas subjacentes à variável efetivamente presente em nosso banco de dados. De particular interesse para este post, podemos usar o coeficiente phi quando a variável de interesse é genuinamente binária.
Como interpretar o coeficiente phi?
A interpretação do φ é feita de maneira similar àquela da correlação de Pearson. De fato, é útil pensarmos no φ como um análogo ao r de Pearson aplicado a variáveis nominais. O φ pode variar entre –1 e +1, onde φ = 0 indica ausência de associação entre variáveis, enquanto valores próximos aos extremos (quer –1 ou +1) indicam uma associação forte.
Veja também:
Uma vez que o coeficiente phi se aplica a variáveis dicotômicas, como devemos interpretar seu sinal? Um φ positivo indica que, em uma tabela de contingência 2 × 2, as células da diagonal principal (A e D) possuem frequências observadas maiores que as células da diagonal secundária (B e C). A Figura 1 ilustra esse cenário.
A Figura 2 representa o cenário oposto, isto é, quando o φ é negativo. Isso acontece quando as células da diagonal secundária (B e C) têm frequências observadas maiores que as células da diagonal principal (A e D).
Desse modo, as Figuras 1 e 2 indicam que a ordem das colunas afeta o sinal do φ. Essa ordem, no entanto, é arbitrária. Em outras palavras, o que determina as ordens das linhas e das colunas é a forma como codificamos as variáveis em nosso banco de dados (e.g., morto = 0 e vivo = 1; ou morto = 1 e vivo = 0).
Desse modo, podemos dar maior atenção ao valor absoluto do φ. Isto é, após calcularmos o φ, podemos inspecionar a tabela de contingência 2 × 2 para fazermos as interpretações mais adequadas ao padrão de preenchimento que nela identificamos.
Como reportar o coeficiente phi?
A seguir, apresentamos um exemplo hipotético de como reportar os resultados de uma análise.
Indivíduos das gerações X e Y foram recrutados para responder à seguinte pergunta: “Qual é a sua rede social preferida?” A Figura 3 apresenta a tabela de contingência 2 × 2 para esse delineamento, contendo as frequências observadas de respostas de preferência ao Facebook e ao TikTok dos membros das duas coortes etárias.
A Figura 3 parece sugerir que membros da geração X preferem o Facebook, enquanto membros da geração Z preferem o TikTok. Corroborando essa impressão inicial, um teste qui-quadrado de independência rejeitou a hipótese nula de não associação entre coorte etária e rede social preferida, χ2(1, N = 120) = 32,83, p < 0,001, φ = 0,53, com o coeficiente phi sugerindo uma associação de tamanho moderado para forte entre as variáveis.
Conclusão
Neste post, definimos e explicamos como interpretar o coeficiente phi, uma medida de associação para o teste qui-quadrado de independência. Se você quer um tratamento mais aprofundado desse coeficiente, juntamente com o V de Cramer, então confira nosso post sobre o tema.
Esperamos que este post tenha ajudado você a entender melhor sobre essa importante medida de associação entre variáveis binárias. Se você gostou desse conteúdo, então aproveite e inscreva-se em nosso canal do YouTube e aprimore suas habilidades em análise de dados!
Precisa aprender análise de dados? Faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referência
Espírito-Santo, H., & Daniel, F. (2017). Calcular e apresentar tamanhos do efeito em trabalhos científicos (2): Guia para reportar a força das relações. Revista Portuguesa de Investigação Comportamental e Social, 3(1), 53–64. https://doi.org/10.7342/ismt.rpics.2017.3.1.48
Howell, D. C. (2013). Alternative correlational techniques. In D. C. Howell, Statistical methods for psychology (8th ed., pp. 303–324). Wadsworth Cengage Learning.
Como citar este post
Lima, M. (2021, 11 de março). O que é o coeficiente phi? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-o-coeficiente-phi/