O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Medidas de associação: coeficiente phi e V de Cramér

Marcos Lima

ago 7, 2023

Neste post, vamos explorar duas medidas de tamanho de efeito para o teste qui-quadrado de independência: o coeficiente phi e o V de Cramér.

Introdução

Em muitas situações, pesquisadores investigam a associação entre duas variáveis categóricas. Por exemplo, pode-se investigar se há associação entre coorte geracional (geração X, Y, Z) e rede social preferida (Instagram, Facebook, TikTok, Twitter).

No exemplo anterior, as variáveis permitem apenas operações de contagem (frequência absoluta e percentual, moda), necessitando assim de técnicas estatísticas adequadas para suas análises. Uma boa escolha é o qui-quadrado de independência, acompanhado de medidas de tamanho de efeito para testes de associação.

O que é o teste qui-quadrado de independência?

O teste qui-quadrado de independência é uma técnica estatística que compara as frequências observadas de casos que ocorrem em cada uma das categorias com as frequências que seriam esperadas se não houvesse associação entre as duas variáveis.

Esse teste calcula uma estatística, denominada de χ2 (χ é a letra grega chi), que é comparada com uma distribuição de χ2, cujos valores variam de zero a infinito. Se o valor de χ2 em nossa amostra for mais extremo que um valor crítico de referência dessa distribuição, então rejeitamos a hipótese nula de não associação entre variáveis.

O teste qui-quadrado, quando estatisticamente significativo, permite a conclusão de que há associação entre variáveis. Por exemplo, se estivermos comparando coorte geracional e preferência por redes sociais, nossa conclusão seria de que essas duas variáveis estão associadas, isto é, diferentes coortes geracionais preferem redes sociais distintas.

Mas qual é o tamanho dessa associação? Infelizmente, essa informação não é fornecida pela estatística χ2. Sendo assim, para estimarmos o tamanho da associação, precisamos recorrer a medidas de tamanho de efeito.

O que são medidas de tamanho de efeito?

Enquanto o teste de significância da hipótese nula tradicionalmente enfatiza uma decisão dicotômica entre rejeitar ou não rejeitar a hipótese nula, medidas de tamanho de efeito permitem uma apreciação dos resultados em termos de “níveis de falsidade da hipótese nula”.

Sendo assim, o conceito de tamanho de efeito está relacionado à ideia de importância prática dos resultados (Kelley & Preacher, 2012). Em síntese, no contexto do teste qui-quadrado de independência, medidas de associação forneceriam uma síntese numérica da força da associação entre variáveis.

No exemplo das redes sociais, uma associação forte indicaria que saber a idade de uma pessoa seria altamente preditivo de qual rede social ela prefere, enquanto uma associação fraca sugeriria que nossa predição não é assim tão confiável.

Em seguida, explicaremos duas medidas de associação para o teste qui-quadrado de independência.

Coeficiente phi

O que é o coeficiente phi?

O coeficiente φ (a letra grega phi) é uma medida de associação entre duas variáveis binárias. No entanto, para o coeficiente phi ser uma medida viável, é necessário que ambas as variáveis de interesse tenham apenas duas categorias (p.ex., doente/não doente, vivo/morto, cachorro/gato).

Note que a variável não precisa genuinamente ter apenas dois níveis no mundo real. Por exemplo, sabemos que animais podem ser classificados em outras categorias além de cães e gatos. O importante para o cálculo do coeficiente  é que, na amostra, o pesquisador tenha codificado a variável como tendo apenas dois níveis.

Como calcular o coeficiente phi?

Eis um exemplo: pesquisadores recrutam uma coorte de participantes nascidos entre 1965 e 1980 (geração X), e outra de participantes nascidos entre 1997 e 2012 (geração Z). Em seguida, pesquisadores solicitam que os participantes respondam à seguinte pergunta: qual é sua rede social preferida?

A Figura 1 apresenta uma tabela de contingências 2 × 2 com os resultados dessa pesquisa. Por exemplo, a célula A indica que 37 participantes da geração X preferem o Facebook, enquanto a célula D indica que 55 participantes da geração Z preferem o TikTok.

tabela de contingências 2 × 2.
Figura 1. Tabela de contingências 2 × 2.

O coeficiente phi é calculado da seguinte forma:

fórmula do coeficiente phi.

onde A, B, C e D se referem às quatro células da Figura 1. Aplicado aos dados da Figura 1, temos:

como calcular o coeficiente phi.

Desse modo, φ = 0,53, indicando uma associação entre coorte e preferência por rede social: há uma preferência pelo Facebook por parte de participantes da geração X, e pelo TikTok por parte de participantes da geração Z.

Se todas as observações da amostra estiverem concentradas na diagonal principal (células A e D), então o valor do numerador será idêntico ao do denominador. Desse modo, φ = 1, indicando associação perfeita entre as variáveis.

Por outro lado, se o produto das células da diagonal principal for igual ao produto dos elementos da diagonal secundária (AD = BC), o numerador resultará em zero e, por conseguinte, φ = 0.

Sendo assim, concluímos que a fórmula do coeficiente phi calcula em que medida as células da diagonal principal são mais (ou menos) populosas que as células da diagonal secundária.

Como interpretar o sinal do coeficiente phi?

Como a rede social é uma variável nominal, poderíamos inverter a ordem de apresentação das colunas. Embora isso não impacte o denominador da fórmula do coeficiente , tal inversão afeta o numerador: os valores calculados nos dois termos de AD – BC trocam de posição com a inversão das colunas. Sendo assim, essa inversão teria um efeito sobre o sinal do coeficiente phi.

As Figuras 3 e 4 ilustram essa ideia: o sinal do coeficiente phi, portanto, indica apenas se as células da diagonal principal (Figura 3) ou da diagonal secundária (Figura 4) são as mais frequentes.

coeficiente phi positivo.
Figura 3. Células mais populosas quando o coeficiente phi é positivo.
coeficiente phi negativo.
Figura 4. Células mais populosas quando o coeficiente phi é negativo.

Como calcular o coeficiente phi com base no teste qui-quadrado?

Na penúltima seção, apresentamos a fórmula do coeficiente phi com base na tabela de contingências 2 × 2. Uma forma ainda mais simples de calculá-lo é com base na estatística do teste qui-quadrado:

fórmula alternativa do coeficiente phi.

onde N é o total de observações na amostra. Com base nessa fórmula, teríamos:

exemplo de cálculo do coeficiente phi.

O que leva a resultados similares aos reportados anteriormente, exceto por pequenas diferenças de arredondamento. Além disso, vale ressaltar que, nessa fórmula alternativa, o valor do coeficiente será sempre positivo.

V de Cramér

O que é o V de Cramér?

O V de Cramér é uma generalização do coeficiente phi, isto é, ele também expressa a força da associação entre duas variáveis nominais. No entanto, diferente do coeficiente phi, o V de Cramér também se aplica a variáveis politômicas (p.ex., onívoro/vegetariano/vegano, autoritário/democrático/laissez-faire, Instagram/Facebook/TikTok/Twitter).

Como calcular o V de Cramér?

O V de Cramér é calculado a partir da estatística do teste qui-quadrado:

onde m e n representam o número de linhas e o número de colunas, respectivamente, da tabela de contingências. Desse modo, em uma tabela de contingências 2 × 2, o denominador da fórmula se reduz a N, fazendo com que o coeficiente phi e V produzam resultados idênticos.

Para ilustrar o cálculo do V de Cramér, modificaremos o exemplo anterior, acrescentando 20 participantes da geração X e 10 da geração Z à amostra original. Esses novos participantes preferem o Instagram como rede social. As demais células são idênticas as do exemplo anterior, conforme mostra a Figura 5.

tabela de contingências 2 × 3.
Figura 5. Tabela de contingências 2 × 3.

Aplicando a fórmula do V de Cramér, temos:

como devemos calcular e interpretar o V de Cramér.

Esse resultado indica uma associação grande entre coorte e preferência por rede social. Contudo, o valor diminuiu um pouco em relação ao exemplo anterior por conta da inclusão de participantes que preferem o Instagram, que diminuiu a preferência relativa em cada coorte por uma determinada categoria modal (i.e., Facebook para a geração X; TikTok para a geração Z).

Quando usar o coeficiente phi e o V de Cramér?

Você pode usar tanto o coeficiente phi quanto o V de Cramér para medir a força da associação entre duas variáveis categóricas. Todavia, a escolha entre phi e V depende do número de categorias que cada uma das variáveis possui.

Use o coeficiente phi apenas quando sua análise se basear em tabelas de contingências 2 × 2. Por outro lado, use o V de Cramér quando você tiver mais de duas categorias para uma ou ambas as variáveis.

Como interpretar os valores do coeficiente phi e do V de Cramér?

Para a tabela de contingências 2 × 2, o coeficiente phi pode ser interpretado da seguinte maneira (Kotrlik et al., 2011):

  • 0 ≤ φ < 0,10: irrisório;
  • 0,10 ≤ φ < 0,20: fraco;
  • 0,20 ≤ φ < 0,40: moderado;
  • 0,40 ≤ φ < 0,60: relativamente forte;
  • 0,60 ≤ φ < 0,80: forte;
  • 0,80 ≤ φ < 1: muito forte;
  • φ = 1: perfeito.

A interpretação é análoga quando consideramos valores negativos.

Por outro lado para interpretar o V de Cramér, também precisamos considerar os graus de liberdade do teste qui-quadrado de independência correspondente. Assim, uma sugestão é apresentada na Figura 6 (Cohen, 1988).

tabela de como interpretar o V de Cramér com base nos graus de liberdade do modelo.
Figura 6. Sugestão de interpretação do V de Cramér.

Ressaltamos, contudo, que essas orientações não são de caráter prescritivo. Desse modo, é importante que a força da associação seja considerada à luz da sua área de pesquisa.

Conclusão

Neste post, apresentamos duas medidas de associação para o teste qui-quadrado de independência, a saber, o coeficiente phi e o V de Cramér. Se você quiser saber mais sobre o teste qui-quadrado de independência, então recomendamos que leia nosso post sobre o tema.

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed). Lawrence Erlbaum Associates, Publishers.

Kelley, K., & Preacher, K. J. (2012). On effect size. Psychological Methods, 17(2), 137–152. https://doi.org/10.1037/a0028086

Kotrlik, J. W., Williams, H. A., & Jabor, M. K. (2011). Reporting and interpreting effect size in quantitative agricultural education research. Journal of Agricultural Education, 52(1), 132–142. https://doi.org/10.5032/jae.2011.01132

Howell, D. C. (2013). Alternative correlational techniques. In D. C. Howell, Statistical methods for psychology (8th ed., pp. 303–324). Wadsworth Cengage Learning.

Como citar este post

Lima, M. (2023, 7 de agosto). Medidas de associação: Coeficiente phi e V de Cramér. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/medidas-de-associacao-coeficiente-phi-e-v-de-cramer/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Razão de chances (odds ratio): o que é, como calcular e como interpretar?

Tamanho de efeito: Delta Glass (Glass´ Delta)

Tamanho de efeito: g de Hedges (Hedges’s g)

Conteúdo

Mais lidos

O que é correlação de Pearson?

O que é o teste de Shapiro-Wilk?

Teste t de Student

Qual é a diferença entre R e RStudio?

Postados recentemente

Como montar e organizar o banco de dados no SPSS?

O que é ensaio clínico randomizado?

Como fazer o cálculo de tamanho amostral no G*Power?

Qual é a diferença entre sensibilidade e especificidade?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias