Neste post, apresentaremos um tutorial de como fazer o teste qui-quadrado de independência no R.
Primeiramente, descreveremos de forma breve quando usar o teste qui-quadrado de independência. Em seguida, simularemos um exemplo para uso no tutorial. Por fim, nós descreveremos o passo a passo de como realizar, interpretar e reportar os resultados de um teste qui-quadrado de independência no R.
Saiba mais: Por que aprender a programar no R?
Quando usar o teste qui-quadrado de independência?
O teste qui-quadrado de independência é usado para explorar a associação entre duas variáveis categóricas, ou seja, variáveis nominais ou ordinais. Em outras palavras, cada uma dessas variáveis pode ter duas ou mais categorias. Em resumo, esse teste compara as frequências observadas de casos que ocorrem em cada uma das categorias com as frequências que seriam esperadas se não houvesse associação entre as duas variáveis.
Por exemplo, suponha que avaliamos 100 adultos quanto aos hábitos de consumo de café (consome, não consome) e de qualidade de sono (tem insônia, não tem insônia). A Figura 1 apresenta uma tabela de contingência 2 × 2, isto é, uma representação que cruza a classificação nas duas variáveis para os 100 adultos de nossa amostra.
Nesse exemplo, desejamos explorar a relação entre consumo de café e insônia. Mais especificamente, queremos responder à seguinte pergunta: existe associação entre consumo de café e insônia? Para isso, realizaremos um teste qui-quadrado de independência no R.
Como fazer o teste qui-quadrado de independência no R?
Instalando e carregando pacotes
Neste tutorial, você precisará carregar os pacotes janitor
, para manipular dados e criar tabelas de contingência; psych
, para calcular o coeficiente φ (letra grega phi); e effectsize
, para calcular a razão de chances. Para carregar esses pacotes, execute o código abaixo.
# instalando e carregando pacotes
install.packages(c("janitor", "psych", "effectsize"))
library(janitor)
library(psych)
library(effectsize)
Você deverá executar o código da linha 2 uma única vez, mas deverá executar os códigos das linhas 3 a 5 sempre que iniciar uma nova sessão no R e precisar das funções contidas nos pacotes mencionados neste tutorial.
O código a seguir criará um banco de dados correspondente àquele apresentado na Figura 1. O banco de dados é criado em um formato denominado data.frame
, mas aqui usaremos os termos banco de dados e data.frame
de forma intercambiável. A Figura 2 apresenta as primeiras linhas do banco de dados resultante.
# criando dados
dados <- data.frame(cafe = as.factor(rep(c("Não consome", "Consome"), each = 50)),
insonia = as.factor(c(rep("Sem insônia", 28),
rep("Com insônia", 22),
rep("Sem insônia", 10),
rep("Com insônia", 40)))
)
# visualizando dados
head(dados, 10)
Manipulando o data.frame
Para converter os dados em um formato adequado para a realização do teste qui-quadrado de independência no R, usaremos a função tabyl
, do pacote janitor
, para formatar os dados em uma tabela de contingência 2 × 2. A função tabyl
recebe os argumentos dat
(o banco de dados que usaremos no tutorial), var1
e var2
(as duas variáveis que serão formatadas em uma tabela de contingência). A Figura 3 mostra o resultado dessa manipulação de dados.
# manipulando dados
freq <- janitor::tabyl(dat = dados,
var1 = cafe,
var2 = insonia)
freq
A função função adorn_totals
, do pacote janitor
, é útil para também visualizarmos as frequências marginais da tabela, isto é, a soma dos totais de cada linha e de cada coluna. A Figura 4 apresenta o resultado dessa manipulação.
# acrescentando totais marginais
freq_total <- janitor::adorn_totals(freq, where = c('row', 'col'))
freq_total
Solicitando o teste qui-quadrado
A solicitação do teste qui-quadrado de independência no R é bem simples. Usamos a função chisq.test()
do pacote janitor
passando o objeto freq
, criado anteriormente, como input para a análise. A função chisq.test()
, por padrão, realiza um teste com a correção de continuidade de Yates. Para contornarmos a configuração padrão, passamos FALSE
para o argumento correct
. Armazenamos os resultados no objeto qui.q
.
# solicitando a análise
qui.q <- janitor::chisq.test(freq, correct = FALSE)
Também solicitamos o coeficiente φ (usando a função phi
, do pacote psych
) e a razão de chances (usando a função oddsratio
, do pacote effectsize
), e armazenamos os resultados nos objetos phi
e rc
, respectivamente. Para ambas as funções, passamos o banco de dados original, dados
, indicando os nomes das colunas que serão usadas (por meio do operador $
) para calcular as medidas de tamanho de efeito.
# solicitando tamanhos de efeito
phi <- psych::phi(table(dados$cafe, dados$insonia), digits = 3)
rc <- effectsize::oddsratio(x = dados$cafe,
y = dados$insonia)
Como interpretar o teste qui-quadrado de independência no R?
A linha a seguir imprime as saídas das análises. A Figura 5 apresenta os resultados.
# checando os resultados
qui.q; phi; rc
A Figura 5 indica que o resultado do nosso teste qui-quadrado foi de 13,75, associado a 1 grau de liberdade (df = degree of freedom) e a um valor de p menor que 0,001. Desse modo, se adotarmos o nível convencional de significância de 0,05, concluíremos que observamos uma associação estatisticamente significativa entre consumo de café e insônia.
Mas quão forte é essa associação? A resposta é apresentada na linha iniciada por [1]
, que contém o coeficiente φ. O coeficiente φ pode ser interpretado de maneira análoga ao coeficiente r de Pearson. Desse modo, podemos interpretar esse valor como indicativo de uma associação moderada entre consumo de café e insônia.
Por fim, a linha que inicia com odds ratio representa a razão de chances. Esse resultado indica, portanto, que quem consume café tem cinco vezes mais chances que quem não consome de ter insônia. Contudo, com base no exemplo de delineamento que descrevemos, não é possível estabelecer a direção da associação entre as variáveis.
Como reportar os resultados do teste qui-quadrado de independência?
Os resultados de um teste qui-quadrado de independência devem fazer menção à estatística do teste, aos graus de liberdade, ao valor de p e a pelo menos uma medida de tamanho de efeito. Desse modo, com base nas normas de publicação da American Psychological Association (APA), 7ª edição, uma sugestão de relato é apresentada nos dois parágrafos a seguir. É importante notar que os resultados são hipotéticos e, por isso, podem não representar o estado da arte sobre o tema usado no tutorial.
A Figura 1 apresenta a tabela de contingência cruzando as variáveis relacionadas ao consumo de café e sintomas de insônia. Com base nesses dados, um teste qui-quadrado de independência indicou que houve associação significativa e moderada entre consumo de café e insônia, χ2(1, N = 100) = 13,75, p < 0,001, φ = 0,37.
Especificamente, enquanto quem não consome café tem uma tendência a não ter sintomas de insonia (56%), aqueles que consomem café têm uma forte tendência a ter insônia (80%). Além disso, a razão de chances (RC), RC = 5,09, IC 95% [2,09, 12,40], indicou que quem consome café tem 5,09 vezes mais chances que quem não consome de ter insônia (ou, em outras palavras, quem tem insônia, comparado a quem não tem, tem 5,09 vezes mais chances de consumir café).
Conclusão
Neste post, você viu um tutorial de como fazer o teste qui-quadrado de independência no R. Além disso, você também também aprendeu como manipular o banco de dados e como solicitar medidas de tamanho de efeito. Por fim, você viu como interpretar e reportar os resultados.
Quer aprender mais sobre R? Então veja a novidade que preparamos a seguir!
É com grande satisfação que a Psicometria Online anuncia o curso R para Iniciantes. O curso tem como objetivo abordar todos os tópicos essenciais do R, permitindo que você explore assuntos específicos sem ser prejudicado por dúvidas básicas. Se você trabalha com pesquisa científica e deseja aprender a utilizar o R, então o curso R para Iniciantes é para você.
Interessado em aprender análise de dados? Junte-se à Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça nossa estrutura completa e nunca mais passe trabalho sozinho(a).
Referência
Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R. Sage.
Como citar este post
Lima, M. (2022, 14 de novembro). Como fazer o teste qui-quadrado de independência no R? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/teste-qui-quadrado-de-independencia-no-r/