O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Como fazer o teste qui-quadrado de independência no R?

Marcos Lima

nov 14, 2022

Neste post, apresentaremos um tutorial de como fazer o teste qui-quadrado de independência no R.

Primeiramente, descreveremos de forma breve quando usar o teste qui-quadrado de independência. Em seguida, simularemos um exemplo para uso no tutorial. Por fim, nós descreveremos o passo a passo de como realizar, interpretar e reportar os resultados de um teste qui-quadrado de independência no R.

Saiba mais: Por que aprender a programar no R?

Quando usar o teste qui-quadrado de independência?

O teste qui-quadrado de independência é usado para explorar a associação entre duas variáveis categóricas, ou seja, variáveis nominais ou ordinais. Em outras palavras, cada uma dessas variáveis pode ter duas ou mais categorias. Em resumo, esse teste compara as frequências observadas de casos que ocorrem em cada uma das categorias com as frequências que seriam esperadas se não houvesse associação entre as duas variáveis.

Por exemplo, suponha que avaliamos 100 adultos quanto aos hábitos de consumo de café (consome, não consome) e de qualidade de sono (tem insônia, não tem insônia). A Figura 1 apresenta uma tabela de contingência 2 × 2, isto é, uma representação que cruza a classificação nas duas variáveis para os 100 adultos de nossa amostra.

Figura 1. Tabela de contingência 2 × 2 com dados hipotéticos para o tutorial.

Nesse exemplo, desejamos explorar a relação entre consumo de café e insônia. Mais especificamente, queremos responder à seguinte pergunta: existe associação entre consumo de café e insônia? Para isso, realizaremos um teste qui-quadrado de independência no R.

Como fazer o teste qui-quadrado de independência no R?

Instalando e carregando pacotes

Neste tutorial, você precisará carregar os pacotes janitor, para manipular dados e criar tabelas de contingência; psych, para calcular o coeficiente φ (letra grega phi); e effectsize, para calcular a razão de chances. Para carregar esses pacotes, execute o código abaixo.

# instalando e carregando pacotes
install.packages(c("janitor", "psych", "effectsize"))
library(janitor)
library(psych)
library(effectsize)

Você deverá executar o código da linha 2 uma única vez, mas deverá executar os códigos das linhas 3 a 5 sempre que iniciar uma nova sessão no R e precisar das funções contidas nos pacotes mencionados neste tutorial.

O código a seguir criará um banco de dados correspondente àquele apresentado na Figura 1. O banco de dados é criado em um formato denominado data.frame, mas aqui usaremos os termos banco de dados e data.frame de forma intercambiável. A Figura 2 apresenta as primeiras linhas do banco de dados resultante.

# criando dados
dados <- data.frame(cafe = as.factor(rep(c("Não consome", "Consome"), each = 50)),
                    insonia = as.factor(c(rep("Sem insônia", 28),
                                            rep("Com insônia", 22),
                                            rep("Sem insônia", 10),
                                            rep("Com insônia", 40)))
                    )

# visualizando dados
head(dados, 10)
Figura 2. Dez primeiras linhas do banco de dados para o tutorial do teste qui-quadrado de independência no R.

Manipulando o data.frame

Para converter os dados em um formato adequado para a realização do teste qui-quadrado de independência no R, usaremos a função tabyl, do pacote janitor, para formatar os dados em uma tabela de contingência 2 × 2. A função tabyl recebe os argumentos dat (o banco de dados que usaremos no tutorial), var1 e var2 (as duas variáveis que serão formatadas em uma tabela de contingência). A Figura 3 mostra o resultado dessa manipulação de dados.

# manipulando dados
freq <- janitor::tabyl(dat = dados,
                      var1 = cafe,
                      var2 = insonia)
freq
Figura 3. Tabela de contingência com frequências gerada pela função tabyl.

A função função adorn_totals, do pacote janitor, é útil para também visualizarmos as frequências marginais da tabela, isto é, a soma dos totais de cada linha e de cada coluna. A Figura 4 apresenta o resultado dessa manipulação.

# acrescentando totais marginais
freq_total <- janitor::adorn_totals(freq, where = c('row', 'col'))
freq_total
Figura 4. Tabela de contingência com totais marginais.

Solicitando o teste qui-quadrado

A solicitação do teste qui-quadrado de independência no R é bem simples. Usamos a função chisq.test() do pacote janitor passando o objeto freq, criado anteriormente, como input para a análise. A função chisq.test(), por padrão, realiza um teste com a correção de continuidade de Yates. Para contornarmos a configuração padrão, passamos FALSE para o argumento correct. Armazenamos os resultados no objeto qui.q.

# solicitando a análise
qui.q <- janitor::chisq.test(freq, correct = FALSE)

Também solicitamos o coeficiente φ (usando a função phi, do pacote psych) e a razão de chances (usando a função oddsratio, do pacote effectsize), e armazenamos os resultados nos objetos phi e rc, respectivamente. Para ambas as funções, passamos o banco de dados original, dados, indicando os nomes das colunas que serão usadas (por meio do operador $) para calcular as medidas de tamanho de efeito.

# solicitando tamanhos de efeito
phi <- psych::phi(table(dados$cafe, dados$insonia), digits = 3)
rc <- effectsize::oddsratio(x = dados$cafe,
                            y = dados$insonia)

Como interpretar o teste qui-quadrado de independência no R?

A linha a seguir imprime as saídas das análises. A Figura 5 apresenta os resultados.

# checando os resultados
qui.q; phi; rc
resultados do teste qui-quadrado.
Figura 5. Resultados do teste qui-quadrado de independência e medidas de tamanho de efeito.

A Figura 5 indica que o resultado do nosso teste qui-quadrado foi de 13,75, associado a 1 grau de liberdade (df = degree of freedom) e a um valor de p menor que 0,001. Desse modo, se adotarmos o nível convencional de significância de 0,05, concluíremos que observamos uma associação estatisticamente significativa entre consumo de café e insônia.

Mas quão forte é essa associação? A resposta é apresentada na linha iniciada por [1], que contém o coeficiente φ. O coeficiente φ pode ser interpretado de maneira análoga ao coeficiente r de Pearson. Desse modo, podemos interpretar esse valor como indicativo de uma associação moderada entre consumo de café e insônia.

Por fim, a linha que inicia com odds ratio representa a razão de chances. Esse resultado indica, portanto, que quem consume café tem cinco vezes mais chances que quem não consome de ter insônia. Contudo, com base no exemplo de delineamento que descrevemos, não é possível estabelecer a direção da associação entre as variáveis.

Como reportar os resultados do teste qui-quadrado de independência?

Os resultados de um teste qui-quadrado de independência devem fazer menção à estatística do teste, aos graus de liberdade, ao valor de p e a pelo menos uma medida de tamanho de efeito. Desse modo, com base nas normas de publicação da American Psychological Association (APA), 7ª edição, uma sugestão de relato é apresentada nos dois parágrafos a seguir. É importante notar que os resultados são hipotéticos e, por isso, podem não representar o estado da arte sobre o tema usado no tutorial.

A Figura 1 apresenta a tabela de contingência cruzando as variáveis relacionadas ao consumo de café e sintomas de insônia. Com base nesses dados, um teste qui-quadrado de independência indicou que houve associação significativa e moderada entre consumo de café e insônia, χ2(1, N = 100) = 13,75, p < 0,001, φ = 0,37.

Especificamente, enquanto quem não consome café tem uma tendência a não ter sintomas de insonia (56%), aqueles que consomem café têm uma forte tendência a ter insônia (80%). Além disso, a razão de chances (RC), RC = 5,09, IC 95% [2,09, 12,40], indicou que quem consome café tem 5,09 vezes mais chances que quem não consome de ter insônia (ou, em outras palavras, quem tem insônia, comparado a quem não tem, tem 5,09 vezes mais chances de consumir café).

Conclusão

Neste post, você viu um tutorial de como fazer o teste qui-quadrado de independência no R. Além disso, você também também aprendeu como manipular o banco de dados e como solicitar medidas de tamanho de efeito. Por fim, você viu como interpretar e reportar os resultados.

Quer aprender mais sobre R? Então veja a novidade que preparamos a seguir!

É com grande satisfação que a Psicometria Online anuncia o curso R para Iniciantes. O curso tem como objetivo abordar todos os tópicos essenciais do R, permitindo que você explore assuntos específicos sem ser prejudicado por dúvidas básicas. Se você trabalha com pesquisa científica e deseja aprender a utilizar o R, então o curso R para Iniciantes é para você.

Interessado em aprender análise de dados? Junte-se à Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça nossa estrutura completa e nunca mais passe trabalho sozinho(a).

Referência

Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R. Sage.

Como citar este post

Lima, M. (2022, 14 de novembro). Como fazer o teste qui-quadrado de independência no R? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/teste-qui-quadrado-de-independencia-no-r/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Como fazer o cálculo de tamanho amostral no G*Power?

Como centralizar os dados no SPSS?

Como calcular o escore z no SPSS?

Conteúdo

Mais lidos

O que é correlação de Pearson?

O que é o teste de Shapiro-Wilk?

Teste t de Student

Qual é a diferença entre R e RStudio?

Postados recentemente

O que é ensaio clínico randomizado?

Como fazer o cálculo de tamanho amostral no G*Power?

Qual é a diferença entre sensibilidade e especificidade?

O que é validade externa?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias