O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Teste exato de Fisher: o que é, quando usar e como calcular?

Marcos Lima

mar 7, 2023

Você conhece o teste exato de Fisher? Neste post, explicaremos o que é esse teste, para que ele serve e como calculá-lo, interpretá-lo e reportá-lo. Além disso, por meio de um exemplo simples, forneceremos uma intuição de sua fórmula e do significado do valor exato de probabilidade por ele produzido. Então, sem mais delongas, vamos começar!

Teste exato de Fisher: o que é e quando usar?

Criado pelo estatístico Sir Ronald Fisher, em 1920, o teste exato é uma ferramenta estatística importante em estudos que investigam a associação entre variáveis categóricas.

Por exemplo, as questões a seguir poderiam ser respondidas por meio do teste exato de Fisher: (a) no marketing: existe associação entre o grau de escolaridade e a preferência por determinadas marcas de produtos? (b) na medicina: há associação entre a exposição a um fator de risco (e.g., administração intramuscular de vitamina K) e a presença de uma determinada doença (e.g., leucemia)?

O teste exato de Fisher é uma alternativa ao teste qui-quadrado de independência quando existem células na tabela de contingência com frequências esperadas muito baixas (i.e., menores que 5). Em tais situações, o teste exato de Fisher seria uma opção mais apropriada. Vale ressaltar que o teste exato não depende de qualquer suposição estatística sobre a distribuição dos dados.

Qual é a lógica do teste exato de Fisher?

Anteriormente, descrevemos o que é e quando usar o teste exato de Fisher. O objetivo desta seção, por sua vez, é apresentar uma intuição do que o teste exato de Fisher calcula. Sendo assim, introduziremos um exemplo hipotético a seguir, que será usado ao longo do post.

O que é uma tabela de contingência?

Na pesquisa hipotética descrita neste post, considere que recrutamos 14 participantes. Para cada um deles, perguntamos qual bebida ele prefere (chá, café) e se ele tem insônia (sim, não). O objetivo do estudo foi investigar a associação entre essas duas variáveis. A Figura 1 apresenta os dados da pesquisa.

exemplo de dados para o tutorial.
Figura 1. Dados hipotéticos.

Assim como ocorre no teste qui-quadrado de independência, o teste exato envolve a criação de uma tabela de contingência dos dados observados. Uma tabela de contingência consiste na representação do cruzamento dos níveis de cada variável categórica de interesse. Por exemplo, a Figura 2 apresenta uma tabela de contingências 2 × 2, inicialmente sem valores numéricos.

matriz de contingências genérica.
Figura 2. Tabela de contingências 2 × 2.

Na Figura 2, as células brancas representam o número de observações para cada cruzamento de níveis das variáveis. Por exemplo, o valor inserido na célula A indicará o número de pessoas que preferem chá e têm insônia, enquanto o valor inserido na célula D indicará o número de pessoas que preferem café e que não têm insônia.

As células cinzas representam os totais marginais, isto é, esses valores correspondem ao somatório dos valores das linhas (A + B e C + D), das colunas (A + C e B + D), ou de todas as células (N).

A Figura 3 apresenta uma nova tabela de contingências 2 × 2, agora preenchida com os valores numéricos da Figura 1. Você pode verificar que os valores das células cinzas representam os totais de linhas, de colunas e geral.

dados empíricos.
Figura 3. Tabela de contingências 2 × 2 com valores observados na pesquisa.

Como pode ser visto na Figura 3, quem prefere café tem uma tendência maior a reportar insônia, comparado a quem prefere chá. Mas essa tendência numérica se traduz em uma associação estatística? Para responder a essa questão, precisamos conduzir um teste inferencial.

O que o teste exato de Fisher faz?

O teste exato de Fisher é um teste condicional, isto é, ele considera todas as maneiras distintas pelas quais as observações (células brancas) poderiam ter ocorrido, com a restrição de que os totais marginais (células cinzas) se mantenham fixos.

Por exemplo, vamos assumir momentaneamente que tivemos apenas 1 participante que prefere chá e que reportou ter insônia em nosso estudo. Mantendo os totais marginais fixos, isso levaria à tabela representada na Figura 4.

tabela com dados empíricos modificados, fixando os totais marginais.
Figura 4. Exemplo de modificação das células da tabela de contingências 2 × 2, mantendo os totais marginais fixos.

O teste exato de Fisher calcula as probabilidade de ocorrência de todas as tabelas de contingências 2 × 2 possíveis, desde que os totais marginais sejam semelhantes aos dos dados empíricos (Figura 3). O valor obtido expressa a probabilidade exata de se observar uma dada tabela, considerando que a hipótese nula seja verdadeira.

Mas qual é a hipótese nula? A hipótese nula do teste exato de Fisher é de que as variáveis são independentes entre si. Em outras palavras, a independência corresponde a assumir que não existe associação entre bebida preferida e insônia. Se as duas variáveis forem genuinamente independentes, então saber o que uma pessoa bebe não é informativo dela ter ou não insônia (e vice-versa).

Reflita: se não houver associação entre bebida preferida e insônia, qual seria a tabela de contingências mais provável de acontecer? A Figura 5 representa essa tabela.

tabela mais provável sob a hipótese nula.
Figura 5. Representação da tabela de contingências mais provável sob a hipótese nula.

Na Figura 5, o mesmo percentual de participantes que prefere cada uma das bebidas apresenta sintomas de insônia. Se não existir associação entre bebida preferida e insônia, é exatamente esse o padrão que mais esperaríamos observar.

Resumo conceitual do teste exato de Fisher

Em resumo, o teste exato de Fisher:

  • Mapeia todas as tabelas de contingências que poderiam ser observadas com base nos totais marginais da tabela empírica;
  • Para cada uma delas, calcula a probabilidade de ocorrência daquele cenário;
  • Calcula a probabilidade de se observar valores iguais ou mais extremos que o da nossa tabela empírica, considerando-se a hipótese nula verdadeira.

Em seguida, ilustraremos como isso é feito em nosso exemplo hipotético.

Como calcular o teste exato de Fisher?

Como calcular a probabilidade de uma tabela de contingências?

Diversos softwares estatísticos (e.g., SPSS, JASP e R) realizam o teste exato de Fisher de maneira simples e rápida, ou seja, você provavelmente jamais precisará calculá-lo manualmente. No entanto, do ponto de vista didático, é útil entendermos a intuição por trás da fórmula. Desse modo, nosso objetivo aqui é ajudá-lo a compreender o significado do valor de probabilidade gerado pelo teste.

A probabilidade de observarmos uma dada configuração da tabela de contingências, segundo o teste exato de Fisher, é dada pela seguinte fórmula:

fórmula do teste exato de Fisher.

onde o ponto de exclamação representa o operador fatorial, isto é, N! = N × (N – 1) × … × 2 × 1.

Embora a fórmula anterior pareça intimidadora, seu significado é simples e elegante: ela gera um valor de p que representa a probabilidade exata de observarmos uma dada configuração da tabela de contingências, condicional aos totais marginais fixos. Assim, quanto menor é o valor de p obtido, mais improvável é que uma configuração seja observada.

Vamos aplicar a fórmula aos dados apresentados na Figura 5, isto é, à tabela que afirmamos ser a mais provável sob a hipótese nula. Aplicando a fórmula, temos:

aplicação da formula do teste exato de Fisher.

Interpretação: se selecionássemos aleatoriamente 14 participantes que preferem chá ou café, e que têm ou não insônia, uma vez que os totais marginais se mantenham fixos, em 40,8% das vezes observaríamos uma tabela de contingências igual àquela da Figura 5.

Como calcular as probabilidades de todas as tabelas de contingências?

Contudo, precisamos repetir o cálculo anterior para todas as tabelas de contingências possíveis. Por exemplo, dados os totais marginais, existem sete diferentes tabelas de contingências possíveis que poderíamos ter observado. A Figura 6 apresenta essas tabelas, com os valores de probabilidade abaixo de cada uma delas, computados pela fórmula do teste exato de Fisher.

valores de p calculados por meio da fórmula do teste exato de Fisher.
Figura 6. Diferentes tabelas de contingências que poderíamos ter observado, fixados os totais marginais.

Na Figura 6, a tabela verde sinalizada com um asterisco representa nossos dados (Figura 3). Sendo assim, a probabilidade de observarmos os nossos dados, condicional aos totais marginais fixos, é de p = 0,049.

Interpretação: se selecionássemos aleatoriamente 14 participantes que preferem chá ou café, e que têm ou não insônia, uma vez que os totais marginais se mantenham fixos, em apenas 4,9% das ocasiões observaríamos uma tabela de contingência igual a que obtivemos em nossos dados.

Testes unicaudais ou teste bicaudal?

O valor 0,049 se refere à probabilidade de observarmos valores iguais aos nossos dados, enquanto o teste exato de Fisher visa fornecer a probabilidade de observarmos valores iguais ou mais extremos que os observados em nossa amostra.

Nesse contexto, algo “extremo” é algo improvável, isto é, valores mais extremos são aqueles cujos eventos são menos prováveis que aqueles que observamos. No entanto, o que será considerado “mais extremo” dependerá da hipótese sob consideração. Primeiramente, consideraremos dois testes unicaudais (na mesma direção e na direção oposta ao que observamos). Em seguida, consideraremos um teste bicaudal.

Quando consideramos valores iguais ou mais extremos na mesma direção que o valor que observamos, as tabelas verdes da Figura 6 são as únicas que nos interessam. Desse modo, a probabilidade de obtermos valores iguais ou mais extremos na mesma direção que o observado é p = 0,002 + 0,049 = 0,051. Portanto, assumindo níveis convencionais de significância estatística (α = 0,05), falharíamos em rejeitar a hipótese nula de independência entre bebida preferida e sintomas de insônia.

Por outro lado, quando consideramos valores iguais ou mais extremos na direção oposta que o valor que observamos, com exceção da primeira tabela, todas as demais nos interessam. Desse modo, a probabilidade de obtermos valores iguais ou mais extremos na direção oposta que o observado é p = 0,002 + 0,049 + 0,245 + 0,408 + 0,245 + 0,049 + 0,001 = 0,99. Nesse cenário, também não rejeitaríamos a hipótese nula.

Por fim, em um teste bicaudal, consideraríamos valores iguais ou mais extremos em ambas as direções. Nessa situação, o valor do teste exato de Fisher seria dado pela soma das probabilidades associadas às tabelas verdes e vermelhas da Figura 6, p = 0,002 + 0,049 + 0,049 + 0,001 = 0,10. Mais uma vez, não rejeitaríamos a hipótese nula de independência entre variáveis.

Resumo gráfico do teste exato de Fisher

Note que, na Figura 6, os valores da célula Chá/Sim vão aumentando da tabela superior esquerda até a tabela inferior direita (de 1 até 7). Para fins didáticos, usaremos essa célula como referência.

A Figura 7 sumariza quais valores de probabilidade são somados em cada um dos três cenários descritos na seção anterior (como dissemos, tomando como referência os valores da célula Chá/Sim, na Figura 6).

distribuições de probabilidades exatas no teste exato de Fisher.
Figura 7. Distribuições de probabilidades das diferentes tabelas da Figura 6 (aqui representadas pela célula Chá/Sim), considerando-se a hipótese nula verdadeira. Barras azuis indicam quais valores de probabilidade são somados para calcular o valor de p do teste exato de Fisher.

Podemos pensar as distribuições da Figura 7 como um “contínuo”, que vai de uma menor até uma maior tendência de associação entre chá e insônia. Por exemplo, no painel esquerdo, consideramos como valores “mais extremos” apenas tendências baixas da associação entre chá e insônia (em outras palavras, tendências altas da associação entre café e insônia).

Nesse caso, o cálculo de probabilidade considera as probabilidades das tabelas em que a frequência da célula Chá/Sim é 1 ou 2 (indicado no painel esquerdo da Figura 7 pelas barras azuis).

Note que, em todos os painéis, os valores de probabilidades são idênticos. A única diferença entre eles é quais tabelas de contingência são consideradas no cálculo final do valor de probabilidade do teste exato de Fisher (representado pelas barras azuis).

Como executar o teste exato de Fisher no SPSS?

Solicitando a análise

A Figura 8 mostra os dados tabulados no SPSS. Usaremos os mesmos dados descritos anteriormente para executar o teste no SPSS.

screenshot do banco de dados.
Figura 8. Dados tabulados no SPSS.

O teste exato de Fisher é solicitado pelo caminho Analisar > Estatísticas descritivas > Tabela de referência cruzada. A Figura 9 ilustra esse caminho.

como solicitar o teste exato de Fisher no SPSS.
Figura 9. Caminho para solicitar o teste exato de Fisher no SPSS.

Primeiramente, colocaremos as variáveis de interesse nos menus Linha(s) e Coluna(s). A ordem de especificação das variáveis é irrelevante. Em seguida, clicaremos em Estatísticas, e marcaremos a opção Quiquadrado. Finalmente, clicaremos em Continuar, e depois, em OK. A Figura 10 ilustra essas etapas.

opções para solicitar o teste exato de Fisher no SPSS.
Figura 10. Opções para solicitação do teste exato de Fisher.

Interpretando e reportando os resultados

A Figura 11 apresenta os resultados gerados pelo SPSS. Primeiramente, vemos uma tabela de contingências 2 × 2 semelhante àquela que apresentamos na Figura 3. Em seguida, na tabela do teste qui-quadrado, a linha na cor azul apresenta as estatísticas do teste exato de Fisher.

resultados do teste exato de Fisher no SPSS.
Figura 11. Saídas geradas pelo SPSS.

Note, contudo, que o teste exato de Fisher não possui uma “estatística do teste”, a partir da qual se computa um valor de p assintótico. Pelo contrário, como os valores de probabilidade do teste são calculados diretamente a partir dos dados, os valores de p que o teste fornece são exatos (daí o nome teste exato de Fisher).

O SPSS fornece dois valores de p, referentes ao que chamamos de teste unicaudal (mesma direção) e teste bicaudal, na Figura 7. Desse modo, com base em nosso exemplo e em um teste bicaudal, poderíamos fazer o seguinte relato:

A Figura 3 apresenta uma tabela de contingências 2 × 2 cruzando a preferência por bebida (chá, café) e a presença de insônia (sim, não). Embora tenhamos observado uma tendência maior de insônia entre aqueles que preferem café (85,7%), em comparação a aqueles que preferem chá (28,6%), essa tendência não atingiu significância estatística, conforme indicado pelo teste exato de Fisher, p = 0,051.

Conclusão

Neste post, você aprendeu o que é, quando usar e como calcular o teste exato de Fisher. Além disso, por meio de uma análise da fórmula do teste, você teve uma intuição do significado do valor exato de probabilidade gerado pelo teste. Por fim, você viu como solicitar a análise no SPSS, como interpretá-la e como reportá-la.

Aqui, optamos por focar exclusivamente no teste exato de Fisher. No entanto, quando falamos de testes de associação, é comum que os resultados de testes estatísticos sejam acompanhados de medidas de tamanho de efeito, como o coeficiente phi (letra grega φ), o V de Cramer e a razão de chances (odds ratio).

Gostou desse conteúdo? Precisa aprender análise de dados? Então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Howell, D. C. (2013). Categorical data and chi-square. In D. C. Howell, Statistical methods for psychology (8th ed., pp. 137–176). Wadsworth Cengage Learning.

Preacher, K. J., & Briggs, N. E. (2001, maio). Calculation for Fisher’s exact test: An interactive calculation tool for Fisher’s exact probability test for 2 x 2 tables [Computer software]. http://quantpsy.org

Salsburg, D. (2009). Uma senhora toma chá…: Como a estatística revolucionou a ciência no século XX (J. M. Gradel, Trad.). Zahar.

Como citar este post

Lima, M. (2023, 7 de março). Teste exato de Fisher: O que é, quando usar e como calcular? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/teste-exato-de-fisher/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

 

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

 

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Como realizar o teste de Shapiro-Wilk no JASP?

Curso R para Iniciantes

Como criar gráficos no R com o ggplot2?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é regressão linear múltipla?

Postados recentemente

Como escrever uma revisão sistemática? A declaração PRISMA

Como definir a ordem de autoria do artigo científico?

Como realizar o teste de Shapiro-Wilk no JASP?

Bolsas de mestrado e de doutorado: como conseguir?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias