Se você trabalha com análise quantitativa de dados, é provável que já tenha ouvido falar do erro Tipo I e do erro Tipo II. Neste post, explicaremos o que são esses erros. Além disso, indicaremos quais fatores afetam cada um deles, e como utilizar esse conhecimento na análise de poder a priori.
O que são hipóteses alternativa e nula?
No teste de significância da hipótese nula, assumimos que o mundo pode ser didaticamente simplificado em duas grandes categorias mutuamente excludentes. Uma delas afirma que um efeito ou associação entre variáveis não existe (hipótese nula verdadeira), enquanto a outra afirma que esse efeito existe (hipótese nula falsa e, portanto, indicando que alguma hipótese alternativa é verdadeira).
Vamos esclarecer esses conceitos com um exemplo simples. Imagine que um paciente sente dores atrás dos olhos, falta de apetite e febre. Preocupado, ele faz um teste para verificar se está com dengue. Existem duas possibilidades: ou ele não está com dengue (hipótese nula verdadeira) ou ele está com dengue (hipótese alternativa verdadeira).
Além disso, o teste possui dois possíveis resultados: negativo, indicando que o paciente não tem dengue (não rejeita a hipótese nula), ou positivo, sugerindo que o paciente tem dengue (rejeita a hipótese nula).
Assim, temos dois cenários possíveis (Figura 1): a realidade, onde você tem ou não dengue, e o resultado do teste, que pode ser correto ou incorreto. Quando o teste erra ao acusar dengue em quem não está doente, ocorre um erro Tipo I. Por outro lado, quando o teste falha em identificar a dengue, ocorre um erro Tipo II.
Em um mundo ideal, os testes sempre acertariam. Porém, tanto em saúde quanto em análise de dados, sempre há margem para erros, e é importante entender como eles afetam nossas decisões.
O que é erro Tipo I?
O erro Tipo I consiste em rejeitar uma hipótese nula verdadeira. No exemplo da dengue, isso consistiria em diagnosticar erroneamente um paciente como tendo dengue quando, de fato, ele possui outra condição clínica.
Para compreender melhor esse conceito, vamos considerar outro exemplo. Imagine que pesquisadores estão testando um novo medicamento para aliviar os sintomas de uma doença. Desse modo, o exemplo nos permite descrever duas hipóteses concorrentes e mutuamente excludentes:
- Hipótese nula (H0): o novo medicamento não tem efeito sobre os sintomas da doença, isto é, não faz diferença tomar o medicamento ou tomar uma pílula placebo;
- Hipótese alternativa (H1): comparado a uma pílula placebo, o novo medicamento alivia os sintomas da doença.
O erro Tipo I só pode ocorrer quando a hipótese nula é verdadeira. Logo, se a hipótese que descreve corretamente o mundo é a nula (isto é, o medicamento não tem efeito sobre os sintomas) e os pesquisadores a rejeitam, comete-se um erro Tipo I. Em outras palavras, quando pesquisadores cometem o erro Tipo I, eles publicam estudos afirmando terem observado um efeito ou uma relação entre variáveis que é, de fato, inexistente.
O que é erro Tipo II?
O erro Tipo II consiste na falha em rejeitar uma hipótese nula falsa. No exemplo da dengue, isso seria equivalente a não diagnosticar um paciente que realmente está com a doença.
Por definição, o erro Tipo II pode ocorrer apenas quando a hipótese nula é falsa. Assim, se a hipótese correta é a alternativa (i.e., o medicamento tem efeito sobre os sintomas), e os pesquisadores não conseguem rejeitar a hipótese nula, cometem um erro Tipo II.
Em outras palavras, quando ocorre o erro Tipo II, os pesquisadores publicam estudos afirmando que não encontraram um efeito ou relação que, na verdade, existe. Eles também podem arquivar esses resultados e não tentar publicá-los.
Note que não usamos o termo “aceitar” a hipótese nula; apenas falamos em “não rejeitá-la”. Isso acontece porque não rejeitar a hipótese nula é diferente de corroborar sua veracidade. A falha em rejeitá-la pode ser simplesmente devido à falta de poder estatístico, como veremos adiante.
Quais fatores afetam a probabilidade de erro Tipo I?
Diversos fatores podem influenciar a probabilidade de cometer um erro Tipo I, como o nível de significância, o número de testes realizados e a variabilidade dos dados. Em seguida, descrevemos cada um desses fatores.
Nível de significância
O nível de significância, representado por α (letra grega alfa), indica a probabilidade teórica de rejeitar a hipótese nula quando ela é verdadeira. Normalmente, os cientistas adotam 0,05 como nível de significância, o que implica que, se a hipótese nula for verdadeira, haverá uma chance de 5% de rejeitá-la incorretamente a longo prazo.
A Figura 2 ilustra a relação entre nível de significância e probabilidade de erro Tipo I no contexto dos testes t para amostras independentes. Em síntese, em uma comparação de médias entre grupos, quanto maior for o nível de significância adotado, menor será a estatística crítica do teste, o que aumenta a probabilidade de cometer um erro Tipo I.
Número de testes estatísticos
O número de testes conduzidos também afeta a probabilidade de erro Tipo I. Fixado um nível de significância (e.g., α = 0,05), quanto maior é o número de comparações realizadas, maior será a probabilidade de erro Tipo I.
A taxa de erro Tipo I em função do número de comparações (k) é dada por:
Por exemplo, se comparamos dois grupos em função de uma variável dependente, a probabilidade de erro Tipo I, dado α = 0,05, é de 5%, se a hipótese nula for verdadeira. Agora, se inflacionamos o número de comparações (e.g., conduzindo comparações múltiplas entre pares de grupos em função da mesma variável dependente), nosso nível de significância nominal aumentará.
A Figura 3 mostra a probabilidade de erro Tipo I em função do número de comparações realizadas por meio de testes t para amostras independentes.
Em síntese, mesmo que todas as hipóteses nulas sejam verdadeiras, a probabilidade de rejeição de pelo menos uma hipótese nula aumenta consideravelmente à medida que aumenta o número de comparações. Com 10 comparações, a taxa de erro Tipo I já ultrapassa 40%. Por isso, nesses casos é importante que se aplique algum tipo de correção do nível de significância como, por exemplo, a correção de Bonferroni.
Tamanho amostral
O tamanho da amostra pode influenciar indiretamente a taxa de erro Tipo I. Em amostras menores, aumenta a probabilidade de violação de pressupostos estatísticos, o que pode gerar resultados enganosos. Isso acontece porque, ao violar suposições estatísticas, os dados podem não seguir a distribuição teórica esperada.
Como consequência, a taxa de erro Tipo I pode aumentar. Por exemplo, se as variâncias entre dois grupos forem muito diferentes, mesmo que a hipótese nula seja verdadeira, a taxa de erro Tipo I pode superar o valor nominal estabelecido, devido à heterocedasticidade.
Resumo
Em síntese, mantidos outros fatores constantes:
- Quanto maior é o nível de significância, maior é a probabilidade de se cometer um erro Tipo I;
- Quanto maior é o número de comparações, maior é a probabilidade de se cometer um erro Tipo I;
- Quanto maior é o tamanho amostral, menor é a probabilidade de se cometer um erro Tipo I.
Quais fatores afetam a probabilidade de erro Tipo II?
O erro Tipo II é influenciado por fatores como o nível de significância, o tamanho amostral e o tamanho de efeito.
Nível de significância
O nível de significância se relaciona negativamente com o erro Tipo II. À medida que o nível de significância aumenta (por exemplo, de 0,05 para 0,10), o valor crítico do teste diminui. Isso torna mais fácil rejeitar a hipótese nula, reduzindo a probabilidade de erro Tipo II.
Em outras palavras, se o nível de significância aumenta, isso quer dizer que precisamos de resultados menos surpreendentes para optarmos pela rejeição da hipótese nula como uma boa representação do mundo.
Tamanho amostral
Amostras maiores diminuem a probabilidade de erro Tipo II, pois representam melhor a população e aumentam o poder estatístico. O poder consiste na probabilidade de rejeitar a hipótese nula quando ela é falsa.
Podemos pensar no conceito de poder como um microscópio: aqueles menos potentes são capazes de detectar apenas micro-organismos maiores, enquanto a detecção de micro-organismos menores requer microscópios mais potentes. De maneira similar, à medida que o tamanho amostral aumenta, temos maior poder estatístico para detectar diferenças reais na população, o que diminui a probabilidade de falharmos em rejeitar uma hipótese nula falsa.
Tamanho de efeito
Mantidos outros fatores constantes, tamanhos de efeito maiores tornam a rejeição da hipótese nula mais fácil. Retomando a metáfora do microscópio trazida anteriormente, quanto maior é um micro-organismo qualquer, mais fácil é de detectá-lo.
De maneira similar, quanto maior é um tamanho de efeito, maior é a probabilidade de detectá-lo. Em outras palavras, com tamanhos de efeito maiores, reduz-se a probabilidade de erro Tipo II.
Resumo
Em síntese, mantidos outros fatores constantes:
- Quanto maior é o nível de significância, menor é a probabilidade de se cometer um erro Tipo II;
- Quanto maior é o tamanho amostral, menor é a probabilidade de se cometer um erro Tipo I;
- Quanto maior é o tamanho de efeito, menor é a probabilidade de se cometer um erro Tipo II.
Como estabelecemos os valores do erro Tipo I e erro Tipo II?
Muitos estudos estabelecem α = 0,05 e β = 0,20. Implicitamente, tal escolha assume que um erro Tipo II é quatro vezes mais aceitável que um erro Tipo I. No entanto, esses valores são um tanto arbitrários.
Em certas situações, a relação custo–benefício de cometer ou deixar de cometer cada um dos tipos de erros muda. O exemplo de um julgamento criminal ajuda a compreender essa ideia. Um veredicto de culpado dado a um inocente (análogo ao erro Tipo I) pode levá-lo a pagar por um crime que não cometeu, enquanto que um veredicto de não culpado dado a um criminoso (análogo ao erro Tipo II) pode levar à reinserção social uma pessoa potencialmente perigosa. Qual das situações é mais injusta ou mais grave?
Infelizmente, não é fácil chegar a uma resposta a esse dilema. No entanto, ele mostra claramente que, a depender de sua percepção sobre o problema do julgamento, uma postura mais conservadora (declarar culpa apenas com fortes evidências) ou liberal (presumir inocência apenas na falta de indícios) será adotada no caso.
Da mesma forma, as decisões em análise quantitativa de dados envolvem uma troca entre dois tipos de erros. Ao sermos mais conservadores e diminuirmos o valor de α, aumentamos o valor de β, e vice-versa. Portanto, precisamos sempre procurar um balanceamento entre os erros Tipos I e II, considerando os custos e benefícios de cometer ou deixar de cometer cada um desses erros.
Como evitar cometer o erro Tipo I e o erro Tipo II?
Uma aplicação prática deste post é no planejamento da pesquisa, onde o cálculo do tamanho amostral é fundamental. Esse cálculo é denominado de análise de poder a priori.
Por meio desse procedimento nós podemos, por exemplo, escolher um nível de significância baixo para evitar cometer o erro Tipo I. Além disso, para assegurar um poder estatístico mínimo – usualmente 80% –, podemos adotar um nível β baixo. Para isso, podemos utilizar um software gratuito, como o G*Power, e estimar o número mínimo de participantes para garantir um poder suficiente ao seu teste e reduzir as probabilidades de cometer tais erros.
Por exemplo, suponha que queremos investigar se um medicamento alivia os sintomas de uma doença. Aqui queremos saber qual é o tamanho amostral mínimo para detectar diferenças de pelo menos meio desvio-padrão em dois grupos independentes, d = 0,50, considerando α = 0,05 e β = 0,20.
A Figura 4 apresenta um screenshot do G*Power com as configurações para o cálculo de poder a priori considerando esse delineamento, bem como uma predição de efeito bidirecional.
Desse modo, a análise indica que precisaremos de pelo menos 128 participantes (64 por grupo) para ter o poder estatístico de 80% para detectarmos um d de Cohen de pelo menos 0,50, considerando uma hipótese bidirecional e um alfa de 5%.
Conclusão
Ao longo deste post, exploramos os conceitos de erro Tipo I e erro Tipo II. Além disso, enumeramos alguns fatores que afetam cada um desses tipos de erros e como usar esse conhecimento durante o planejamento de seu projeto de pesquisa.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Cumming, G. (2012). Understanding the new statistics: Effect sizes, confidence intervals, and meta-analysis. Routledge.
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Como citar este post
Lima, M. (2023, 23 de junho). O que é erro Tipo I e erro Tipo II? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-erro-do-tipo-i-e-erro-do-tipo-ii/
Uma resposta