O teste t para amostras independentes é um teste estatístico que compara médias para dois grupos independentes. Neste post, conheceremos um pouco mais sobre esse teste. Primeiramente, introduziremos um exemplo de delineamento de pesquisa que usa o teste t para amostras independentes. Em seguida, elencaremos as hipóteses nula e alternativa do teste t, e descreveremos conceitualmente a estatística t do teste t. Por fim, apresentaremos os pressupostos do teste t.
Exemplo de delineamento de pesquisa
Pesquisas que comparam observações de grupos distintos frequentemente utilizam o teste t para amostras independentes. Em experimentos, é comum termos dois grupos de participantes, cada um representando um nível da variável independente (e.g., grupo experimental vs. grupo controle).
Por exemplo, podemos expor crianças a um adulto que brinca de maneira pacífica com o brinquedo João Bobo (Figura 1; modelo não agressivo) ou que agride o João Bobo (modelo agressivo). Em seguida, podemos mensurar o número de comportamentos agressivos de cada criança.
A variável independente aqui é o tipo de modelo ao qual as crianças foram expostas, com dois níveis: modelo não agressivo e modelo agressivo. Já a variável dependente é o número de comportamentos agressivos observados.
A Figura 2 mostra um banco de dados típico para esse tipo de análise, com uma coluna de identificação dos participantes (ID), uma coluna indicando o grupo (Modelo) e outra com a medida de interesse (Número de comportamentos agressivos). Representamos cada criança em uma linha desse banco de dados.
Esse delineamento é experimental, mas o teste t também pode ser aplicado em outras situações. Por exemplo:
- Comparar a satisfação conjugal de pessoas com e sem filhos;
- Contrastar os níveis de estresse ocupacional entre trabalhadores em regime presencial e remoto;
- Analisar diferenças no desempenho acadêmico entre estudantes de escolas públicas e privadas;
- Investigar variações nos níveis de ansiedade entre indivíduos que praticam yoga e aqueles que não praticam.
Em síntese, o teste t é ideal para comparar dois grupos independentes em variáveis mensuradas nos níveis intervalar ou de razão.
Hipóteses nula e alternativa do teste t para amostras independentes
Anteriormente, apresentamos o exemplo de um experimento investigando diferenças no número de comportamentos agressivos por parte de crianças previamente expostas a um modelo não agressivo ou agressivo. Desse modo, temos duas hipóteses concorrentes:
- Hipótese nula (H0): μnão agressivo – μagressivo = 0, isto é, não há diferença entre os números médios de comportamentos agressivos nas condições com modelo não agressivo e agressivo;
- Hipótese alternativa (H1): μnão agressivo – μagressivo ≠ 0, isto é, há diferença entre os números médios de comportamentos agressivos nas condições com modelo não agressivo e agressivo.
Tipicamente, definimos a hipótese nula como uma hipótese “zero”, ou seja, uma hipótese de não diferença. No entanto, isso não é estritamente necessário. Além disso, o símbolo ≠ representa um teste bicaudal, que avalia diferenças em ambas as direções. Se, por outro lado, você espera uma diferença em uma direção específica específica, pode utilizar um teste unicaudal, indicado pelos símbolos < ou >.
Entendendo o teste t para amostras independentes
Etapas do teste t para amostras independentes
Conduzimos o teste t para amostras independentes por meio das seguintes etapas:
- Definir as hipóteses nula e alternativa;
- Estabelecer o nível de significância (α);
- Delinear a pesquisa e coletar dados;
- Calcular a estatística t e o valor de p;
- Decidir se rejeitamos ou não a hipótese nula.
Por exemplo, nós definimos nossas hipóteses, tal como descrevemos na seção anterior. Além disso, estabelecemos um nível de significância, α = 0,05. Esse valor indica a probabilidade de cometermos um erro Tipo I, isto é, de erroneamente rejeitarmos a hipótese nula, se ela for verdadeira.
Em outras palavras, podemos pensar no α como o nosso critério do quão surpreendente, ou improvável, os dados precisam ser, para tomarmos a decisão de “deixarmos de acreditar” na veracidade da hipótese nula.
Se o valor de p obtido for menor que α, então iremos nos considerar surpreendidos o suficiente para rejeitarmos a hipótese nula. Por outro lado, se p for maior que nosso α, assumiremos que não temos evidência o suficiente para decidir pela rejeição da hipótese nula.
O que é a estatística t?
Em seguida, coletamos os dados. A Figura 3 apresenta dados hipotéticos que poderíamos obter no experimento sobre comportamentos agressivos.
No grupo exposto ao modelo não agressivo, o número médio de comportamentos agressivos foi de 7,8, com um desvio-padrão de 2,59. Por outro lado, no grupo exposto ao modelo agressivo, o número médio de comportamentos agressivos foi de 14,4, com um desvio-padrão de 4,51.
A estatística t de Welch é dada por:
Aqui optamos por apresentar a versão do teste t de Welch, pois sua fórmula é matematicamente mais simples. No entanto, o mais importante aqui não é a fórmula em si, mas sim entender seu significado.
Conceitualmente, a estatística t compara a diferença observada entre médias (o numerador) com a variabilidade esperada dessas médias (o denominador). Em outras palavras, ela consiste em uma razão que reflete se a diferença entre os grupos é grande o suficiente para não ser atribuída ao acaso.
Calculando e interpretando o teste t para amostras independentes
Em nosso exemplo, temos:
A estatística t, de 2,84, associada a 6,38 graus de liberdade, produziu um valor de p de 0,03. Desse modo, como p < α, nós rejeitamos a hipótese nula de que o número médio de comportamentos agressivos entre as crianças expostas aos modelos não agressivo e agressivo são iguais.
Outra maneira de entender o resultado descrito no parágrafo anterior é considerando a distribuição da estatística t com 6,38 graus de liberdade (Figura 4).
Como podemos ver na Figura 4, a distribuição t é simétrica ao redor de 0, com os valores (em módulo) aumentando nas extremidades das distribuições. Mais importante, as linhas pontilhadas azuis indicam o valor t crítico a um α bicaudal de 0,05.
Essas linhas indicam que 5% dos valores da distribuição correspondem a t > |±2,41|, sendo 2,5% em cada cauda da distribuição. Como tobservado > tcrítico, ele cai na região de rejeição da hipótese nula, sinalizada pela área em azul claro no gráfico. Por isso, assumimos que temos evidência suficiente para rejeitarmos a hipótese nula.
Quais são os pressupostos do teste t para amostras independentes?
Para fins didáticos, nós anteriormente apresentamos os cálculos do teste t de Welch (ou teste t para variâncias desiguais), pois sua fórmula é mais simples que a do teste t de Student (ou teste t para variâncias iguais). No entanto, pesquisadores tipicamente consideram a contraparte de Student em primeiro lugar, quando se referem ao teste t para amostras independentes.
O teste t de Student possui três pressupostos, ou suposições:
- Normalidade: os dados de cada grupo devem vir de populações normalmente distribuídas;
- Independência: as observações precisam ser independentes entre si. Por exemplo, quebraríamos esse pré-requisito se amostrássemos observações aninhadas em um nível superior, como membros de uma mesma família, escola ou organização;
- Homogeneidade de variâncias: as variâncias dos grupos devem ser iguais, o que pode ser testado com o teste de Levene.
Violações de pressupostos têm como consequência o aumento ou a diminuição da probabilidade nominal de erro do Tipo I. Por exemplo, um estudo de simulação mostrou que quando o grupo com a variância maior possui menos participantes, a taxa de erro do Tipo I aumentou de 0,05 para 0,083 (Delacre et al., 2017). Em outras palavras, os resultados dos testes t de Student podem não ser confiáveis em casos de violação do pressuposto de homogeneidade de variâncias.
Por outro lado, o teste t de Welch não pressupõe homogeneidade de variâncias, produzindo resultados ainda confiáveis mesmo quando os dados têm variâncias heterogêneas. Por esse motivo, alguns metodólogos advogam pelo uso do teste t de Welch, por padrão, ao invés do teste t de Student.
Conclusão
Neste post, você aprendeu os fundamentos do teste t para amostras independentes. Contudo, lembre-se que é importante apresentar os resultados de testes estatísticos acompanhados de medidas de tamanho de efeito. Nesse sentido, recomendamos que você conheça o d de Cohen, o g de Hedges e o delta (Δ) de Glass.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Delacre, M., Lakens, D., & Leys, C. (2017). Why psychologists should by default use Welch’s t-test instead of Student’s t-test. International Review of Social Psychology, 30(1), 92–101. https://doi.org/10.5334/irsp.82
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Zimmerman, D. W. (2004). A note on preliminar tests of equality of variances. British Journal of Mathematical and Statistical Psychology, 57(1), 173–181. https://doi.org/10.1348/000711004849222
Como citar este post
Lima, M. (2021, 21 de outubro). Teste t para amostras independentes. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/teste-t-para-amostras-independentes/