Neste post, vamos explicar o que são variáveis de confusão. Entender esse conceito é essencial na metodologia científica, pois essas variáveis podem limitar as inferências possíveis em pesquisas.
O que é validade interna?
Em estudos experimentais, almejamos fazer inferências causais. Nesses delineamentos, pesquisadores buscam determinar se uma variável independente (aquela que é manipulada) afeta uma variável dependente (aquela que é medida).
Por exemplo, em um ensaio clínico randomizado, podemos investigar os efeitos de duas psicoterapias sobre os níveis de autoeficácia de pacientes com depressão leve. Desse modo, usamos estratégias metodológicas para que possamos concluir se o tipo de psicoterapia afeta ou não, de forma causal, a autoeficácia dos pacientes.
Sendo assim, podemos definir a validade interna como um julgamento sobre o grau com que somos capazes de atribuir os resultados de nosso experimento à manipulação da variável independente.
O que são variáveis de confusão?
Anteriormente, descrevemos um ensaio clínico randomizado envolvendo duas psicoterapias. Suponha que um psicoterapeuta com 30 anos de experiência administrou a psicoterapia A, enquanto um psicoterapeuta recém-formado administrou a psicoterapia B. Nesse cenário, temos um problema de validade interna, pois é possível que mudanças nos níveis de autoeficácia não sejam decorrentes das psicoterapias propriamente ditas.
Podemos definir variáveis de confusão como variáveis não mensuradas, mas que oferecem explicações alternativas plausíveis para um achado de pesquisa. Por exemplo, o tempo de experiência dos psicoterapeutas é uma variável de confusão, pois essa variável covaria com o tipo de psicoterapia, de modo que somos incapazes de isolar o efeito de interesse.
Variáveis de confusão, por definição, são ameaças à validade interna dos estudos. Em delineamentos experimentais (incluindo ensaios clínicos randomizados) bem conduzidos, descartamos as principais ameaças à validade interna, com base nas características do delineamento de pesquisa. Essas características podem incluir a designação aleatória, o contrabalanceamento e o estabelecimento de vínculo com os participantes visando reduzir a perda de casos durante o estudo.
A Figura 1 ilustra o conceito de variável de confusão. Nela, indicamos por meio de uma seta verde a relação que queremos genuinamente investigar. No entanto, se existir pelo menos uma variável (círculo com ponto de interrogação) que se relaciona com as variáveis de interesse (setas com linhas pontilhadas), teremos ameaças à validade interna de nosso estudo.
Variáveis de confusão em estudos não experimentais
Em geral, pesquisadores estão cientes das principais ameaças à validade interna em suas áreas de pesquisa. Sendo assim, eles desenham o estudo de modo a realizar os controles apropriados durante a coleta de dados. Por exemplo, sabendo-se que o tempo de experiência como psicoterapeuta pode concorrer com a modalidade psicoterápica na explicação dos achados, pesquisadores controlariam esse fator em ensaios clínicos randomizados.
Desse modo, os fatores de confusão são uma preocupação maior para estudos não experimentais, pois, em tais estudos, pesquisadores não conseguem exercer tanto controle sobre as condições da pesquisa. Esse é um dos motivos pelos quais é mais difícil identificar relações causais em delineamentos não experimentais.
Em outro post, apresentamos dois exemplos de potenciais variáveis de confusão em pesquisas correlacionais. Por exemplo, podemos ter a hipótese de que a quantidade de atividade física é um preditor negativo dos níveis de ansiedade, isto é, quanto mais atividades física, menores os níveis de ansiedade. No entanto, a renda pode ser uma variável de confusão, estando diretamente relacionada às duas variáveis de interesse: indivíduos com menor renda possuem menos recursos para se engajar em atividade física e, concomitantemente, experienciam maiores níveis de ansiedade (Figura 2).
Para evitar que a renda seja uma variável de confusão, poderíamos recrutar participantes com uma faixa de renda restrita, de modo a avaliar de forma mais “pura” a relação entre atividade física e ansiedade. De forma alternativa, poderíamos mensurar a renda e inseri-la como covariável em um modelo de regressão múltipla para investigar se a quantidade de atividade física prediz os níveis de ansiedade, controlando pelos efeitos da renda.
Variáveis de confusão e ameaças à validade interna
Variáveis de confusão emergem quando permitimos que uma variável se correlacione fortemente com a variável explicativa hipotetizada. Por exemplo, um pesquisador apresentou palavras concretas (e.g., bola, dedo) e abstratas (e.g., esperança, felicidade) aos participantes. Em seguida, ele avaliou a memória dos participantes em relação à lista de palavras.
Embora o pesquisador tenha observado uma recordação superior para palavras concretas, ele identificou, tardiamente, que as palavras concretas também eram mais curtas. Desse modo, não sabemos se os efeitos mnemônicos se devem à concretude das palavras, ao comprimento das palavras ou a uma combinação dos dois fatores (Figura 3).
A solução para esse problema seria evitar que houvesse covariação entre a variável de interesse e outros atributos das palavras. No exemplo em questão, o pesquisador poderia exigir que as palavras concretas e abstratas selecionadas tivessem, em média, comprimentos similares.
Algumas ameaças à validade interna recebem nomes especiais. Por exemplo, suponha que queremos comparar jovens adultos e idosos em um tarefa computadorizada de atenção dividida. No entanto, aqui temos uma ameaça à validade interna de instrumentação, pois a aferição da atenção de idosos é comprometida pelo fato de que eles têm, em média, fluência menor no uso de computadores, quando comparados a jovens adultos (Figura 4).
Outras ameaças à validade interna incluem:
- História: eventos externos ocorridos durante o experimento (e.g., gravidez, óbito) e que podem afetar os resultados;
- Maturação: mudanças desenvolvimentais que ocorrem nos participantes ao longo do tempo;
- Testagem: experiências prévias com tarefas podem afetar desempenho subsequente;
- Atrito: perdas de participantes no estudo estão relacionadas à intervenção e/ou ao desfecho sob investigação.
Conclusão
Neste post, explicamos o que são variáveis de confusão. Além disso, fornecemos exemplos de como essas variáveis comprometem a validade interna dos achados de pesquisa. Recomendamos também a leitura de nosso post sobre validade interna, pois ele descreve, de forma mais abrangente, a lista de ameaças à validade interna de estudos científicos.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Kazdin, A. E. (2016). Research design in clinical psychology (5th ed.). Pearson.
Como citar este post
Lima, M. (2022, 25 de abril). Variáveis de confusão e outras ameaças à validade do seu estudo. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/variaveis-de-confusao-e-outras-ameacas-a-validade-do-seu-estudo/