Pesquisadores utilizam diversas estratégias metodológicas em estudos experimentais para eliminar variáveis confundidoras. Um estudo experimental livre de confundidores possui alta validade interna, ou seja, seus resultados podem ser interpretados em termos de relações de causa e efeito.
Neste post, você aprenderá sobre validade interna. Primeiramente, revisaremos o principal objetivo de um experimento. Em seguida, definiremos validade interna e as ameaças metodológicas que podem comprometê-la. Por fim, explicaremos a diferença entre validade interna, validade externa e validade baseada na estrutura interna.
Qual é o objetivo de um experimento?
O principal objetivo de um experimento é permitir a inferência causal. Em outras palavras, pesquisadores buscam determinar se uma variável independente (aquela que é manipulada) afeta uma variável dependente (aquela que é medida).
Para isso, o planejamento experimental precisa ser cuidadoso, garantindo que outros fatores não interfiram nos resultados. Assim, experimentos se caracterizam pelo controle rigoroso sobre o arranjo das tarefas, a designação dos participantes, a manipulação das variáveis independentes e a escolha das variáveis dependentes.
Em resumo, os experimentos são ferramentas poderosas, pois oferecem esse controle sobre as variáveis. Desse modo, para que as conclusões causais sejam válidas, é essencial garantir a validade interna.
Saiba mais: Pesquisa experimental e pesquisa correlacional: definições, diferenças e exemplos
O que é validade interna?
A validade interna se refere à capacidade de atribuir os resultados de um experimento às manipulações da variável independente, sem influências externas. Em outras palavras, um experimento tem alta validade interna quando podemos afirmar que as mudanças na variável dependente decorrem da manipulação da variável independente, sem interferência de outros fatores.
Por exemplo, imagine que uma pesquisadora quer testar se uma técnica de mindfulness reduz o estresse. Ela divide os participantes aleatoriamente em dois grupos: um que pratica mindfulness e outro que não pratica. Após algumas semanas, a pesquisadora mede os níveis de estresse dos participantes. A designação aleatória garante que qualquer diferença entre os grupos seja causada pelo mindfulness, e não por fatores externos.
Agora, considere um estudo sem validade interna. Se a pesquisadora aloca pessoas que já praticam mindfulness ao grupo experimental e pessoas que não praticam ao grupo controle, fatores como estilo de vida podem influenciar os resultados. Nesse caso, a validade interna fica comprometida, pois não há garantia de que a intervenção por mindfulness é responsável pelas diferenças nos níveis de estresse.
Nos dois exemplos anteriores, tratamos a validade interna de forma absoluta. No entanto, é mais pertinente entendê-la como uma questão de grau. Ter alta validade interna é crucial, pois isso permite interpretar os resultados de maneira correta. No entanto, mantê-la requer atenção, já que diversos fatores podem ameaçá-la, como veremos a seguir.
Quais fatores ameaçam a validade interna de um experimento?
As ameaças à validade interna são confundidores que oferecem explicações alternativas plausíveis para um achado de pesquisa. Esses confundidores também são chamados de variáveis de confundimento ou de confusão.
Por exemplo, sem designação aleatória, não conseguimos descartar a hipótese de que outros fatores explicam os escores distintos entre os grupos mindfulness e controle. É possível, por exemplo, que pessoas que praticam mindfulness espontaneamente tenham menores níveis de estresse do que aquelas que não o fazem — e, portanto, essa diferença seria o verdadeiro motivo dos resultados da pesquisa.
Existem várias ameaças à validade interna que podem comprometer os resultados de um estudo experimental. A seguir, abordaremos as principais ameaças que todo pesquisador deve estar atento.
História
A história se refere a eventos externos que ocorrem durante o experimento e que podem afetar os resultados. Se os participantes vivenciam um evento relevante durante o experimento, então isso pode influenciar seus comportamentos ou respostas, prejudicando a validade interna do estudo.
Por exemplo, suponha que 50% dos homens do grupo controle (vs. 0% do grupo mindfulness) tenham filhos durante o experimento de mindfulness. Nesse caso, não sabemos se os níveis de estresse são função da variável independente, da paternidade ou de ambos os fatores (Figura 1).
Outros eventos históricos também podem ameaçar a validade interna de um experimento, tais como mudanças de emprego, escola ou cônjuge; perda de ente querido; e diagnóstico clínico.
Maturação
A maturação diz respeito às mudanças que ocorrem nos próprios participantes ao longo do tempo. Essas mudanças podem ser físicas ou psicológicas, como envelhecer, ficar mais forte, desenvolver-se cognitivamente ou até mesmo ficar cansado ou entediado.
A maturação será um problema apenas se o delineamento experimental for incapaz de separar efeitos maturacionais dos efeitos da intervenção. Considere um experimento que avalia os efeitos de uma técnica de ensino sobre a aprendizagem de crianças durante o ano escolar. Nesse experimento, teremos um problema se não pudermos separar os efeitos da técnica de ensino dos efeitos do desenvolvimento cognitivo ocorrido durante o estudo.
Em tais casos, incluir um grupo controle apropriado permite aferir se os efeitos da intervenção vão além dos efeitos maturacionais. Por exemplo, a Figura 2 indica que, apesar de o grupo controle também ter aprendido ao longo do ano escolar na ausência de intervenção, os ganhos do grupo experimental estiveram acima desses prováveis efeitos maturacionais.
Testagem
A testagem pode ser uma ameaça à validade interna se os testes iniciais afetam o desempenho dos participantes em testes subsequentes. Por exemplo, os participantes podem simplesmente se lembrar das respostas que deram nos testes anteriores, de modo que o desempenho subsequente é um efeito de memória, e não um efeito genuíno da variável independente.
É improvável que a testagem seja uma ameaça à validade interna em alguns casos, tais como aqueles que envolvem medidas não reativas ou neurofisiológicas. No entanto, quando a única medida disponível envolve o autorrelato ou a realização de testes de aptidão por parte dos participantes, uma possível estratégia é garantir que haja um intervalo entre as avaliações repetidas que permita dissipar possíveis efeitos de memória.
Instrumentação
A instrumentação se refere a mudanças nos instrumentos de medição ou no processo de coleta de dados durante o experimento. Se o instrumento de aferição ficar descalibrado com o uso repetido, isso pode afetar a confiabilidade dos resultados, comprometendo a validade interna do experimento (Figura 3).
Um exemplo de instrumentação ocorre quando os aplicadores dos instrumentos se desviam progressivamente do protocolo de aplicação conforme ganham experiência. Uma estratégia para combater essa ameaça é realizar treinamentos esporádicos para reforçar a adesão ao protocolo padronizado.
Outra forma de ameaça da instrumentação é a mudança na definição operacional de uma variável. Por exemplo, imagine que uma pesquisadora investiga os efeitos de uma intervenção sobre o número de casos de violência psicológica em uma determinada região. No entanto, se a legislação modifica a definição de violência doméstica durante a pesquisa, isso pode impactar o número de casos observados de maneira artificial, isto é, sem relação direta com a intervenção avaliada.
Regressão
Suponha que pesquisadores apliquem um teste de memória em 1.000 voluntários. Em seguida, com base nos escores desses voluntários, os pesquisadores selecionam os quartis 1 e 4 da amostra, ou seja, os 250 participantes com o pior desempenho (baixa capacidade de memória) e os 250 com o melhor desempenho (alta capacidade de memória).
Após o treinamento cognitivo com esses 500 participantes, os resultados observados são os indicados na Figura 4.
Como podemos ver, os participantes do grupo baixa capacidade de memória melhoraram com o treinamento cognitivo, enquanto aqueles do grupo alta capacidade de memória pioraram. No entanto, há uma explicação alternativa para os achados: a regressão à média.
A regressão à média ocorre quando indivíduos com escores extremamente altos ou baixos tendem a se aproximar da média em medições subsequentes, apenas devido a variações naturais. A Figura 5 ilustra esquematicamente esse fenômeno. Como os participantes foram selecionados com base em seus escores no pré-teste, diferenças subsequentes no pós-teste podem ser decorrentes dos escores observados tenderem aos escores “verdadeiros”, mais próximos do centro da distribuição.
Em síntese, caso não seja devidamente controlado, esse fenômeno pode fazer com que os resultados do experimento pareçam mais informativos do que realmente são, levando pesquisadores a inferências incorretas sobre os dados.
Seleção
A seleção ocorre quando os grupos de participantes não são comparáveis no início do experimento. Se houver diferenças sistemáticas entre os grupos antes da manipulação, será difícil determinar se os resultados são realmente causados pela intervenção ou por características pré-existentes dos participantes.
Frequentemente, o viés de seleção ameaça a validade interna de um estudo quando grupos intactos de participantes são selecionados, tal como ocorre em comparações entre escolas, bairros, clínicas ou hospitais. Em tais situações, é possível que existam diferenças importantes entre esses grupos e que se confundem com a manipulação experimental.
Atrito
O atrito consiste na perda de participantes durante o experimento. Por exemplo, os participantes podem falecer, perder o interesse na pesquisa ou mesmo ter problemas de conexão durante a realização das tarefas experimentais. No entanto, o maior problema ocorre quando a perda de participante é seletiva, ou seja, ela ocorre mais em um dos grupos experimentais e está diretamente relacionada à variável dependente.
Vamos a um exemplo. Os diretores de uma academia testam os efeitos de um programa de condicionamento físico de 1 mês (Figura 6). A designação aleatória para as condições cria grupos comparáveis no início do experimento, equilibrando características dos indivíduos, como peso, nível de condicionamento físico, motivação e assim por diante, entre os dois grupos (Shaughnessy et al., 2012).
Nesse estudo hipotético, 38 de 40 participantes do grupo controle realizam o teste de condicionamento físico após 1 mês, mas apenas 25 de 40 participantes do grupo experimental permanecem no programa de condicionamento físico durante todo o mês. Suponha que um teste t para amostras independentes indique que os escores de condicionamento físico do grupo experimental sejam significativamente maiores que os escores do grupo controle.
No entanto, a perda seletiva (i.e., atrito) de participantes no grupo experimental (37,5% vs. 5% no grupo controle) levanta a hipótese de que a comparabilidade entre os grupos foi destruída. É possível, por exemplo, que os 15 participantes que abandonaram o programa de condicionamento físico tivessem um condicionamento físico inferior que os 25 participantes que concluíram o programa. Em outras palavras, os participantes que ficaram até o fim do programa de condicionamento foram justamente aqueles que diferem sistematicamente dos que desistiram.
Difusão do tratamento
A difusão do tratamento pode ocorrer quando a intervenção é administrada em grupos ou períodos não previstos. Isso acontece quando membros do grupo controle recebem, ou autoadministram, a intervenção. Isso também acontece quando membros de um grupo de intervenção recebem, parcial ou integralmente, a intervenção que era prevista apenas para outros grupos.
Por exemplo, pesquisadores designam participantes em um programa de redução de peso a uma de quatro condições experimentais: dieta restritiva em carboidratos; dieta restritiva em gorduras; dieta de baixa caloria; e condição controle, que recebeu apenas um material educacional sobre perda de peso (Figura 7).
Se participantes do grupo controle decidirem espontaneamente adotar uma das outras dietas, podemos concluir que esses participantes são nominalmente do grupo controle, embora, funcionalmente, pertençam a outro grupo. Nesse caso, a difusão do tratamento, caso ocorra com grande parte dos participantes, será uma importante ameaça à validade interna do experimento.
Qual é a diferença entre validade interna e validade externa?
Enquanto a validade interna se concentra em garantir que os resultados do experimento sejam decorrentes das manipulações feitas, a validade externa foca em quão generalizáveis são esses resultados para outras situações, contextos ou populações. Em outras palavras, a validade externa busca responder se os achados do experimento se estendem para além do contexto em que a investigação foi conduzida.
Embora os dois tipos de validade sejam importantes na pesquisa científica, salientamos que a validade interna tem primazia sobre a validade externa em estudos experimentais. O motivo para isso é simples: não faz sentido lógico discutir a generalidade das inferências causais de um experimento que possui fatores de confusão.
Dito de outro modo, antes precisamos ter resultados livres de ambiguidade para só depois questionarmos o quão generalizáveis eles são. Para uma discussão mais aprofundada sobre esse tema, recomendamos Kazdin (2016, Capítulo 2) e Mook (1983).
Validade interna e validade baseada na estrutura interna são sinônimos?
Apesar de terem nomes parecidos, validade interna e validade baseada na estrutura interna não são sinônimos. Como já tratamos ao longo deste post, a validade interna se refere à capacidade de um estudo experimental em estabelecer uma relação causal confiável entre as variáveis independentes e dependentes.
A validade baseada na estrutura interna, por sua vez, refere-se ao grau em que a estrutura das correlações entre os itens de um teste correspondem ao construto que esse teste busca mensurar. Em outras palavras, esse tipo de validade se aplica principalmente a instrumentos de autorrelato e a testes psicométricos, sendo quantificada, por exemplo, pelo alfa de Cronbach e pelo ômega de McDonald.
Concluindo, enquanto a validade interna é uma característica desejável em estudos experimentais, a validade baseada na estrutura interna é uma evidência desejável para instrumentos de autorrelato. Embora ambos os conceitos envolvam a ideia de validade, eles tratam de aspectos distintos em diferentes contextos.
Conclusão
Entender a validade interna é essencial para conduzir estudos experimentais sólidos e interpretar seus resultados corretamente. Ao conhecer os fatores que podem ameaçar essa validade, como história, maturação, testagem e seleção, os pesquisadores podem tomar medidas para controlá-los e garantir que os resultados sejam confiáveis.
A formação da Psicometria Online Academy possui um curso de Introdução à Metodologia Científica, cujo conteúdo é fundamental para quem está dando seus passos iniciais no mestrado e no doutorado.
Se você quer aprender sobre esse e outros conteúdos, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Kazdin, A. E. (2016). Research design in clinical psychology (5th ed.). Pearson.
Mook, D. G. (1983). In defense of external invalidity. American Psychologist, 38(4), 379–387. https://doi.org/10.1037/0003-066X.38.4.379
Shaughnessy, J. J., Zechmeister, E. B., & Zechmeister, J. S. (2012). Research methods in psychology (9th ed.). McGraw-Hill.
Como citar este post
Lima, M. (2024, 9 de outubro). O que é validade interna? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-validade-interna