O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é fidedignidade teste-reteste?

Marcos Lima

jan 6, 2025

A fidedignidade (ou confiabilidade) de um teste está relacionada à replicabilidade e à consistência dos escores obtidos. Psicometristas desenvolveram diferentes técnicas a fim de estimar a fidedignidade dos escores em uma amostra. Neste post, abordaremos a fidedignidade teste-reteste.

Qual é a definição de fidedignidade teste-reteste?

A fidedignidade teste-reteste é um conceito essencial na psicometria. Ela avalia a consistência dos escores de um teste ao longo do tempo. Ou seja, ela avalia se os resultados de um teste se mantêm estáveis quando aplicados mais de uma vez.

Por exemplo, imagine que um teste de habilidades matemáticas foi aplicado em janeiro e, novamente, em fevereiro. Se os resultados das duas testagens forem semelhantes, concluíremos, portanto, que os escores têm alta fidedignidade teste-reteste.

A Figura 1 apresenta um diagrama de dispersão de um cenário idealizado, onde a fidedignidade teste-reteste é perfeita. Por exemplo, isso poderia representar o caso em que todos os participantes obtiveram exatamente os mesmos escores de habilidades matemáticas em janeiro e em fevereiro.

diagrama de dispersão ilustrando fidedignidade teste-reteste perfeita.
Figura 1. Diagrama de dispersão representando correlação perfeita entre mensurações nos Tempos 1 e 2.

Na prática, contudo, nossas medidas são representações imperfeitas dos construtos de interesse. Por isso, esperamos erro de mensuração e, consequentemente, estimativas imperfeitas de fidedignidade. Sendo assim, a Figura 2 mostra um cenário mais realista, com elevada correlação entre os escores nas duas ocasiões.

diagrama de dispersão ilustrando o conceito de fidedignidade teste-reteste.
Figura 2. Diagrama de dispersão representando correlação alta (r = 0,83) entre mensurações nos Tempos 1 e 2.

Por que a fidedignidade teste-reteste é importante?

A fidedignidade teste-reteste é importante porque ela nos ajuda a avaliar se as mudanças nos escores após uma intervenção são maiores do que aquelas que seriam esperadas apenas devido a erros de mensuração.

Por exemplo, considere que queremos avaliar se uma intervenção melhora as habilidades matemáticas de estudantes do ensino médio. Para esse fim, pretendemos conduzir um estudo pré-teste/pós-teste, com a aplicação de nossa intervenção entre as duas testagens.

No entanto, considere que, em um estudo preliminar com uma amostra de estudantes do ensino médio, concluímos que a fidedignidade teste-reteste dos escores de habilidades matemáticas é baixa, r = 0,50. Desse modo, será mais difícil detectarmos efeito de nossa intervenção no estudo principal, pois eventuais mudanças nos escores podem se dever a efeitos genuínos da intervenção, a erros de mensuração ou a uma combinação dos dois fatores.

Além disso, a fidedignidade teste-reteste também é importante para a tomada de decisão. Por exemplo, os escores de um teste usado para fins diagnósticos devem apresentar adequada fidedignidade teste-reteste.

Uma baixa fidedignidade implicaria que muitos respondentes ora poderiam obter escores acima do ponto de corte para diagnóstico clínico, ora abaixo do ponto de corte. Tal inconsistência na conclusão de testagens sucessivas indicaria que o teste possui pouca utilidade para a tomada de decisão.

Saiba mais: Qual é a diferença entre sensibilidade e especificidade?

diferença entre sensibilidade e especificidade.

Como determinar a fidedignidade teste-reteste?

Estudos de fidedignidade teste-reteste assumem que o construto de interesse é estável. Com base nessa premissa, pesquisadores coletam dados dos mesmos participantes, sob procedimentos de aplicação similares, com um intervalo entre as aplicações.

Usando esse delineamento, a fidedignidade teste-reteste pode ser aferida por meio de coeficientes de correlação (e.g., r de Pearson ou, como recomendam alguns metodólogos, por meio do coeficiente de correlação intraclasse). Essa medida permite avaliar o grau de estabilidade temporal dos escores.

Se houver uma alta correlação (> 0,80) entre as pontuações obtidas nas duas aplicações, isso indica que os escores possuem estabilidade temporal. Em outras palavras, há uma considerável manutenção dos escores nas duas mensurações sucessivas.

Em contrapartida, quanto menor for o coeficiente de correlação, menor será a correspondência entre os escores obtidos nas duas mensurações e, por conseguinte, maior será a parcela de variância de erro.

banner da Psicometria Online Academy.

Quais fatores influenciam a fidedignidade teste-reteste?

Vários fatores podem influenciar a fidedignidade teste-reteste. O intervalo de tempo entre as aplicações é um dos mais importantes. Intervalos muito curtos podem levar a coeficientes mais elevados simplesmente em decorrência de efeitos de memória (i.e., os participantes não respondem conforme suas habilidades ou atitudes, mas sim em função do que se lembram de ter respondido anteriormente).

Em contrapartida, intervalos longos podem introduzir mudanças reais no construto sob avaliação. Em nosso exemplo sobre habilidades matemáticas, um intervalo de um ano pode ser grande o suficiente para que as habilidades dos estudantes sofram mudanças genuínas em virtude do processo educacional. Nesse caso, não seremos capazes de avaliar a estabilidade de seus escores.

Além disso, variações no estado em diferentes aplicações inserem ruído no processo de mensuração e, portanto, reduzem a fidedignidade. Por exemplo, suponha que um respondente dormiu mal antes da segunda aplicação do teste de habilidades matemáticas. Presumivelmente, isso pode afetar o desempenho dele de uma maneira importante, ainda que irrelevante ao construto sob avaliação.

Outros fatores que podem diminuir a fidedignidade teste-reteste, comuns a outras medidas de fidedignidade, incluem a falta de compreensão ou de cuidado nas respostas por parte dos respondentes, a ambiguidade dos itens e a baixa variabilidade amostral em termos da característica sob avaliação.

Por fim, fatores durante a testagem também afetam a fidedignidade. Por exemplo, a presença de elementos distratores (como ruídos externos) e a falta de padronização no procedimento de administração (como instruções distintas nas diferentes sessões) inserem fontes de variância irrelevantes ao construto de interesse e, portanto, diminuem a fidedignidade.

Saiba mais: Qual a diferença entre fidedignidade e validade de um teste?

validade versus fidedignidade.

Como maximizar as estimativas de fidedignidade teste-reteste?

Pesquisadores podem adotar algumas estratégias para diminuir o erro de mensuração e, consequentemente, aumentar a fidedignidade teste-reteste. Entre elas, é importante treinar e instruir a equipe de pesquisa quanto à importância da padronização nos procedimentos de administração dos instrumentos em todas as sessões.

Além disso, pesquisadores devem evitar o problema da restrição de amplitude (restriction of range), um artefato estatístico onde a amplitude dos escores em uma amostra é mais restrita que a amplitude desses mesmos escores na população de interesse.

Por exemplo, suponha que pesquisadores recrutem apenas participantes com uma faixa restrita de habilidades matemáticas (ao redor da média), tal como indicado pelos pontos entre as duas retas vermelhas da Figura 3. Nesse caso, a fidedignidade teste-reteste seria de 0,64.

fidedignidade teste-reteste e o problema da restrição de amplitude.
Figura 3. Ilustração do problema de restrição de amplitude.

Contudo, quando consideramos todos os pontos da Figura 3, a correlação sobe de 0,64 para 0,83. A mensagem é simples, mas poderosa: no processo de amostragem, pesquisadores devem se esforçar para recrutar participantes em todo o continuum do traço latente de interesse.

Por fim, o maior desafio de estudos de fidedignidade teste-reteste consiste em definir qual é o intervalo adequado entre teste e reteste. Embora intervalos de 1 a 2 semanas sejam comumente adotados, Polit (2014) argumenta que, infelizmente, a decisão dos intervalos costumam se basear em pressupostos, ao invés de em evidências, sobre a estabilidade do construto.

Estabilidade temporal dos escores versus estabilidade temporal do construto

O objetivo do estudo de fidedignidade teste-reteste não é verificar se o construto apresenta estabilidade temporal, mas, partindo do pressuposto de que ele é estável, estimar a estabilidade temporal dos escores relacionados a esse construto. Em outras palavras, é necessário assumir que o construto é temporalmente estável para que possamos estimar a fidedignidade dos escores.

Portanto, como regra geral, a fidedignidade teste-reteste é indicada apenas quando há evidências de que o construto avaliado é estável (e.g., traços de personalidade, inteligência) no intervalo de tempo considerado.

Por outro lado, esse tipo de fidedignidade é inadequado para construtos que refletem estados transitórios (e.g., humor, estresse agudo).

Isso ocorre porque, quando há mudanças nos escores entre as mensurações, não é possível determinar se essas variações decorrem de alterações reais no construto ao longo do tempo, da baixa fidedignidade do instrumento ou de uma combinação desses fatores.

Conclusão

Neste post, você aprendeu sobre a fidedignidade teste-reteste. Esperamos que esse post tenha sido útil! Aproveite e se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades!

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Bandalos, D. L. (2018). Measurement theory and applications for the social sciences. The Guilford Press.

McCrae, R. R., Kurtz, J. E., Yamagata, S., & Terracciano, A. (2011). Internal consistency, retest reliability, and their
implications for personality scale validity. Personality and Social Psychology Review, 15(1), 28–50. https://doi.org/10.1177/1088868310366253

Polit, D. F. (2014). Getting serious about test–retest reliability: A critique of retest research and some recommendations. Quality of Life Research, 23(6), 1713–1720. https://doi.org/10.1007/s11136-014-0632-9

Zanon, C., & Hauck Filho, N. (2015). Fidedignidade. In C. S. Hutz, D. R. Bandeira, & C. M. Trentini (Orgs.), Psicometria (pp. 85–95). Artmed.

Como citar este post

Lima, M. (2025, 6 de janeiro). O que é fidedignidade teste-reteste? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-fidedignidade-de-teste-reteste/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Validade baseada na estrutura interna

O que é validade convergente?

Validade dos testes psicológicos

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

O que são médias marginais?

O que é e quando usar o teste de Kruskal-Wallis?

O que é regressão logística?

Validade baseada na estrutura interna

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias