Sensibilidade e especificidade são métricas fundamentais em estudos de acurácia diagnóstica. Neste post, vamos explicar o que são essas métricas, qual a diferença entre elas e como calculá-las. Além disso, mostraremos como sensibilidade e especificidade estão inversamente relacionadas. Por fim, apresentaremos alguns sinônimos desses termos que você precisa conhecer.
Introdução
A princípio, considere um teste qualquer que visa identificar se uma condição está presente ou ausente. Esse teste é uma ferramenta avaliativa. Exemplos de ferramentas incluem testes de gravidez, exames de mamografia e, de maior relevância para psicometristas, instrumentos de autorrelato.
A condição, por sua vez, é aquilo que queremos detectar com algum nível de acurácia. Por exemplo, podemos querer identificar gravidez, câncer de mama ou depressão clínica.
Para ilustrar esses conceitos, a Figura 1 apresenta uma tabela de contingências 2 × 2 (isto é, uma matriz de confusão). Essa tabela representa os quatro cenários possíveis, a partir do cruzamento da condição dos casos e do resultado do teste.
Um teste ideal, que apresenta um desempenho perfeito, produziria apenas verdadeiros positivos e verdadeiros negativos. Por exemplo, esse teste ideal sempre identificaria corretamente a presença de câncer de mama quando ele realmente está presente. Além disso, indicaria a ausência de câncer quando a condição realmente não está presente.
Na prática, no entanto, os testes são falíveis. Dada essa falibilidade, nosso objetivo é quantificar a acurácia diagnóstica desses instrumentos. Assim, a sensibilidade e a especificidade tornam-se duas métricas úteis para essa finalidade.
O que são sensibilidade e especificidade?
A sensibilidade mede a capacidade de um teste em identificar corretamente os verdadeiros positivos, ou seja, aqueles que realmente possuem a condição sendo testada. Portanto, a sensibilidade é uma medida da proporção de casos positivos que o teste consegue reconhecer corretamente como positivos (Figura 2).
Por outro lado, a especificidade mede a capacidade de um teste em identificar corretamente os verdadeiros negativos, ou seja, aqueles que não possuem a condição sendo testada. Assim, a especificidade é uma medida da proporção de casos negativos que o teste reconhece corretamente como negativos (Figura 3).
Dessa forma, a sensibilidade se concentra nos casos positivos, enquanto a especificidade se dedica aos casos negativos. Assim, ambas as métricas oferecem perspectivas complementares sobre a acurácia diagnóstica do teste.
Como calcular sensibilidade e especificidade?
Antes de considerarmos um exemplo numérico, iremos abordar outro conceito importante: a acurácia. A acurácia se refere à capacidade geral do teste de identificar corretamente os casos (Figura 4).
Em outras palavras, a acurácia fornece um índice geral do desempenho de um teste, independentemente dos tipos de acertos que ele apresenta.
Agora, considere o seguinte exemplo: pesquisadores recrutaram 350 participantes, dos quais 150 tinham diagnóstico clínico de depressão. Para avaliar a acurácia do teste em discriminar quem tem de quem não tem depressão, foi aplicado um inventário de depressão. A Figura 5 apresenta os dados desse exemplo, juntamente com os cálculos de sensibilidade e especificidade para um determinado ponto de corte.
Nesse exemplo, a acurácia geral do teste é de 72%, isto é, acurácia = (135 + 118) / (135 + 118 + 82 + 15) = 0,72. No entanto, a inspeção apenas da acurácia não nos permite avaliar se o teste desempenha de formas distintas entre pessoas com e sem depressão. Para isso, precisamos considerar a sensibilidade e a especificidade.
A Figura 5 indica que o ponto de corte do inventário de depressão acerta corretamente 90% dos diagnósticos positivos de depressão, mas refuta corretamente os diagnósticos de depressão em apenas 59% dos casos. Desse modo, concluímos que o ponto de corte fornece alta sensibilidade, mas relativamente baixa especificidade.
Qual é a relação entre sensibilidade e especificidade?
Há uma relação inversa entre sensibilidade e especificidade. Ou seja, quando aumentamos a sensibilidade, a especificidade tende a diminuir, e vice-versa. Isso acontece porque, ao tentar identificar mais casos positivos, acabamos incluindo mais falsos positivos, comprometendo a capacidade do teste em identificar corretamente os negativos.
Por exemplo, imagine um juiz que condena com facilidade (mais rigoroso). Ele é como um teste com alta sensibilidade: identifica culpados com frequência, mas pode acabar condenando inocentes (baixa especificidade). Seu foco é evitar que culpados escapem, mesmo que isso signifique punir alguns inocentes.
Por outro lado, um juiz que prefere presumir a inocência (mais indulgente) é como um teste com alta especificidade. Ele raramente condena inocentes, mas, como consequência, pode deixar muitos culpados escaparem (baixa sensibilidade). Sua prioridade é evitar punir os inocentes, mesmo que isso permita que alguns culpados passem despercebidos.
A Figura 6 ilustra esses dois cenários. Nessa metáfora, os juízes são os “testes”, enquanto os verdadeiros status de culpa ou inocência são as “condições”.
A mesma lógica se aplica em outros contextos, como testes psicológicos. A Figura 7 mostra essa relação com base em um ponto de corte para diagnóstico de depressão. Se aumentarmos o ponto de corte (deslocando a linha vermelha para a direita), aumentaremos a especificidade, mas diminuiremos a sensibilidade. Por outro lado, se diminuirmos o ponto de corte (deslocando a linha vermelha para a esquerda), aumentaremos a sensibilidade, mas diminuíremos a especificidade.
Quais são as aplicações dos conceitos de sensibilidade e especificidade?
Os conceitos de sensibilidade e especificidade estão presentes em diferentes áreas da pesquisa quantitativa. Abaixo, exploramos três áreas específicas:
Curva ROC
Em estudos de acurácia diagnóstica, os pesquisadores avaliam a acurácia de uma nova medida, chamada de teste índice, em discriminar casos positivos de negativos. Para isso, eles usam uma medida padrão-ouro como critério externo de comparação.
Nesse contexto, a curva ROC (receiver operating characteristic) é uma ferramenta que ajuda a visualizar a relação entre sensibilidade e especificidade. Mais especificamente, a curva ROC plota a relação entre 1 – especificidade, no eixo x, contra a sensibilidade, no eixo y, considerando diferentes pontos de corte (Figura 8).
A curva ROC, como a da Figura 8, tem o objetivo de identificar o melhor ponto de corte para maximizar a acurácia na classificação de casos positivos e negativos. Em outras palavras, ela busca determinar o ponto de corte que mais se aproxima do canto superior esquerdo do gráfico, o que indicaria um teste perfeito.
Revisões de literatura
Em revisões de literatura, os conceitos de sensibilidade e especificidade estão, no mínimo, implícitos nos critérios de busca. Idealmente, queremos selecionar palavras-chave e operadores booleanos que sejam altamente sensíveis (ou seja, que retornem os registros relevantes ao tema em investigação) e altamente específicos (ou seja, que retornem uma quantidade mínima, ou idealmente nula, de registros irrelevantes).
Machine learning
Em machine learning, sensibilidade e especificidade são fundamentais para avaliar o desempenho de modelos preditivos, especialmente em classificação binária. Desse modo, esses conceitos ajudam a determinar o quão eficaz um modelo é na previsão correta dos resultados.
Nesses casos, o teste é substituído pelo modelo estatístico em avaliação. Por exemplo, em uma regressão logística, é possível medir quão bem o modelo prevê corretamente o pertencimento dos casos às categorias da variável critério. Além de uma avaliação geral (ou seja, acurácia), podemos também avaliar a sensibilidade e a especificidade.
Sinônimos de sensibilidade e especificidade
Anteriormente, utilizamos os termos sensibilidade e especificidade de forma consistente. No entanto, existem alguns sinônimos para esses conceitos que são usados em diferentes áreas de pesquisa. É importante que você conheça essa terminologia para entender melhor a literatura sobre acurácia diagnóstica.
Abaixo, apresentamos uma breve lista de sinônimos:
- Sensibilidade: taxa de verdadeiros positivos, probabilidade de detecção recall, hit rate, poder estatístico;
- Especificidade: taxa de verdadeiros negativos, seletividade, taxa de rejeição correta.
Conclusão
Neste post, você aprendeu o que é, como calcular e qual a diferença entre sensibilidade e especificidade. A compreensão desses conceitos é fundamental para aqueles interessados na acurácia diagnóstica de diferentes instrumentos de avaliação.
Se você quer aprender sobre esse e outros conteúdos, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Dwyer, D. B., Falkai, P., & Koutsouleris, N. (2018). Machine learning approaches for clinical psychology and psychiatry. Annual Review of Clinical Psychology, 14, 91–118. https://doi.org/10.1146/annurev-clinpsy-032816-045037
Gonçalves, A. P., Pianowski, G., & Carvalho, L. F. (2021). Indicadores de acurácia diagnóstica. In C. Faiad, M. N. Baptista & R. Primi (Orgs.), Tutoriais em análise de dados aplicados à psicometria (pp. 128–142). Editora Vozes.
Starmer, J. (2022). The StatQuest illustrated guide to machine learning!!! StatQuest.
Como citar este post
Lima, M. (2024, 17 de outubro). Qual é a diferença entre sensibilidade e especificidade? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/qual-e-a-diferenca-entre-sensibilidade-e-especificidade/