O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Qual é a diferença entre desvio-padrão e erro-padrão?

Marcos Lima

fev 28, 2023

Desvio-padrão e erro-padrão são conceitos importantes no campo da estatística e da análise de dados. Ambas as métricas estimam a variação nos dados. Contudo, cada uma delas tem propósitos distintos.

Neste post, introduziremos as definições, os cálculos e as diferenças entre desvio-padrão e erro-padrão. Além disso, também explicaremos quando cada uma das medidas é utilizada em relatos científicos.

Desvio-padrão

O que é?

Em primeiro lugar, vamos entender o desvio-padrão. O desvio-padrão é uma medida de dispersão que indica o quanto os valores de um conjunto de dados se afastam da média. Com frequência, essa medida pode ser útil para nos ajudar a determinar o quão agrupados ou dispersos os valores estão em torno da média.

Por exemplo, considere os dois painéis da Figura 1, que representam conjuntos de dados com médias iguais (Ms = 35, denotadas pelas linhas horizontais cinzas).

Ilustra o conceito de desvio-padrão mostrando a variabilidade das observações ao redor das médias.
Figura 1. Exemplos de conjuntos de dados mais dispersos (amostra A) e menos dispersos (amostra B).

Primeiramente, note que as linhas pontilhadas vermelhas representam a distância de cada observação em relação à média do conjunto de dados. Sendo assim, podemos concluir que a variabilidade dos dados ao redor da média é maior na amostra A que na amostra B.

Como veremos a seguir, os valores dos desvios-padrões refletirão os diferentes níveis de dispersão de cada conjunto de dados.

Como calcular?

A fórmula usada para calcular o desvio-padrão amostral é dada por:

fórmula do desvio-padrão

onde xi é o valor da observação i, x-barra representa a média dos valores no conjunto de dados e N é o número de dados na amostra. O operador de somatório, ∑, indica que repetimos N vezes cada operação realizada no numerador da fórmula, uma para cada observação do conjunto de dados.

Se a fórmula do desvio-padrão te assustou, não se preocupe! A seguir, iremos destrinchá-la de maneira didática. Resumidamente, podemos dividir o cálculo do desvio-padrão em seis passos:

  1. Calcule a média do conjunto de dados;
  2. Subtraia a média de cada valor observado para obter os desvios. Por um lado, dados abaixo da média terão desvios negativos; por outro lado, dados acima da média terão desvios positivos. Graficamente, os desvios são expressos pelas linhas pontilhadas vermelhas da Figura 1;
  3. Eleve cada um dos desvios ao quadrado para torná-los todos positivos;
  4. Some os desvios quadráticos;
  5. Divida a soma pelo número de dados menos um para obter a variância;
  6. Calcule a raiz quadrada da variância para obter o desvio-padrão.

Na prática você provavelmente não precisará calcular o desvio-padrão manualmente. Os softwares estatísticos farão os cálculos para você. No entanto, realizar os cálculos uma ou duas vezes é útil para entender o conceito. Por isso, faremos os cálculos para os conjuntos de dados que introduzimos anteriormente.

As Figuras 2 e 3 ilustram o cálculo do desvio-padrão em seis passos. Na Figura 2, implementamos os seis passos que produzem o desvio-padrão para a Amostra A da Figura 1.

Figura 2. Implementação dos seis passos para cálculo do desvio-padrão para a Amostra A.

Já na Figura 3, implementamos os seis passos que produzem o desvio-padrão para a Amostra B da Figura 1.

Figura 3. Implementação dos seis passos para cálculo do desvio-padrão para a Amostra B.

Como interpretar?

Com base nas Figuras 2 e 3, concluímos que a maior dispersão dos dados na Amostra A se reflete em um desvio-padrão mais elevado (DP = 18,71), que aquele obtido na Amostra B (DP = 7,48), cujas observações são menos dispersas.

Em síntese, um desvio-padrão baixo indica que os valores das observações estão mais próximos da média (isto é, os dados estão menos dispersos). Por outro lado, um desvio-padrão alto indica que os valores das observações estão mais distantes da média (isto é, os dados estão mais dispersos).

Erro-padrão

O que é?

O erro-padrão é uma medida de quão bem a média de uma amostra representa a média da população da qual ela foi retirada. Em outras palavras, ele estima o quão precisamente a média da amostra representa a média da população.

Em síntese, quanto menor for o erro-padrão, mais precisamente a média da amostra representará a média da população. Por exemplo, se o erro-padrão for baixo, esperaremos pouca variabilidade em estimativas da média populacional em amostragens hipotéticas sucessivas. Por outro lado, se o erro-padrão for elevado, esperaremos grande variabilidade na estimativa ao longo de amostragens hipotéticas sucessivas.

Como calcular?

O erro-padrão é calculado por meio da seguinte fórmula:

fórmula do erro-padrão

onde σ é o desvio-padrão populacional e N é o número de observações. Contudo, como o valor de σ é desconhecido, estimamos o erro-padrão substituindo σ pelo desvio-padrão amostral.

Para ilustrar o conceito do erro-padrão, vamos considerar um novo exemplo. Primeiramente, considere que sabemos que os escores de inteligência estão normalmente distribuídos na população, com média igual a 100 e desvio-padrão igual a 15.

Considere que selecionamos aleatoriamente 5 casos dessa população e mensuramos a inteligência dos elementos dessa amostra. Esse procedimento é repetido 10 mil vezes, com reposição. Em outras palavras, os membros da amostra são devolvidos à população de origem e podem ser sorteados novamente no futuro.

Suponha que repetimos esse mesmo procedimento para amostras com 50 casos cada. Da mesma forma, em ambos os casos, quer com 5 ou com 50 casos, nós guardamos os valores das médias obtidas em cada amostra.

Por fim, considerando os dois cenários, tente responder: em qual dos dois cenários anteriores você acredita que as médias amostrais oscilarão mais de amostra para amostra?

  1. Nas amostras com 5 casos cada;
  2. Nas amostras com 50 casos cada;
  3. A oscilação será igual nos dois cenários.

Como interpretar?

Os dois cenários são constratados nos histogramas da Figura 4. Esses gráficos representam a variabilidade nas médias observadas em amostras de 5 casos e em amostras de 50 casos. Ressaltando: os valores plotados no gráfico não representam observações, mas sim médias amostrais de diferentes amostras hipotéticas.

Ilustra o conceito de erro-padrão mostrando a variabilidade da média em amostragens aleatórias sucessivas.
Figura 4. Distribuição de médias amostrais para amostras pequenas (painel esquerdo) e amostras grandes (painel direito).

Em síntese, em amostras menores (Figura 4, painel esquerdo), a variabilidade das médias ao longo de amostragens sucessivas é bem maior (EP = 6,72) do que em amostras maiores (EP = 2,12; Figura 4, painel direito).

Isso significa que é mais provável que se observem médias amostrais muito discrepantes da média populacional quando a amostra é menor. Em contrapartida, em amostras maiores, as médias tendem a se agrupar mais próximas da média populacional.

Contudo, na prática de pesquisa real, realizamos um único estudo, e não milhares de amostragens sucessivas. O que temos, portanto, é uma única média dos histogramas da Figura 4.

Desse modo, em aplicações reais, o erro-padrão visa justamente estimar a variabilidade que seria esperada se estimássemos um parâmetro repetidamente. Um erro-padrão maior indica que temos maior incerteza sobre o real valor do parâmetro de interesse, enquanto um erro-padrão menor indica menor incerteza.

Qual é a diferença entre desvio-padrão e erro-padrão?

Primordialmente, a diferença entre desvio-padrão e erro-padrão está no que cada um deles mede. O desvio-padrão quantifica a dispersão dos valores em um conjunto de dados em relação à média amostral. Por outro lado, o erro-padrão estima a dispersão da média amostral em relação à média populacional.

Adicionalmente, podemos considerar a diferença entre os conceitos com base nos fatores que afetam cada uma dessas estatísticas. Podemos usar o desvio-padrão amostral para estimar o desvio-padrão populacional. Desse modo, se a dispersão dos dados populacionais for grande, o desvio-padrão amostral também tenderá a ser maior.

Por outro lado, o erro-padrão quantifica a acurácia da média amostral em estimar a média populacional. Assim, conforme o tamanho da amostra aumenta, o erro-padrão tende a ficar cada vez mais próximo de zero.

Quando usar desvio-padrão e erro-padrão?

Em termos de aplicação, o desvio-padrão é amplamente utilizado para medir a dispersão dos valores em torno da média, assim como para identificar valores discrepantes e para comparar a variabilidade de diferentes conjuntos de dados.

Por outro lado, o erro-padrão permite realizar inferência estatística por meio de teste de hipóteses, e a estimação de parâmetros, por meio do cálculo de intervalos de confiança.

Se ainda não estiver claro para você os diferentes usos das duas estatísticas, considere a seguinte metáfora. Por um lado, entenda o desvio-padrão como a estrela principal de um espetáculo, quando se trata de medir a dispersão dos dados. Por outro lado, pense no erro-padrão como o coadjuvante com uma aparição breve, mas que é importante para garantir que a produção seja um sucesso.

Conclusão

Neste post, você aprendeu o que é desvio-padrão e o que é erro-padrão. Além disso, você aprendeu quais são as diferenças conceituais e de uso do desvio-padrão e do erro-padrão. Em resumo, a Figura 5 contrasta os pontos essenciais dos conceitos de desvio-padrão e erro-padrão.

Contrasta e sumariza os conceitos de desvio-padrão e erro-padrão.
Figura 5. Contraste entre desvio-padrão e erro-padrão.

Gostou desse conteúdo? Precisa aprender análise de dados? Então faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.

Howell, D. C. (2013). Sampling distributions and hypothesis testing. In D. C. Howell, Statistical methods for psychology (8th ed., pp. 83–106).

Como citar este post

Lima, M. (2023, 28 de fevereiro). Qual é a diferença entre desvio-padrão e erro-padrão? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/a-diferenca-entre-desvio-padrao-e-erro-padrao/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Respostas de 6

  1. Olá. Excelente sua explicação, porém fiquei com uma dúvida: para o cálculo do erro-padrão, o desvio padrão utilizado é o populacional (como menciona aqui) ou o amostral? E por que?

    EP = σ / raizquadrada(n)
    Onde:
    EP é o erro-padrão
    σ é o desvio-padrão da população (me refiro a esse ponto).
    n é o tamanho da amostra

    1. Oi, Francisco. A definição do erro-padrão considera o desvio-padrão populacional, σ. Essa é a teoria. Agora, na prática, nós raramente sabemos qual é o valor de σ. Então usamos DP como uma estimativa de σ, e o EP que obtemos em nosso cálculo passa a ser uma estimativa do erro-padrão, ao invés do valor real propriamente dito. Espero ter esclarecido a diferença.

      Equipe Psicometria Online.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Qual é o papel da matemática na carreira de psicometrista?

O que é correção de Bonferroni?

Qual é a diferença entre aprendizagem supervisionada e não supervisionada?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

O que é validade convergente?

Validade dos testes psicológicos

Como realizar a análise de variância no JASP?

O que é análise multivariada de variância (MANOVA)?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias