Antes de inserir as informações dos seus surveys ou experimentos no SPSS ou em qualquer outro software de análise de dados, é essencial preparar um livro de códigos. Este livro de códigos, ou codebook, é um documento que explica detalhadamente os códigos usados no banco de dados para se referir às variáveis e aos valores atribuídos a elas.
Neste post, você receberá dicas importantes para criar o seu livro de códigos. Primeiramente, explicaremos o que é um livro de códigos e por que ele é importante. Em seguida, apresentaremos exemplos das informações essenciais que devem estar incluídas no seu livro de códigos. Por fim, indicaremos um post complementar a este conteúdo.
O que é e qual é a importância do livro de códigos?
A expressão livro de códigos pode ter significados variados em diferentes áreas do conhecimento. No campo das ciências sociais e comportamentais, o livro de códigos é um resumo das instruções usadas para converter as informações coletadas em dados legíveis pelo software estatístico.
Por exemplo, imagine que aplicamos o Questionário de Ansiedade com o SPSS em uma amostra de estudantes universitários. Este questionário inclui 23 itens, como “Estatística me faz chorar” e “Meus amigos são melhores no SPSS do que eu”. As respostas são registradas em uma escala de cinco pontos, que varia de 1 (Discordo totalmente) a 5 (Concordo totalmente).
Se nomearmos as colunas de nosso banco de dados com o enunciado completo de cada item, os títulos das colunas ficarão muito extensos e poluídos. Além disso, se armazenarmos apenas as respostas numéricas dos participantes (de 1 a 5), outros pesquisadores podem ter dificuldade em compreender o que cada número representa sem as âncoras associadas. Por exemplo, um pesquisador poderia se perguntar: “a escala de 1 a 5 é de concordância, de frequência ou de importância?”
Portanto, o livro de códigos documenta a terminologia e a codificação usadas no banco de dados, aumentando a transparência e facilitando o entendimento para aqueles que não participaram do estudo original. Esse documento também é útil para o próprio pesquisador, caso precise revisar o banco de dados após um tempo.
Como preparar o livro de códigos?
Preparar o livro de códigos envolve decidir como rotular cada variável e como atribuir números para representar as respostas possíveis. Desse modo, você pode pensar nesse livro como um dicionário de variáveis, que contém o mapeamento entre símbolos numéricos e seus significados no contexto da pesquisa científica.
Em seu livro de códigos, liste todas as variáveis na mesma ordem em que elas aparecem no banco de dados. Embora esse ordenamento não seja estritamente necessário, ele será útil para você se localizar quando transitar entre o banco de dados e o livro de códigos.
Além disso, mapeie a relação entre o nome abreviado da variável (e.g., estado_civil), o nome completo da variável (e.g., Qual é o seu estado civil?), e as instruções de codificação para os valores dessa variável (e.g., 0 = Solteiro, 1 = Casado, 2 = Divorciado, 3 = Viúvo).
Uma boa prática é preparar o livro de códigos enquanto você inspeciona o banco de dados. Muitas vezes, surgirão inconsistências que precisarão ser padronizadas. Por exemplo, se a pergunta “Qual é a sua escolaridade?” foi respondida de forma aberta, você pode encontrar respostas equivalentes, como “Ensino médio completo”, “Médio completo” e “2º grau completo”.
Nesse caso, você deve padronizar as respostas, talvez utilizando “Ensino médio completo” para todas. Documente essas padronizações em uma coluna de Observações no livro de códigos.
Por fim, como você estará manipulando diretamente o banco de dados, é essencial manter uma cópia de segurança do banco de dados, na qual você não fará modificações. Assim, caso cometa algum erro, você poderá retornar ao banco de dados original sem comprometer a integridade dos dados.
Exemplos de decisões durante a elaboração do livro de códigos
A seguir, ilustramos algumas decisões comuns durante a elaboração do livro de códigos. Contudo, esses exemplos não cobrem todas as possibilidades. Para mais orientações, consulte Pallant (2010).
Variável de identificação
Para começar, atribua um número único que identifique cada caso da amostra, ou seja, uma variável de identificação. Comumente chamada de ID, essa variável discrimina cada respondente. Idealmente, o número deve ser escolhido de tal modo que proteja a identidade dos participantes.
Por exemplo, suponha que os participantes responderam em papel e caneta. Durante a tabulação, números pseudoaleatórios podem ser gerados para cada participante e registrados a lápis nos questionários. Em caso de erros de tabulação, a variável ID permitirá verificar a correspondência correta entre os questionários e o banco de dados.
Variáveis categóricas
Em seguida, inclua variáveis sociodemográficas em seu livro de códigos. Embora tais variáveis costumem ser categóricas, é importante representá-las de forma numérica. Por exemplo, para a variável sexo, você pode arbitrariamente atribuir 0 = Feminino e 1 = Masculino.
A Figura 1 mostra um exemplo de como as variáveis ID, sexo, estado_civil e escolar podem ser organizadas no livro de códigos. Note que o livro de códigos não é o banco de dados, mas sim uma planilha auxiliar que ajudará os usuários a utilizar e a interpretar adequadamente o banco de dados. Essa planilha contém o nome abreviado da variável no SPSS, o nome completo da variável, as instruções de codificação e as observações relevantes.
Variáveis numéricas e suas unidades
No caso de variáveis numéricas, inclua a unidade de medida utilizada. Por exemplo, a variável idade costuma ser mensurada em anos (para adultos) ou em meses (para crianças, em estudos desenvolvimentais). Já o desempenho pode ser expresso em escore bruto, escore z, ou percentual de acertos.
A Figura 2 ilustra variáveis como idade, fumo e memoria no livro de códigos. Evitamos o uso de acentos, como em memoria, para facilitar a inserção do nome no SPSS. Incluímos a unidade de medida na coluna Instruções de Codificação, enquanto a coluna Observações contém registros adicionais sobre cada uma das variáveis.
Por exemplo, indicamos que os participantes com valor 999 representam informações ausentes (e não a idade desses casos). Já o valor 0 indica que alguém não é fumante, na variável fumo. Por fim, indicamos que o desempenho no teste de memória (memoria) varia entre 0 e 35 pontos. Essa informação é relevante, pois assim poderemos posteriormente transformar o desempenho dos participantes em termos percentuais, caso seja de nosso interesse.
Instrumentos de autorrelato
Vamos retomar o exemplo do Questionário de Ansiedade com o SPSS. Em seguida, vamos nos referir a esse questionário como QAS. Essa abreviação será usada no nome das variáveis no SPSS ou em outro software de análise de dados.
É esencial que cada item do instrumento tenha um nome único, isto é, que não seja compartilhado com as demais variáveis. Por exemplo, uma escolha simples consiste em denominar os itens como QAS01, QAS02, até o QAS23. As três primeiras letras indicam que a variável se refere a um item do QAS, enquanto o número consiste na identificação de cada item da escala.
A Figura 3 ilustra as informações dos três primeiros itens do QAS, contendo o nome abreviado da variável no SPSS, o nome completo da variável, instruções de condificação e observações. Nela, acrescentamos a redação original de cada item na coluna Nome completo da variável. Isso será útil caso desejemos entender o padrão de respostas nos diferentes itens de nosso instrumento, com base no enunciado de cada item.
Conclusão
Neste post, você aprendeu o que é e qual é a importância do livro de códigos. Além disso, você recebeu dicas importantes para criar o seu livro de códigos. Lembre-se de deixar seu livro de códigos na mesma pasta que o seu banco de dados, pois esses arquivos devem ser usados concomitantemente.
Caso você queira aprender mais sobre como montar seu banco de dados, recomendamos outro post do blog, que te dará dicas valiosas sobre como estruturar adequadamente os seus dados no SPSS.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Pallant, J. (2010). SPSS survival manual: A step by step guide to data analysis using SPSS (4th ed.). McGraw-Hill.
Como citar este post
Lima, M. (2021, 5 de novembro). Preparando o livro de códigos para as análises de dados. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/preparando-o-livro-de-codigos/