O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Análise textual: o software IRAMUTEQ

Alex França

jan 5, 2023

A análise textual pode ser definida como um tipo específico de análise de dados, que se trata especificamente da análise de material verbal transcrito. Esses materiais podem ser de diversos tipos, tais como: textos originalmente escritos, entrevistas, documentos, redações, entre outros.

Por se tratar essencialmente de linguagem, tais dados possuem alta relevância para quem pretende investigar pensamentos, crenças e opiniões ou qualquer conteúdo simbólico produzido em relação a determinado fenômeno.

Ponto interessante da análise textual é ir além da dicotomia entre quantitativo e qualitativo na análise de dados. Na análise textual, ao mesmo tempo que pode-se empregar cálculos estatísticos sobre variáveis essencialmente qualitativas – os textos, pode-se ter como objetivo a comparação relacional de produções diferentes em função de variáveis específicas que descrevem quem produziu o texto.

Assim, o uso de softwares específicos para realizar análise textual tem sido imprescindível. Softwares como Ethnograph, o Nudist e o Atlas TI, os quais, ao organizarem os dados, facilitam a realização de análises de conteúdo. Já Evocation e Similitude podem realizar tanto análises estatísticas clássicas, quanto multivariadas, sobre dados textuais, e possibilitam que se relacione as palavras encontradas na produção textual. Além dos softwares citados, destaca-se o IRAMUTEQ (Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires). Software de livre uso que vamos falar nesse post.

O que é o software IRAMUTEQ?

De acordo com a documentação oficial, o IRAMUTEQ é definido como um software licenciado por GNU GPL (v2) que permite fazer análises estatísticas sobre corpus textuais e sobre tabelas indivíduos/palavras. Ele ancora-se no software R (www.r-project.org) e na linguagem python (www.python.org).

Para instalar o software gratuitamente em seu computador, basta fazer o download do software R em www.r-project.org e instalá-lo; e em seguida fazer o download do software IRAMUTEQ em www.iramuteq.org, e instalá-lo também. É necessário que antes de instalar o IRAMUTEQ se instale o R, pois o IRAMUTEQ se utilizará do software R para processar suas análises.

Quais são os tipos de análise feitas pelo Iramuteq?

Este programa informático viabiliza diferentes tipos de análise de dados textuais, desde a lexicografia básica (cálculo de frequência de palavras), até análises multivariadas (classificação hierárquica descendente, análises de similitude). Por meio dele também é possível organizar a distribuição do vocabulário – análise de similitude e nuvem de palavras.

Camargo e Justo (2013) descrevem brevemente cada uma das análises que podem ser realizadas por meio do IRAMUTEQ:

Nas análises lexicais clássicas, o programa identifica e reformata as unidades de texto, transformando Unidades de Contexto Iniciais (UCI) em Unidades de Contexto Elementares (UCE); identifica a quantidade de palavras, frequência média e número de hapax (palavras com frequência um); pesquisa o vocabulário e reduz das palavras com base em suas raízes (lematização); cria dicionário de formas reduzidas, identifica formas ativas e suplementares

Na análise de especificidades, é possível associar diretamente os textos do banco de dados com variáveis descritoras dos seus produtores; é possível analisar a produção textual em função das variáveis de caracterização. Trata-se de uma análise de contrastes, na qual o corpus é dividido em função de uma variável escolhida pelo pesquisador. Por exemplo, é possível comparar a produção textual de homens e mulheres em relação a determinado tema.

método da Classificação Hierárquica Descendente (CHD) proposto por Reinert (1990) e utilizado pelo software ALCESTE classifica os segmentos de texto em função dos seus respectivos vocabulários, e o conjunto deles é repartido com base na frequência das formas reduzidas (palavras já lematizadas). Esta análise visa obter classes de UCE que, ao mesmo tempo, apresentam vocabulário semelhante entre si, e vocabulário diferente das UCE das outras classes. O IRAMUTEQ também fornece outra forma de apresentação dos resultados, por meio de uma análise fatorial de correspondência feita a partir da CHD (Análise Pós-Fatorial) que representa num plano cartesiano as diferentes palavras e variáveis associadas a cada uma das classes da CHD.

análise de similitude se baseia na teoria dos grafos, possibilita identificar as co ocorrências entre as palavras e seu resultado traz indicações da conexidade entre as palavras, auxiliando na identificação da estrutura de um corpus textual, distinguindo também as partes comuns e as especificidades em função das variáveis ilustrativas (descritivas) identificadas na análise (Marchand & Ratinaud, 2012).

A nuvem de palavras as agrupa e as organiza graficamente em função da sua frequência. É uma análise lexical mais simples, porém graficamente bastante interessante, na medida em que possibilita rápida identificação das palavras-chave de um corpus

Estas análises podem ser realizadas tanto a partir de um grupo de textos a respeito de uma determinada temática (corpus) reunidos em um único arquivo de texto; como a partir de tabelas com indivíduos em linha e palavras em coluna, organizadas em planilhas, como é o caso dos bancos de dados construídos a partir de testes de evocações livres.

Vale a pena ressaltar que IRAMUTEQ não é um método de pesquisa e também os relatórios obtidos por meio dele não são em si as análises. A interpretação das saídas obtidas pelo IRAMUTEQ devem ser interpretadas, e assim tiradas as conclusões sobre o significado das análises lexicais e do emprego de análises multivariadas, além de um bom domínio do estado da arte que envolve o tema específico de cada pesquisa.

Conclusão

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Onlina Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referência

Camargo, B. V., & Justo, A. M. (2013). IRAMUTEQ: Um software gratuito para análisede dados textuais. Temas em Psicologia21(2), 513–518. https://doi.org/10.9788/TP2013.2-16

Como citar este post

França, A. (2023, 5 de janeiro). Análise textual: O software IRAMUTEQ. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/analise-textual-o-software-iramuteq/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

 

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

 

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Compartilhe sua opinião sobre este post

Respostas de 2

  1. Olá, boa tarde. É possível se inscrever no curso do IRAMUTEC? Quanto custa o serviço?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Como escrever uma revisão sistemática? A declaração PRISMA

Como definir a ordem de autoria do artigo científico?

Bolsas de mestrado e de doutorado: como conseguir?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é regressão linear múltipla?

Postados recentemente

Como escrever uma revisão sistemática? A declaração PRISMA

Como definir a ordem de autoria do artigo científico?

Como realizar o teste de Shapiro-Wilk no JASP?

Bolsas de mestrado e de doutorado: como conseguir?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias