Utilizando Sobek Mining para mineração de textos

por Taís Oliveira*

A Sobek Mining é uma ferramenta de mineração de texto criada em 2007 pelo Grupo de Pesquisa em Tecnologia Aplicada à Educação do Programa de Pós-Graduação em Informática na Educação da Universidade Federal do Rio Grande do Sul (UFRGS). Seu objetivo é ser um apoio em tarefas educacionais, sobretudo nas que tratam de compreensão de leitura e criação de resumos.

De maneira muito simples, ela cria um diagrama do texto a partir dos conceitos mais relevantes e suas relações utilizando como princípio a análise de frequência de cada termo, vale ressaltar que artigos, preposições e advérbios são descartadas dessa análise.

É possível usar online ou baixar o software para o seu desktop e para obter o grafo basta copiar (ou digitar) e colar o texto na janela do editor e clicar em “extrair conceitos”. Na sequência a Sobek Mining abrirá uma nova janela com os nós de conceitos e suas conexões, dos quais os maiores são os mais citados. Ao clicar na palavra do nó a plataforma mostrará onde o termo está localizado no texto.  Ainda é possível salvar os grafos em imagem ou salvar no modo original para continuar analisando posteriormente.

Possibilidades de aplicação

Para contextualizar algumas das aplicações, podemos citar a análise textual de perguntas e respostas do teleatendimento do Ministério da Saúde do Brasil, da qual os gráficos gerados auxiliaram na remodelagem da metodologia de respostas dos médicos para os cidadãos solicitantes. Ou ainda, apoio pedagógico em mediação de discussões em fóruns para identificar o momento em que os assuntos propostos fogem da premissa inicial e a análise de conteúdo e de relevância de mensagens trocadas em fóruns online.

Suponho que a ferramenta possa cooperar expressivamente com estudos de conversações em mídias sociais, analisar tópicos ou grupos de debates focados em determinados temas, léxico, dialetos e assim grande parte das especificações da análise de conteúdo (BARDIN, 2011).

 

Referências

BARDIN, Laurence. Análise de conteúdo. 1ª ed. 1ª reimp. São Paulo: Edições 70, 2011.

REATEGUI, E., EPSTEIN, D., LORENZATTI, A., KLEMANN, M. Sobek: a Text Mining Tool for Educational Applications. In: International Conference on Data Mining, 2011, Las Vegas, USA, 2011, 59-64.

SCHENKER, A. Graph-Theoretic Techniques for Web Content Mining. PhD thesis, University of South Florida, 2003.

 

Taís Oliveira é relações-públicas, mestranda pela UFABC, teve projeto contemplado no edital Agentes de Governo Aberto na Prefeitura Municipal de São Paulo e é participante de cursos do IBPAD.

Conheça a formação completa em análise de mídias sociais, pacote que agrega os cursos online de Monitoramento, Análise de Redes e Etnografia em Mídias Sociais, liderados por professores com formação sólida tanto no ambiente acadêmico quanto mercadológico, com passagens por grandes agências e empresas referências na área. Assista abaixo o vídeo sobre curso de Monitoramento:

postrelacionados

Comentários

comments

Deixe um comentário