Sistema para extração de indicadores a partir da lista de referências de trabalhos científicos

Carregando...
Imagem de Miniatura

Data

2015

Tipo de documento

Monografia

Título da Revista

ISSN da Revista

Título de Volume

Área do conhecimento

Ciências Exatas e da Terra

Modalidade de acesso

Acesso aberto

Editora

Autores

Alberton, Eduardo Mateus
Souza, Thiago de

Orientador

Ceci, Flávio

Coorientador

Resumo

Extrair informações em bases não estruturadas é um problema conhecido a muito tempo. Dados armazenados em documentos textuais não são recuperados facilmente como informações em um banco de dados por exemplo. Considerando este como o problema pressuposto, este trabalho tem como objetivo desenvolver um sistema de extração de informação juntamente com a geração de indicadores voltado à área acadêmica, realizando a extração de dados de referências biliográficas elaboradas no formato exigido pela ABNT. Isso só é possivel de ser realizado, por possuir uma regra estipulada, onde os elementos devem respeitar posições e delimitações pontuais. O uso de expressões regulares para encontrar entidades declaradas em uma determinada sentença tambem ajuda na identidicação dos elementos em arquivos textuais, possibilitando assim, a extração da informação desejada. O sistema desenvolvido para solução proposta realiza a leitura e extração de autores e ano de publicação das referências bibliográficas adicionadas ao sistema. Os documentos inseridos no sistema são trabalhos de conclusão de curso da Universidade de Sul de Santa Catarina, dos cursos de Ciências da Computação e Sistemas de Informação além de artigos científicos. O principal objetivo da extração dos dados citados é apresentar esta informação de forma sintética e pura, auxiliando na visualização da credibilidade dos documentos e do período no qual foi buscado seu conteúdo base. Desta forma, o sistema captura os dados de arquivos textuais, e os apresenta de forma agrupada através da geração de indicadores. O sistema foi avaliado obtendo um índice de acerto de 90,92 % na extração de autores, e de 97,75 % para a extração do ano de publicação, de um total de 535 referências.

Palavras-chave

Extração de informação, Indicadores de publicações acadêmicas, Referências bibliográficas, Expressões regulares

Citação