Sistema para extração de indicadores a partir da lista de referências de trabalhos científicos
Carregando...
Arquivos
Data
2015
Tipo de documento
Monografia
Título da Revista
ISSN da Revista
Título de Volume
Área do conhecimento
Ciências Exatas e da Terra
Modalidade de acesso
Acesso aberto
Editora
Autores
Alberton, Eduardo Mateus
Souza, Thiago de
Orientador
Ceci, Flávio
Coorientador
Resumo
Extrair informações em bases não estruturadas é um problema conhecido a muito tempo. Dados armazenados em documentos textuais não são recuperados facilmente como informações em um banco de dados por exemplo. Considerando este como o problema pressuposto, este trabalho tem como objetivo desenvolver um sistema de extração de informação juntamente com a geração de indicadores voltado à área acadêmica, realizando a extração de dados de referências biliográficas elaboradas no formato exigido pela ABNT. Isso só é possivel de ser realizado, por possuir uma regra estipulada, onde os elementos devem respeitar posições e delimitações pontuais. O uso de expressões regulares para encontrar entidades declaradas em uma determinada sentença tambem ajuda na identidicação dos elementos em arquivos textuais, possibilitando assim, a extração da informação desejada. O sistema desenvolvido para solução proposta realiza a leitura e extração de autores e ano de publicação das referências bibliográficas adicionadas ao sistema. Os documentos inseridos no sistema são trabalhos de conclusão de curso da Universidade de Sul de Santa Catarina, dos cursos de Ciências da Computação e Sistemas de Informação além de artigos científicos. O principal objetivo da extração dos dados citados é apresentar esta informação de forma sintética e pura, auxiliando na visualização da credibilidade dos documentos e do período no qual foi buscado seu conteúdo base. Desta forma, o sistema captura os dados de arquivos textuais, e os apresenta de forma agrupada através da geração de indicadores. O sistema foi avaliado obtendo um índice de acerto de 90,92 % na extração de autores, e de 97,75 % para a extração do ano de publicação, de um total de 535 referências.
Palavras-chave
Extração de informação, Indicadores de publicações acadêmicas, Referências bibliográficas, Expressões regulares