Ceci, FlávioAlberton, Eduardo MateusSouza, Thiago de2017-10-232020-11-292017-10-232020-11-292015https://repositorio.animaeducacao.com.br/handle/ANIMA/11157Extrair informações em bases não estruturadas é um problema conhecido a muito tempo. Dados armazenados em documentos textuais não são recuperados facilmente como informações em um banco de dados por exemplo. Considerando este como o problema pressuposto, este trabalho tem como objetivo desenvolver um sistema de extração de informação juntamente com a geração de indicadores voltado à área acadêmica, realizando a extração de dados de referências biliográficas elaboradas no formato exigido pela ABNT. Isso só é possivel de ser realizado, por possuir uma regra estipulada, onde os elementos devem respeitar posições e delimitações pontuais. O uso de expressões regulares para encontrar entidades declaradas em uma determinada sentença tambem ajuda na identidicação dos elementos em arquivos textuais, possibilitando assim, a extração da informação desejada. O sistema desenvolvido para solução proposta realiza a leitura e extração de autores e ano de publicação das referências bibliográficas adicionadas ao sistema. Os documentos inseridos no sistema são trabalhos de conclusão de curso da Universidade de Sul de Santa Catarina, dos cursos de Ciências da Computação e Sistemas de Informação além de artigos científicos. O principal objetivo da extração dos dados citados é apresentar esta informação de forma sintética e pura, auxiliando na visualização da credibilidade dos documentos e do período no qual foi buscado seu conteúdo base. Desta forma, o sistema captura os dados de arquivos textuais, e os apresenta de forma agrupada através da geração de indicadores. O sistema foi avaliado obtendo um índice de acerto de 90,92 % na extração de autores, e de 97,75 % para a extração do ano de publicação, de um total de 535 referências.101 f.pt-BRExtração de informaçãoIndicadores de publicações acadêmicasReferências bibliográficasExpressões regularesSistema para extração de indicadores a partir da lista de referências de trabalhos científicosMonografia