Busca semântica de informações nas redes sociais

Carregando...
Imagem de Miniatura

Data

2011

Tipo de documento

Monografia

Título da Revista

ISSN da Revista

Título de Volume

Área do conhecimento

Ciências Exatas e da Terra

Modalidade de acesso

Acesso aberto

Editora

Autores

Silva, João Caibar da
Andriani, Mateus Lohn

Orientador

Schuhmacher, Vera Rejane Niedersberg

Coorientador

Resumo

Social media grew exponentially in recent years. Users who participate in these networks are responsible for preparing the content, which can be provided, for example, in the way of publications, comments or ratings. This content may contain information that is of interest to people who were not involved during its preparation. However, it is usually dispersed among publications with different subjects and purposes, which makes harder its location. The objective of this work is the development of an information extractor for social medias that performs the filtering of the published content, thereby showing only the information of interest to the user. Twitter was chosen as the domain of research for information extraction. To perform the integration with Twitter, an analysis of the components available for the Java programming language that enables the integration with Twitter was developed. The result of this work was the development of two tools. The Livesearch, which was the first tool developed, queries for publications on Twitter and allows the use of a series of filters through an interface built in HTML. The Livesearch S, which was developed later, adds the ability to conduct queries with the help of a semantic thesaurus, which increases the number of results, in addition to using AJAX requests for navigation between paged results.
As mídias sociais cresceram de forma exponencial nos últimos anos. Os usuários que participam dessas redes são os responsáveis pela elaboração do conteúdo, que pode ser disponibilizado, por exemplo, na forma de publicações, comentários ou avaliações. Esse conteúdo pode conter informações que são de interesse de pessoas que não estiveram envolvidas durante a sua elaboração. No entanto, o mesmo geralmente está disperso entre publicações com diferentes assuntos e propósitos, o que dificulta sua localização. O objetivo deste trabalho é a elaboração de um extrator de informações para mídias sociais que realize a filtragem do conteúdo publicado, apresentando assim apenas as informações de interesse do usuário. O Twitter foi escolhido como domínio de pesquisa para a extração de informações. Para realizar a integração com o Twitter, foi elaborada uma análise dos componentes disponíveis para a linguagem de programação Java que possibilitam a integração com o Twitter. O resultado desse trabalho foi a elaboração de duas ferramentas. O Livesearch, que foi a primeira ferramenta desenvolvida, realiza a consulta por publicações no Twitter e possibilita a utilização de uma série de filtros através de uma interface construída em HTML. O Livesearch S, que foi desenvolvido posteriormente, adiciona a capacidade de realizar pesquisas com o auxílio semântico de um tesauro, o que aumenta o número de resultados obtidos, além de utilizar requisições AJAX para a navegação paginada dos resultados da consulta.

Palavras-chave

Mídia social, Rede social, Web semântica, Extração de Informações, Twitter

Citação