Comparativo entre diferentes soluções de processamento de dados para Big Data

Silva, Gabriel Benjamim da

Comparativo entre diferentes soluções de processamento de dados para Big Data

dc.contributor.advisor	Morales, Aran Bey Tcholakian
dc.contributor.author	Silva, Gabriel Benjamim da
dc.coverage.spatial	Florianópolis/ SC	pt_BR
dc.date.accessioned	2017-12-10T17:54:38Z
dc.date.accessioned	2020-11-29T05:52:43Z
dc.date.available	2017-12-10T17:54:38Z
dc.date.available	2020-11-29T05:52:43Z
dc.date.issued	2017	pt_BR
dc.description.abstract	A quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução.	pt_BR
dc.format.extent	67 f.	pt_BR
dc.identifier.uri	https://repositorio.animaeducacao.com.br/handle/ANIMA/11021
dc.language.iso	pt_BR	pt_BR
dc.relation.ispartof	Sistemas de Informação - Pedra Branca	pt_BR
dc.rights	Attribution 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by/3.0/br/	*
dc.subject	Big data	pt_BR
dc.subject	Processamento em lote	pt_BR
dc.subject	Apache hadoop	pt_BR
dc.subject	Apache spark	pt_BR
dc.subject	Apache flink	pt_BR
dc.title	Comparativo entre diferentes soluções de processamento de dados para Big Data	pt_BR
dc.type	Monografia	pt_BR
local.author.curso	Sistemas de Informação	pt_BR
local.author.unidade	UNISUL / Pedra Branca	pt_BR
local.rights.policy	Acesso aberto	pt_BR
local.subject.area	Ciências Exatas e da Terra	pt_BR
local.subject.areaanima	TI & Computação	pt_BR