Comparativo entre diferentes soluções de processamento de dados para Big Data

dc.contributor.advisorMorales, Aran Bey Tcholakian
dc.contributor.authorSilva, Gabriel Benjamim da
dc.coverage.spatialFlorianópolis/ SCpt_BR
dc.date.accessioned2017-12-10T17:54:38Z
dc.date.accessioned2020-11-29T05:52:43Z
dc.date.available2017-12-10T17:54:38Z
dc.date.available2020-11-29T05:52:43Z
dc.date.issued2017pt_BR
dc.description.abstractA quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução.pt_BR
dc.format.extent67 f.pt_BR
dc.identifier.urihttps://repositorio.animaeducacao.com.br/handle/ANIMA/11021
dc.language.isopt_BRpt_BR
dc.relation.ispartofSistemas de Informação - Pedra Brancapt_BR
dc.rightsAttribution 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/*
dc.subjectBig datapt_BR
dc.subjectProcessamento em lotept_BR
dc.subjectApache hadooppt_BR
dc.subjectApache sparkpt_BR
dc.subjectApache flinkpt_BR
dc.titleComparativo entre diferentes soluções de processamento de dados para Big Datapt_BR
dc.typeMonografiapt_BR
local.author.cursoSistemas de Informaçãopt_BR
local.author.unidadeUNISUL / Pedra Brancapt_BR
local.rights.policyAcesso abertopt_BR
local.subject.areaCiências Exatas e da Terrapt_BR
local.subject.areaanimaTI & Computaçãopt_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Gabriel_TCC2_FINAL.pdf
Tamanho:
1.31 MB
Formato:
Adobe Portable Document Format
Descrição:
TCC Gabriel Benjamim da Silva
Licença do Pacote
Agora exibindo 1 - 2 de 2
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
907 B
Formato:
Item-specific license agreed upon to submission
Descrição:
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
0 B
Formato:
Item-specific license agreed upon to submission
Descrição: