Comparativo entre diferentes soluções de processamento de dados para Big Data
dc.contributor.advisor | Morales, Aran Bey Tcholakian | |
dc.contributor.author | Silva, Gabriel Benjamim da | |
dc.coverage.spatial | Florianópolis/ SC | pt_BR |
dc.date.accessioned | 2017-12-10T17:54:38Z | |
dc.date.accessioned | 2020-11-29T05:52:43Z | |
dc.date.available | 2017-12-10T17:54:38Z | |
dc.date.available | 2020-11-29T05:52:43Z | |
dc.date.issued | 2017 | pt_BR |
dc.description.abstract | A quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução. | pt_BR |
dc.format.extent | 67 f. | pt_BR |
dc.identifier.uri | https://repositorio.animaeducacao.com.br/handle/ANIMA/11021 | |
dc.language.iso | pt_BR | pt_BR |
dc.relation.ispartof | Sistemas de Informação - Pedra Branca | pt_BR |
dc.rights | Attribution 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | * |
dc.subject | Big data | pt_BR |
dc.subject | Processamento em lote | pt_BR |
dc.subject | Apache hadoop | pt_BR |
dc.subject | Apache spark | pt_BR |
dc.subject | Apache flink | pt_BR |
dc.title | Comparativo entre diferentes soluções de processamento de dados para Big Data | pt_BR |
dc.type | Monografia | pt_BR |
local.author.curso | Sistemas de Informação | pt_BR |
local.author.unidade | UNISUL / Pedra Branca | pt_BR |
local.rights.policy | Acesso aberto | pt_BR |
local.subject.area | Ciências Exatas e da Terra | pt_BR |
local.subject.areaanima | TI & Computação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Gabriel_TCC2_FINAL.pdf
- Tamanho:
- 1.31 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
- TCC Gabriel Benjamim da Silva