Data lake: uma nova abordagem para o armazenamento de dados

Carregando...
Imagem de Miniatura

Data

2021-06-23

Tipo de documento

Monografia

Título da Revista

ISSN da Revista

Título de Volume

Área do conhecimento

Ciências Exatas e da Terra

Modalidade de acesso

Acesso aberto

Editora

Autores

Rau, Isabele Aurora Cândido Vitorino

Orientador

Vieira, Daniella

Coorientador

Resumo

Com a evolução dos sistemas e a produção massiva de dados por parte destes, nasceu um novo mercado, de dados. Tendo estes se tornados bens valiosos para as organizações e podendo serem convertidos em vantagens competitivas para as mesmas. Sucintamente, esse foi um dos motivos para o surgimento da Era do Big Data. Entretanto, as abordagens tradicionais de armazenamento de dados, mostraram limitações ao lidar com altos volumes de dados. Desse modo, surgiu a necessidade de tecnologias mais aprimoradas para armazenar e processar dados. Uma das estratégias criadas para lidar com o Big Data foi o Data Lake. Essa terminologia é abordada no decorrer do presente trabalho, assim como o conceito de Data Warehouse. São explorados os conceitos de ambas tecnologias, com o intuito de elucidar suas diferenças e semelhanças e o melhor cenário para aplicá-las. Também são apresentados dois conjuntos de software capazes de auxiliar na implementação de um ambiente de Data Lake. Sendo também demonstrado, através de um experimento, a estruturação de um ambiente de Data Lake utilizando um destes conjuntos de software. Através destes insumos é possível detectar quais aspectos devem ser considerados pelas empresas na hora de escolher o tipo de armazenamento de dados que faz mais sentido para o seu negócio.

Palavras-chave

Data Lake, Apache Hadoop, Amazon AWS

Citação