Data lake: uma nova abordagem para o armazenamento de dados
Carregando...
Data
2021-06-23
Tipo de documento
Monografia
Título da Revista
ISSN da Revista
Título de Volume
Área do conhecimento
Ciências Exatas e da Terra
Modalidade de acesso
Acesso aberto
Editora
Autores
Rau, Isabele Aurora Cândido Vitorino
Orientador
Vieira, Daniella
Coorientador
Resumo
Com a evolução dos sistemas e a produção massiva de dados por parte destes, nasceu um novo mercado, de dados. Tendo estes se tornados bens valiosos para as organizações e podendo serem convertidos em vantagens competitivas para as mesmas. Sucintamente, esse foi um dos motivos para o surgimento da Era do Big Data. Entretanto, as abordagens tradicionais de armazenamento de dados, mostraram limitações ao lidar com altos volumes de dados. Desse modo, surgiu a necessidade de tecnologias mais aprimoradas para armazenar e processar dados. Uma das estratégias criadas para lidar com o Big Data foi o Data Lake. Essa terminologia é abordada no decorrer do presente trabalho, assim como o conceito de Data Warehouse. São explorados os conceitos de ambas tecnologias, com o intuito de elucidar suas diferenças e semelhanças e o melhor cenário para aplicá-las. Também são apresentados dois conjuntos de software capazes de auxiliar na implementação de um ambiente de Data Lake. Sendo também demonstrado, através de um experimento, a estruturação de um ambiente de Data Lake utilizando um destes conjuntos de software. Através destes insumos é possível detectar quais aspectos devem ser considerados pelas empresas na hora de escolher o tipo de armazenamento de dados que faz mais sentido para o seu negócio.
Palavras-chave
Data Lake, Apache Hadoop, Amazon AWS