DATA LAKE VS. DATA HUB

Um data lake e um data hub são muito diferentes em sua essência. O data lake é desenvolvido para armazenar dados da forma mais eficiente possível, com tecnologias legadas, como o armazenamento de conexão direta (DAS). O desafio de um data lake é que ele cria silos de dados que inibem a capacidade de combinar todos os conjuntos de dados necessários em um só para realizar análises.

O data hub é uma arquitetura para armazenamento avançada e centrada em dados que aumenta a capacidade de análises e inteligência artificial. Com ele, as empresas consolidam e compartilham dados neste cenário atual de dados em primeiro lugar. Diferentemente dos data lakes e das arquiteturas legadas de armazenamento de conexão direta desenvolvidos principalmente para armazenar dados, um data hub é desenvolvido para  compartilhar e disponibilizar dados em tempo real e de forma multidimensional.

Por que os data lakes estão sendo eliminados?

Os data lakes estão sendo eliminados, pois foram desenvolvidos com a premissa obsoleta de que todos dados não estruturados devem ser armazenados. Alguns dados são armazenados em data warehouses e outros estão perdidos em data lakes. A unificação de dados é fracionada e a velocidade dos dados é insuficiente. Por que é tão difícil para os sistemas de armazenamento legados unificar dados em apenas uma plataforma? O problema é que cada aplicativo tem diferentes requisitos para seus dados, sem contar a proliferação de silos de dados. Está na hora de repensar o armazenamento.

Os dados movem as empresas modernas. No entanto, a maioria dos dados é armazenada em silos, fora do alcance dos aplicativos de análise e inteligência artificial.  A inteligência avançada requer uma arquitetura desenvolvida não apenas para armazenar dados, mas para compartilhá-los e disponibilizá-los.

Comparação entre data lake e data hub

Uma nova arquitetura para unificar e compartilhar dados

Acreditamos tanto que um data hub é o que o setor de armazenamento precisa para preparar a base de uma arquitetura moderna que escrevemos uma carta aberta para ele. Um data hub usa os principais pontos fortes de cada silo e integra-os em uma única plataforma unificada que inclui quatro qualidades essenciais: arquivo e objeto com alta taxa de transferência, expansão horizontal nativa, desempenho multidimensional e arquitetura extremamente paralela.

O FlashBlade da Pure é o primeiro data hub do setor. Do software ao hardware, tudo é ajustado para oferecer essas quatro qualidades essenciais de um data hub.

O FlashBlade é:

  • Totalmente integrado para unificar arquivo e objeto
  • Arquitetado de forma nativa para expandir horizontalmente
  • Desenvolvido para oferecer desempenho multidimensional para qualquer dado
  • Extremamente paralelo do software ao hardware

Saiba mais

Redefinição do armazenamento para a era pós-data lake.

Whitepaper

VISÃO MODERNA PARA O ARMAZENAMENTO DE DADOS

DATA HUB: UMA ARQUITETURA MODERNA DE ARMAZENAMENTO

+