CONFRONTO TRA DATA LAKE E DATA HUB

Data lake e data hub sono essenzialmente molto diversi. Un data lake è concepito per memorizzare i dati in modo più efficiente possibile, oltre a essere progettato con tecnologie legacy come lo storage basato su DAS. Il problema dei data lake è che creano silos di dati che inibiscono la capacità di combinare i set di dati necessari in un insieme coeso per gli analytics.

Un data hub è un'architettura di storage moderna, centrata sui dati, che potenzia gli analytics e l'IA, consentendo alle aziende di consolidare e condividere i dati nel mondo data-first odierno. A differenza delle architetture DAS di data lake e legacy progettate principalmente per l'archiviazione dei dati, un data hub è progettato per condividere e fornire dati in tempo reale e multidimensionale.

PERCHÉ I DATA LAKE STANNO MORENDO?

I data lake si stanno esaurendo in quanto creati in base a premesse oramai obsolete che tutti i dati non strutturati devono essere memorizzati. Alcuni di questi dati sono memorizzati nei data warehouse, altri persi nei data lake. L’unificazione dei dati è intermittente e la velocità dei dati menomata. Perché è così difficile per i sistemi di storage legacy unificare i dati in un'unica piattaforma? Il problema risiede nel fatto che ogni applicazione presenta requisiti specifici per i propri dati e questo determina la proliferazione dei silos di dati. È giunto il momento di concepire nuovamente lo storage.

I dati sono il carburante delle moderne imprese. Tuttavia, la maggior parte dei dati è archiviata in silos, non disponibile per gli analytics e le applicazioni di IA moderne.  L’intelligence moderna richiede un'architettura progettata non solo per archiviare i dati, ma anche per condividerli e distribuirli.

Confronto tra data lake e data hub

Una nuova architettura per unificare e condividere dati

Crediamo così profondamente nel fatto che il data hub sia ciò di cui settore dello storage ha bisogno per porre le basi di un'architettura moderna da aver scritto una lettera aperta al settore. Un data hub utilizza i punti di forza di ciascun silo e li integra in un'unica piattaforma unificata che include quattro qualità indispensabili: file e oggetti con velocità di trasmissione elevata, scale-out nativo, performance multidimensionali e architettura parallela.

FlashBlade di Pure è il primo data hub del settore. Dal software all'hardware, ogni aspetto è ottimizzato per fare leva su queste quattro qualità essenziali di un data hub:

FlashBlade è:

  • Creato da zero per unificare file e oggetti
  • Concepito in modalità nativa per lo scale-out
  • Progettato per fornire performance multidimensionali per qualsiasi tipo di dati
  • Parallelo dal software all'hardware

Di più per la tua azienda

Ridefinizione dello storage per l’era post-data lake

White paper

VISIONE MODERNA PER DATA STORAGE

DATA HUB: UN'ARCHITETTURA STORAGE MODERNA

+