DATA LAKE VERSUS DATA HUB

Ein Data Lake und ein Data Hub sind im Kern völlig unterschiedlich. Ein Data-Lake ist darauf ausgelegt, Daten möglichst effizient zu speichern und basiert technisch gesehen auf älteren Technologien wie DAS-basierter Storage. Die Herausforderung bei einem Data Lake ergibt sich dadurch, dass Datensilos entstehen, die die Fähigkeit einschränken, die Sätze von Daten zum Zweck der Analyse zu einem zusammenhängenden Ganzen zu kombinieren.

Ein Data Hub ist eine moderne, datenzentrierte Architektur für Storage, die Analysen und KI unterstützt, indem sie es Unternehmen in der datenabhängigen Welt von heute ermöglicht, Daten zu konsolidieren und freizugeben. Im Gegensatz zu Data Lakes und herkömmlichen DAS-Architekturen, die in erster Linie zum Speichern von Daten entwickelt wurden, dienen Data Hubs dem Freigeben und Bereitstellen von Daten.

WARUM STERBEN DATA LAKES?

Data Lakes sterben, weil sie unter der veralteten Prämisse entwickelt wurden, dass alle unstrukturierten Daten gespeichert werden sollen. Manche davon sind in Data-Warehouses gespeichert, andere gehen in Data Lakes verloren. Die Datenvereinigung ist unterbrochen und die Datengeschwindigkeit ist beeinträchtigt. Warum ist es also so schwierig, für ältere Storage-Systeme Daten auf einer einzelnen Plattform zu vereinen? Das Problem ist, dass jede Anwendung andere Anforderungen an ihre Daten hat, so kommt es zur Verbreitung von Datensilos. Zeit für neue Wege bei Storage.

Daten sind der Treibstoff für das moderne Unternehmen. Und doch werden die meisten Daten in Silos, außer Reichweite für Analysen und KI-Anwendungen gespeichert. Moderne Intelligenz erfordert eine Architektur, die darauf ausgelegt ist, Daten nicht nur zu speichern, sondern sie auch gemeinsam zu nutzen und bereitzustellen.

Data Lake und Data Hub im Vergleich

Eine neue Architektur zur Vereinigung und gemeinsamen Nutzung von Daten

Wir sind so fest davon überzeugt, dass ein Data Hub das ist, was die Storage-Branche braucht, um den Grundstein für eine moderne Architektur zu legen, dass wir einen offenen Brief an die Branche geschrieben haben. Ein Data Hub nimmt die Schlüsselstärken jedes Silos auf und integriert sie in eine einzige gemeinsame Plattform, die vier unverzichtbare Eigenschaften aufweist: hoher Datei- & Objekt-Durchsatz, native Skalierung, multidimensionale Performance und massiv parallele Architektur.

FlashBlade von Pure ist der erste Data Hub der Branche. Von der Software bis zur Hardware ist alles darauf abgestimmt, diese vier wesentlichen Eigenschaften eines Data Hubs zu erfüllen.

FlashBlade ist:

  • von Grund auf für die Vereinigung von Datei und Objekt konzipiert
  • nativ für die Skalierung ausgelegt
  • für die Bereitstellung multidimensionaler Performance für alle Daten entwickelt
  • massiv parallel von der Software bis zur Hardware

Mehr für Sie

Neudefinition von Storage für die Post-Data-Lake-Ära

White Paper

MODERNE VISION FÜR DEN DATEN-STORAGE

DATA HUB: EINE MODERNE STORAGE-ARCHITEKTUR

+