データレイク vs データハブ

データレイクとデータハブには、根本的な違いがあります。データレイクは、DASに代表される従来型のストレージ技術をベースに、できる限り効率よくデータを格納できるように設計されています。データレイクでは、データサイロの発生により、分析に必要な複数のデータを1つに統合できないという問題がありました。

データハブは、近代的なストレージのデータセントリックアーキテクチャです。データの活用が極めて重要な意味をもつ今日、データハブは分離されたデータの統合と共有を可能とし、分析やAIの強化に最適なソリューションとなります。データの格納を主目的として設計されたデータレイクや従来のDASアーキテクチャとは異なり、データハブは、リアルタイムに、多次元的にデータを共有・提供することを目的に、設計されています。

データレイクが消え去る理由

データレイクは、全ての非構造化データを格納しておくという前提のもとに構築されていました。いまやその前提は時代遅れとなり、データレイクは消えつつあります。非構造化データの中には、データウェアハウスに格納されたものもあれば、データレイクの中で失われたデータもあります。データは統合されず、データの速度は遅いままでした。従来型ストレージシステムでは単一プラットフォーム上にデータを統合することが困難な理由は何でしょうか。問題は、各アプリケーションのデータ要件が異なり、データサイロが拡散してしまうことです。ストレージを見直す時が来ています。

データは近代的エンタープライズにとっての燃料です。しかし、現状では、未だにデータはサイロに格納されており、分析やAIアプリケーションへの迅速なデータ供給を阻んでいます。いまの時代に必要なのは、データを格納するだけでなく、共有・提供するために設計されたアーキテクチャです。

データレイクとデータハブの比較

データを統合・共有する
新しいアーキテクチャ

ピュア・ストレージは、データハブが、近代的なアーキテクチャの基盤を築くために必要不可欠なものであると確信しています。そこでストレージ業界に向けて公開状を発表しました。データハブは、各サイロの強みを引き出し、①ファイル/オブジェクトの高スループット、②ネイティブスケールアウト、③多次元的な性能、④大規模並列アーキテクチャ、この4つの必須要件を満たす単一の統合プラットフォームに統合します。

FlashBladeは業界初のデータハブです。ソフトウェアからハードウェアまで、データハブの4つの必須機能を実現するために全て調整されています。

FlashBladeの特徴:

  • ファイルとオブジェクトの統合を念頭に構築
  • ネイティブスケールアウトを可能にするアーキテクチャ
  • あらゆるデータに多次元パフォーマンスを提供する設計
  • ソフトウェアからハードウェアに至るまで大規模並列

注目の最新情報

データレイク以降のストレージ再定義

ホワイトペーパー

データストレージの展望

データハブ:近代的なストレージアーキテクチャ

+