データ・ウェアハウスによるビジネス・インテリジェンスの促進

データ・ウェアハウスとは

データ・ウェアハウスとは

データ・ウェアハウスは、構造化データを格納するよう最適化されたストレージ・システムで、適時なビジネス・インテリジェンス(BI)を提供するのに必要な高速のSQLクエリを実行します。高速トランザクションから予測型分析まで、データ・ウェアハウスには、企業がBIを促進するために使用する事実上の保管基準のように、数十年にもわたる歴史があります。

データ・ウェアハウスのメリット

データ・ウェアハウスのメリットを次に示します。

  • 複数の異なるソース内のデータを構造化して統合
  • リレーショナル・データベース内の分析クエリを高速化
  • 安価なクエリと迅速なレポート作成を行う専用のストレージ・ソリューション

FlashBlade のテスト・ドライブ

Pure1®のセルフサービス・インスタンスによるFlashBlade™の管理を通じて、ネイティブなスケールアウトが可能なファイル/オブジェクト・ストレージの先進的機能をお試しいただけます。

データ・ウェアハウスの仕組み:

有益な情報を抽出するために自社の様々な部門からデータ収集するロジスティクスは、ビジネスの成長に伴い複雑さが増す可能性があります。データ・ウェアハウスは、その情報を単一のデータベースおよびデータモデルに集約し、アナリストがクエリを実行可能にする信頼性の高い方法を提供します。

仕組みの概要:

  1. 抽出:ERP、CRM、セールス、マーケティングなど、組織内の様々なソースから生データをステージング・データベースに収集
  2. 変換:ステージング・レイヤーのデータを統合レイヤーに転送し、そこでデータを結合してオペレーショナル・データ・ストア(ODS)に変換
  3. ロード:アナリストがSQLクエリに使用予定のスキーマを定義することで、データを統合レイヤーからデータ・ウェアハウスに移動した後、リレーショナル・データベースに書き込み(スキーマ・オン・ライト)

データ・ウェアハウス内で対話するデータベースはリレーショナル型です。つまり、データは構造化され、列と行から成る表形式で格納されます。書き込み時に、これらの表は定義されたスキーマによって系統立てて管理されます。

変換のステップがデータ・ウェアハウスの外部にあるODSで処理される場合は、ETLと呼ばれます(抽出、変換、ロード)。変換データをデータ・ウェアハウス内部で処理する場合は、ELTと呼ばれます(抽出、ロード、変換)。ETLとELTのどちらを使用する場合でも、データ・ウェアハウスは構造化データ、スキーマ・オン・ライトでリレーショナル・データベースと連動する必要があります。

データ・ウェアハウスの使用目的

データ・ウェアハウスの一般的なアプリケーション:

  • オンライン・トランザクション処理(OLTP: Online Transaction Processing) データ・ウェアハウスはデータの整合性と高速なクエリのために最適化され、大量の短いデータトランザクションの処理できます。一例として、高頻度のトレーディング・プラットフォームで行われるトランザクションが挙げられます。
  • オンライン分析処理(OLAP: Online Analytical Processing) データウェアハウスを最適化することで、トランザクションの比較的少ない量の複雑なクエリを高速化できます。これは基本的に、アナリストがBIのレポート作成に使用します。
  • 予測型分析:自社の将来予測と「仮定」のシナリオを生成するために、機械学習アルゴリズムを活用して、OLAPシステムを最適化します。

データ・ウェアハウスはスキーマ・オン・ライトであるため、データ・ウェアハウスにスキーマを追加する前に、実行予定のクエリのタイプを把握しておくことが重要です。様々なデータソースの複雑性に対処するために、CRMのような特定の事業部門にハードウェアおよびソフトウェアのリソースを割り当てるよう、データ・ウェアハウスがデータマートにセグメント化される場合があります。

データ・ウェアハウス・データ・レイク・データ・ハブの比較

次の3つのシステムの概念は互換性があると思われがちですが、その違いを理解することは重要です。

  • データ・ウェアハウス:組織内の様々な非構造化データ・ソースから取り込んだ構造化データを統合および格納する単一のリポジトリです。
  • データ・レイク:組織内のあらゆる構造化および非構造化データを格納する単一で不完全なリポジトリ(データ・ウェアハウスを含む)です。BIインサイトを抽出するには、引き続きデータを処理する必要があります。
  • データハブ:構造化および非構造化データの両方を、集中管理型データ・レイヤーに集積する単一のインターフェイスです。オペレーショナル・データも処理できる点でデータ・ウェアハウスとは異なり、また様々な形式のデータに対応可能な点でデータ・レイクとも異なります。

データ・ハブは、異なるエンドポイントの集合間でのデータ共有を整備するために必要なデータ・ガバナンスを提供します。このように、データ・ハブはデータ・レイクとデータ・ウェアハウスを単一のアクセス・レイヤーに集約します。データ処理はデータ・ハブで行わなくなるので、組織はBIインサイトを抽出する一元化された場所を持つことができます。

データ・ウェアハウスにピュア・ストレージが選ばれる理由

既存のデータ・ウェアハウス・インフラストラクチャにOLAPまたはOLTPパイプラインを新たに追加する必要がある場合、ピュア・ストレージのオールフラッシュ・ストレージ・ソリューションを備えるModern Data Experience™への投資を検討する時期がきています。

ピュア・ストレージの  FlashBlade® は、業界初のデータ・ハブであり、データ・ウェアハウスのワークロードに関する分析やレポート作成を行えるだけでなく、データ・ハブが持つ次のような本質的な特性を発揮します。

  • すべてのデータ・エンドポイント間でシームレスなデータ共有
  • 統合ファイル/オブジェクト・ストレージ
  • オペレーショナル・データをリアルタイムで処理する性能
  • スケールアウトを可能にするアーキテクチャ
  • あらゆるデータに多次元的な性能を提供する設計
  • ソフトウェアからハードウェアに至るまで大規模並列
800-379-7873 +44 20 3870 2633 +43 720882474 +32 (0) 7 84 80 560 +33 9 75 18 86 78 +49 89 12089 253 +353 1 485 4307 +39 02 9475 9422 +31 (0) 20 201 49 65 +46-101 38 93 22 +45 2856 6610 +47 2195 4481 +351 210 006 108 +966112118066 +27 87551 7857 +34 51 889 8963 +41 31 52 80 624 +90 850 390 21 64 +971 4 5513176 +7 916 716 7308 +65 3158 0960 +603 2298 7123 +66 (0) 2624 0641 +84 43267 3630 +62 21235 84628 +852 3750 7835 +82 2 6001-3330 +886 2 8729 2111 +61 1800 983 289 +64 21 536 736 +55 11 2655-7370 +52 55 9171-1375 +56 2 2368-4581 +57 1 383-2387