業界トップクラスのデータ削減技術

Purity Reduceは、きめ細かく、かつ包括的な、業界屈指のデータ削減技術です。Purity Reduceの削減効果は、他のオールフラッシュベンダーの追随を許しません。


他を圧倒するデータ削減率

下記のティッカーは、平均データ削減率を示しています。ピュア・ストレージのFlashArrayがインストールされたすべての環境から計測した数値を、24時間365日更新しています。

: 1 平均データ削減率 (重複排除 + 圧縮のみ)
: 1 平均総削減率 (重複排除 + 圧縮 + シンプロビジョニング)

偽物にご注意ください

多くのベンダーでは、本来の数値を補うために、データ削減率にシンプロビジョニングやスナップによる効果を含めています。あるいは、ボリュームあたりの値を示すことがありますが、これも実際の数値を曖昧にするための方便にしか過ぎません。ピュア・ストレージでは、インラインおよび常時オンのデータ削減技術がインストールベース全体におよぼす数値と、シンプロビジョニングを含んだ場合の数値とを分けて説明しています。

5種類のデータ削減技術を使用

パターン除去

パターン除去では、ゼロの連続を含め、繰り返し現れる2進数のパターンを検出し、除去します。ストレージ容量の節約に留まらず、重複排除スキャナーや圧縮エンジンが処理するデータの削減も行います。

512Bでアライン、可変長の重複排除

512Bアライン、可変長ブロック(4K~32K)による、効率性に優れたインライン重複排除を提供します。フラッシュでは、固定ブロックのアーキテクチャでは見落とされる重複まで削除します。したがって、重複のないデータブロックのみが保存されます。そのうえ、このような容量節約のための調整は一切必要ありません。

インライン圧縮

インライン圧縮によってデータを削減し、元の形式よりも容量の使用量を減らすことができます。追加のみの書き込みレイアウトと可変アドレスの使用により、圧縮を最適化します。このことにより、固定ブロックアーキテクチャに見られるような無駄な容量の発生を防いでいます。ディープ削減との相乗効果により、2倍~4倍のデータ削減を可能にしています。また、圧縮はデータベースにおけるデータ削減の主要な手段です。

ディープ削減

Purity Reduceでは、インライン圧縮の実行だけに留まらず、より高度な圧縮アルゴリズムを適用し、データをさらに削減します。他社の大半のオールフラッシュ製品では単一の圧縮アルゴリズムを使用しているため、このレベルの削減はできません。

コピー削減

FlashArrayにおけるデータのコピーに関わるのはメタデータのみです。Purityは、データ削減エンジンを活用し、スナップショット、クローン、レプリケーション、xCopyコマンドの、予め重複排除されたコピーを即座に提供します。


データ削減において業界をリードできる理由

5種類の削減技術: パターン除去、重複排除圧縮、ディープ削減、コピー削減の5つの技術により、ほぼすべてのアプリケーションに適したデータ削減が可能となっています。

常に有効: Purityオペレーティング環境は、効率のよいデータ削減を常に実行できるように設計されています。ピュア・ストレージによるパフォーマンスのベンチマークは、すべてデータ削減を有効にした状態で計測されています。

グローバル: 一部のデータ削減ソリューションは、単一のボリュームまたはプール内で動作するため、データのパーティショニングと、重複排除による削減効果の大幅な減少が起こります。それに対して、Purity//Reduceの重複排除はインラインで行われ、グローバルに適用されます。

可変アドレス: Purityは可変アドレスの実装により、固定ブロックの実装では検出できない重複を検出します。Purity Reduceは、512バイト単位できめ細かに重複をスキャンし、アプリケーションのデータレイアウトに合わせて自動的にアライメントを行います。手動での調整は不要です。また、可変(バイト可変)圧縮では、固定バケット単位での圧縮とは異なり、無駄が生じて節約の効果が薄れることはありません。

複数の圧縮アルゴリズム: データの種類により、適切な圧縮方法を使用します。Purityでは、複数の圧縮アルゴリズムを利用して、最適なデータ削減を実現します。

混合ワークロード向けの設計: Purity Reduceでは、混合ワークロード向けの最適なデータ削減が可能です。悪影響が生じることはなく、調整も不要です。

期待できるデータ削減の目安

データ削減は、さまざまな種類のアプリケーションとデータタイプに対して有効です。実際に試して、データ削減機能がどのような効果をもたらすかをご確認ください。下に示す平均値は、最も一般的な運用事例から導き出されたものです。


VMwareまたはHyper-Vを利用した仮想サーバー環境に、異種のアプリケーションが混在した状態での削減率です。

データベース環境

OLTP、OLAPはもちろんのこと、データベースでも、驚くほど大幅なデータ削減が可能です。削減の大半は圧縮によるものです。

仮想デスクトップは、パーシステントかノンパーシステントかを問わず、データセンター内で最もデータを削減できるワークロードです。


完全なシンプロビジョニングのFlashArray

すべてのボリューム、すべてのワークロードに使用する容量は、オンデマンドで動的に割り当てられます。これにより、データ保存量の最大化を可能にします。ゼロで埋める処理は行われません。多くのベンダーが、データ削減量を押し上げるためにシンプロビジョニングを行っています。しかし、シンプロビジョニングは過剰な割り当てを避ける技術であり、データ削減の技術ではありません。このため、Purity Reduceのティッカーでは、重複排除と圧縮のみの効果から算出した削減率の平均と、シンプロビジョニングの効果を含めた全体の削減率の平均を区別しています。きめ細かさについては、すべてのPurityサービスと同様に、512Bの単位で処理されるため、Purityのシンプロビジョニングは他社のソリューションよりも優れた効率性を実現しています。

「現在、Oracleデータベースで30%、MongoDBで90%のデータ削減ができています。」
フェローJustin Stottlemyer氏
Shutterfly社
「重複排除と圧縮機能により、読み取りの拡張性を、使用容量を増加させずに維持できるようになりました。」
データ運用部門シニアディレクターNeil Pinto氏
LinkedIn社
「フラッシュはディスクスペースのフル活用を可能にします。」
CTO Jack Hogan氏
Lifescript社

注目の技術パートナー