Хранилище данных — это система хранения данных, оптимизированная для хранения структурированных данных с целью выполнения высокоскоростных SQL-запросов, необходимых для своевременного бизнес-анализа (BI). В разных направлениях, от обработки высокоскоростных транзакций до прогнозной аналитики, хранилища данных используются уже десятилетиями и фактически стали стандартом СХД для бизнес-анализа на корпоративном уровне.
Преимущества хранилищ данных:
Опробуйте инстанс Pure1® с самообслуживанием для управления Pure FlashBlade™, самого передового решения в отрасли, предоставляющего файловое хранилище и хранилище объектов с горизонтальным масштабированием.
Логистика сбора данных из различных подразделений компаний для извлечения полезной информации может масштабироваться по мере роста бизнеса. С помощью хранилищ данных компании могут надежно консолидировать эту информацию в единую базу данных и модель данных, что позволит аналитикам выполнять запросы.
Вот как это работает:
База данных, с которой взаимодействуют в хранилище данных, является реляционной, т. е. данные структурированы — хранятся в таблицах, состоящих из столбцов и строк. Такие таблицы организованы по схеме, которая была определена во время записи.
Когда этап преобразования обрабатывается хранилищем ODS, которое является внешним по отношению к хранилищу данных, он называется ETL (Extract, Transform, Load — извлечение, преобразование, загрузка). Когда преобразования обрабатываются внутри хранилища данных, это ELT (Extract, Load, Transform — извлечение, загрузка, преобразование). При использовании как ETL, так и ELT хранилищам данных требуются структурированные данные и схема при записи для работы с реляционными базами данных.
Распространенные сферы применения хранилищ данных:
Поскольку хранилища данных представляют собой схему при записи, важно выяснить, какие типы запросов будут выполняться, прежде чем добавлять схему в хранилище данных. Чтобы уменьшить сложность разрозненных источников данных, хранилище данных можно сегментировать на витрины данных, чтобы выделять аппаратные и программные ресурсы для определенных бизнес-функций, например CRM.
Хотя эти три концепции могут показаться взаимозаменяемыми, важно понимать различия между ними:
Data Hub обеспечивает управление данными, необходимое для рационализации совместного использования данных в разных совокупностях конечных точек. Таким образом, Data Hub консолидирует озера данных и хранилища данных в единый уровень доступа. Обработка данных абстрагирована от Data Hub, поэтому организации могут централизованно извлекать важные данные бизнес-анализа.
Если вам необходимо добавить новый ресурс OLAP или OLTP к существующей инфраструктуре хранилища данных, возможно, пора рассмотреть инвестирование в более современное взаимодействие с данными — Modern Data Experience™ с решениями all-flash СХД от Pure Storage.
FlashBlade® от Pure Storage® — это первый в отрасли Data Hub, который не только может справиться с рабочими средами для аналитики и отчетов в хранилище данных, но и имеет важные характеристики, которые являются основой Data Hub: