데이터 웨어하우스가 비즈니스 인텔리전스 업무를 지원하는 방식

데이터 웨어하우스란?

데이터 웨어하우스란?

데이터 웨어하우스는 적시에 비즈니스 인텔리전스(BI)를 제공하는 데 필요한 고속 SQL 쿼리를 수행하기 위한 정형 데이터의 저장에 최적화된 스토리지 시스템입니다. 고속 트랜잭션 처리에서 예측 분석에 이르기까지, 데이터 웨어하우스는 기업에서 BI를 강화하기 위해 사용하는 사실상의 스토리지 표준으로서 수십 년의 역사를 지니고 있습니다.

데이터 웨어하우스의 장점

데이터 웨어하우스의 장점

  • 이질적인 여러 소스의 정형 데이터 통합
  • 관계형 데이터베이스에 대한 고속 분석 쿼리
  • 리소스를 적게 소비하는 쿼리와 더 빠른 보고를 위한 전용 스토리지 솔루션

플래시블레이드(FlashBlade) 무료 체험 하기

업계에서 가장 고도화된 네이티브 스케일-아웃 파일, 오브젝트 스토리지 제공 솔루션인 퓨어스토리지 플래시블레이드(FlashBlade™)를 관리할 수 있는 퓨어1(Pure1®) 셀프-서비스 인스턴스를 체험하세요.

데이터 웨어하우스 작동 방식

유용한 정보를 추출하기 위해 비즈니스의 여러 부문에서 데이터를 취합하는 실행 계획은 비즈니스가 성장함에 따라 복잡해질 수 있습니다. 데이터 웨어하우스는 해당 정보를 단일 데이터베이스 및 데이터 모델로 통합하는 신뢰성 높은 방법을 제공함으로써 분석가가 쿼리를 실행할 수 있도록 지원합니다.

작동 방식

  1. 추출: 조직 전체의 다양한 소스(예: ERP, CRM, 영업, 마케팅)에서 원시 데이터를 스테이징 데이터베이스로 취합하세요.
  2. 변환: 스테이징 계층의 데이터는 통합 계층으로 전송되며 여기서 데이터는 결합 과정을 거쳐 ODS(Operational Data Store)로 변환됩니다.
  3. 로드: 분석가가 관계형 데이터베이스(쓰기 시 스키마)에 해당 데이터를 쓰기 전에 SQL 쿼리에 사용할 스키마를 정의하는 방법으로 데이터는 통합 계층에서 데이터 웨어하우스로 이동합니다.

사용자가 데이터 웨어하우스에서 사용하는 데이터베이스는 관계형이므로, 데이터는 구조화되고 열과 행으로 구성된 테이블에 저장됩니다. 이 테이블들은 쓰기 중에 정의되는 스키마에 따라 체계화됩니다.

변환 단계가 데이터 웨어하우스 외부에 있는 ODS에서 처리되는 경우, 이를 ETL(추출, 변환, 로드)이라고 합니다. 데이터 웨어하우스에서 변환을 내부적으로 처리할 경우 이를 ELT(추출, 로드, 변환)라고 합니다. ETL 또는 ELT 중 어느 것을 이용하든 관계형 데이터베이스를 사용하려면 데이터 웨어하우스에 정형 데이터와 쓰기 시 스키마가 있어야 합니다.

데이터 웨어하우스의 용도

데이터 웨어하우스의 적용 부문

  • OLTP (온라인트랜잭션처리) 데이터 웨어하우스는 대용량의 짧은 데이터 트랜잭션을 처리하도록 데이터 무결성 및 고속 쿼리에 최적화될 수 있습니다. 예를 들어, 빈도가 높은 거래 플랫폼에서 발생하는 트랜잭션이 있습니다.
  • OLAP (온라인분석처리) 데이터 웨어하우스는 비교적 적은 양의 트랜잭션을 처리하는 더 빠르고 복잡한 쿼리에 대해 최적화할 수 있습니다. 데이터 웨어하우스는 기본적으로 분석가가 BI 보고서를 생성할 때 사용합니다.
  • 예측 분석: OLAP 시스템은 흔히 머신 러닝 알고리즘의 도움을 받아 향후 이벤트를 예측하고 비즈니스에 대한 "가정" 시나리오를 생성하도록 최적화할 수 있습니다.

데이터 웨어하우스는 쓰기 시 스키마이므로, 데이터 웨어하우스에 스키마를 추가하려면 실행할 쿼리 유형을 미리 알고 있어야 합니다. 다양한 데이터 소스의 복잡성을 관리하기 위해 데이터 웨어하우스를 데이터 마트로 분할하여 CRM과 같은 특정 업무에 하드웨어 및 소프트웨어 리소스를 할당할 수 있습니다.

데이터 웨어하우스 vs. 데이터 레이크 vs. 데이터 허브

이 세 가지 개념은 서로 비슷한 것 같지만 다음과 같이 분명한 차이가 있습니다.

  • 데이터 웨어하우스(Data Warehouse) 조직 전반의 여러 비정형 데이터 소스에서 가져온 정형 데이터를 통합하고 저장하기 위한 단일 저장소입니다.
  • 데이터 레이크 한 조직 내의 모든 정형 및 비정형 원시 데이터 소스(데이터 웨어하우스 포함)를 위한 미가공의 단일 저장소입니다. 데이터는 비즈니스 인텔리전스 인사이트 도출을 위해 처리되어야 합니다.
  • 데이터 허브: 모든 정형 및 비정형 데이터를 중앙의 액세스 가능한 데이터 계층으로 통합하는 단일 인터페이스입니다. 운영 데이터도 처리할 수 있다는 점에서 데이터 웨어하우스와는 다르며, 여러 형식으로 데이터를 제공할 수 있다는 점에서 데이터 레이크와도 다릅니다.

데이터 허브는 다양한 엔드포인트 컬렉션 간의 데이터 공유를 간소화하는 데 필요한 데이터 거버넌스를 제공합니다. 데이터 허브는 이러한 방식으로 데이터 레이크와 데이터 웨어하우스를 단일 액세스 계층으로 통합합니다. 데이터 프로세싱은 데이터 허브 이면에서 추상화되어 조직에 BI 통찰력을 추출할 수 있는 중앙 집중식 장소를 제공합니다.

데이터 허브를 위해 퓨어스토리지를 선택하는 이유는?

기존 데이터 웨어하우스 인프라에 새로운 OLAP 또는 OLTP 파이프라인을 추가해야 하는 경우, 이제 퓨어스토리지의 올플래시 스토리지 솔루션으로 더욱 현대적인 데이터 경험(Modern Data Experience™)에 투자하는 것이 좋습니다.

업계 최초의 데이터 허브인  플래시블레이드(FlashBlade®) 는 데이터 웨어하우스의 분석 및 보고 워크로드를 처리할 뿐만 아니라 데이터 허브의 필수적인 품질도 구현할 수 있습니다.

  • 모든 데이터 엔드포인트에 데이터를 원활히 공유합니다
  • 통합되고 빠른 파일 및 오브젝트 스토리지
  • 운영 데이터 실시간 처리 역량
  • 기본적으로 스케일-아웃 방식의 확장을 지원할 수 있도록 설계됐습니다.
  • 모든 데이터에 다차원적 성능을 제공하도록 설계됐습니다.
  • 소프트웨어부터 하드웨어까지 적용되는 대규모 병렬 아키텍처를 제공합니다.
800-379-7873 +44 20 3870 2633 +43 720882474 +32 (0) 7 84 80 560 +33 9 75 18 86 78 +49 89 12089 253 +353 1 485 4307 +39 02 9475 9422 +31 (0) 20 201 49 65 +46-101 38 93 22 +45 2856 6610 +47 2195 4481 +351 210 006 108 +966112118066 +27 87551 7857 +34 51 889 8963 +41 31 52 80 624 +90 850 390 21 64 +971 4 5513176 +7 916 716 7308 +65 3158 0960 +603 2298 7123 +66 (0) 2624 0641 +84 43267 3630 +62 21235 84628 +852 3750 7835 +82 2 6001-3330 +886 2 8729 2111 +61 1800 983 289 +64 21 536 736 +55 11 2655-7370 +52 55 9171-1375 +56 2 2368-4581 +57 1 383-2387