데이터 레이크 VS. 데이터 허브

데이터 레이크와 데이터 허브는 핵심부터 매우 다릅니다. 데이터 레이크는 최대한 효율적으로 데이터를 저장하도록 설계되고, 직접 연결 스토리지(DAS) 기반 스토리지와 같은 레거시 기술로 구축되었습니다. 데이터 레이크의 단점은 데이터 레이크가 데이터 사일로를 생성하기 때문에 분석을 위한 총괄적인 데이터세트로의 결합이 불가능하다는 점입니다.

데이터 허브는 기업들의 다양한 데이터 통합 및 공유를 가능하도록 하여 애널리틱스와 AI를 향상시키는 데이터 중심의 스토리지 아키텍처입니다. 데이터 레이크 및 직접 연결 스토리지(DAS) 아키텍처가 주로 데이터 저장을 위해 설계된 것과 다르게, 데이터 허브는 실시간 데이터를 다차원적으로 공유하고 활용하기 위해 설계됐습니다.

데이터 레이크가 사라지는 이유는 무엇일까요?

데이터 레이크는 비정형 데이터를 모두 저장해야 한다는 전제 하에 구축되었기 때문에 점점 사라지고 있습니다. 일부는 데이터 웨어하우스에 저장되고, 일부는 데이터 레이크에서 상실됩니다. 데이터를 통합 할 수 없게되고, 데이터 속도가 저하됩니다. 스토리지 시스템이 단일 플랫폼에 데이터를 통합하는 것은 왜 이렇게 어려울까요? 각 애플리케이션이 데이터에 대한 서로 다른 요구사항을 가지고 있어 데이터 사일로가 급증하기 때문입니다. 스토리지에 대해 다시 생각할 때입니다.

데이터는 기업 미래를 위한 원동력입니다. 그러나 기업이 활용할 수 있는 대부분의 데이터는 사일로에 분산 저장돼 있어 애널리틱스 및 AI 애플리케이션에 활용할 수 없습니다.  모던 인텔리전스는 데이터를 저장하는 것 뿐만 아니라 활용성 까지도 고려하여 설계된 아키텍처가 필요합니다.

데이터 레이크와 데이터 허브를 비교해보겠습니다.

데이터 통합과 공유를 위한 새로운 아키텍처를 소개합니다

퓨어스토리지는 모던 아키텍처를 위해 필요한 것은 데이터 허브라고 믿고 있습니다. 업계에 보내는 오픈 레터를 쓰기도 했습니다.  데이터 허브는 사일로를 단일 플랫폼에 통합시키며, 4가지 필수요소를 제공합니다. 바로 파일 및 오브젝트 스토리지를 위한 높은 처리량, 네이티브 스케일-아웃 아키텍처, 다차원적 성능, 그리고 대규모 병렬 아키텍처입니다.

플래시블레이드(FlashBlade)는 업계 최초의 데이터 허브입니다. 플래시블레이드(FlashBlade)는 소프트웨어에서 하드웨어에 이르기까지 데이터 허브에 핵심적인 요소 4가지를 제공하도록 설계됐습니다.

플래시블레이드(FlashBlade):

  • 처음부터 파일 및 오브젝트를 통합할 수 있도록 설계됐습니다.
  • 기본적으로 스케일-아웃 방식의 확장을 지원할 수 있도록 설계됐습니다.
  • 모든 데이터에 다차원적 성능을 제공하도록 설계됐습니다.
  • 소프트웨어부터 하드웨어까지 적용되는 대규모 병렬 아키텍처를 제공합니다.

최신 퓨어스토리지 자료

데이터 레이크 시대 이후 스토리지가 나아가야 할 미래

데이터 스토리지의 모던 비전

데이터 허브 모던 스토리지 아키텍처

+