資料湖泊與 資料中樞

資料湖泊與資料中樞在本質上就有極大的差異。資料湖泊的設計是利用傳統技術如 DAS,盡可能高效率地儲存資料。資料湖泊的問題在於它會製造出資料孤島,因而阻礙了為分析用途而需要結合的資料群。

資料中樞架構是一種現代化的、用來儲存以資料為中心的基礎架構──在今時今日這個資料優先的世界裡,藉由使企業合併與分享資料,驅動分析與人工智慧。與資料湖泊及傳統 DAS 架構專門用於儲存資料有所不同,資料中樞架構的設計用於能及時以多維方式 分享與傳遞資料。

為什麼資料湖泊逐漸式微?

資料湖泊會逐漸被淘汰,是因為依照過時的前提下而創造的,也就是所有非結構化資料都一定會被儲存。多數資料都儲存於資料倉庫,但有部分卻遺失在資料湖泊中。資料的統一性被破壞,也無法迅速地互通有無。所以,問題在於為什麼多個傳統的儲存系統難以在單一平台上整合資料? 答案是各應用程式對其所需資料有不同的需求 – 這也造成了資料孤島的激增。該是時候重新考慮新型儲存裝置了。

因為資料就是現代企業的燃料。然而,大多數資料是孤離儲存、分散且無法被分析工具與 AI 應用程式存取。現代智慧需要的不只是儲存資料的裝置,還要能分享與傳遞資料。

資料湖泊與資料中樞的比較

用以統合與分享資料的新型基礎架構

我們深信資料中樞是儲存產業要打造現代架構基礎所必需,我們也寫了公開信給產業界。 資料中樞能擷取各種資料孤島的優勢,整合至統合的平台,並包含四種必要特質:高吞吐量的檔案&物件、真正能向外擴充的設計、滿足多重需求的效能,以及大規模平行運算架構。

Pure的 FlashBlade 是業界第一個資料中樞。從軟體到硬體,所有東西都經過微調,以彰顯這四個資料中樞的必要特色。

FlashBlade 是:

  • 從零打造,統合檔案及物件
  • 原生架構便於橫向擴展
  • 使任何資料都能傳遞多元效能
  • 從軟體到硬體的大規模平行運算

更多精選內容

重新定義後資料湖泊時代

白皮書

資料儲存的當代願景

資料中樞:現代儲存架構

+