Skip to Content
Dismiss
Innovazione
Una piattaforma creata per l'AI

Unificata, automatizzata e pronta a trasformare i dati in intelligence.

Scopri come
Dismiss
16-18 giugno, Las Vegas
Pure//Accelerate® 2026

Scopri come trarre il massimo dai tuoi dati. 

Registrati ora

Che cos'è un data warehouse?

Che cos'è un data warehouse?

Un data warehouse è un sistema di storage ottimizzato per l'archiviazione di dati strutturati che consente di eseguire le query SQL ad alta velocità necessarie per fornire una business intelligence (BI) tempestiva. Dall'elaborazione di transazioni ad alta velocità ai predictive analytics, i data warehouse hanno una storia decennale come standard di storage de facto utilizzato dalle aziende per la propria business intelligence.

I vantaggi dei data warehouse

I vantaggi dei data warehouse includono:

  • Consolidamento di dati strutturati provenienti da origini diverse 
  • Esecuzione rapida di query analitiche da database relazionali
  • Una soluzione di storage dedicata per ridurre i costi delle query e accelerare il reporting

Prova FlashBlade attraverso il nostro Test Drive

Prova l'esperienza di un'istanza self-service di Pure1® per gestire Pure FlashBlade™, la soluzione più avanzata del settore che offre file e l'object storage scale-out nativi.

Richiedi una prova

Come funzionano i data warehouse

La logistica della raccolta di dati provenienti da diversi settori aziendali per estrarre informazioni utili può diventare sempre più complessa con la progressiva crescita del business. I data warehouse possono offrire alla tua azienda la possibilità di consolidare in modo affidabile tali informazioni in un unico database e modello di dati per consentire  agli analisti di eseguire le loro query. 

Ecco come funziona:

  1. Estrazione: raccolta dei dati raw dai diversi settori dell'organizzazione (ad es. ERP, CRM, vendite, marketing) in database di staging.
  2. Trasformazione: i dati a livello di staging vengono trasferiti in un livello di integrazione, dove vengono combinati e trasformati in un ODS (Operational Data Store).
  3. Caricamento: i dati vengono spostati dal livello di integrazione nel data warehouse attraverso la definizione dello schema che gli analisti desiderano utilizzare per le loro query SQL prima di scriverli in un database relazionale (schema in scrittura). 

Il database con cui si interagisce in un data warehouse è relazionale; in altre parole, i dati sono strutturati in tabelle costituite da colonne e righe. Queste tabelle sono organizzate in base agli schemi definiti  durante la scrittura. 

Quando la fase di trasformazione è gestita da un ODS esterno al data warehouse, si parla di ETL (Extract, Transform, Load). Quando è il data warehouse a gestire internamente le trasformazioni, si parla di ELT (Extract, Load, Transform). Che la scelta ricada su ETL o su ELT, i data warehouse richiedono dati strutturati, e uno schema in scrittura, per poter essere utilizzati con i database relazionali.

Quali sono gli ambiti di applicazione dei data warehouse?

Le applicazioni più diffuse di data warehouse includono:

  • Online Transaction Processing (OLTP): Un data warehouse può essere ottimizzato per la data integrity e le query veloci per gestire un elevato volume di brevi transazioni di dati. Un esempio è dato dalle transazioni che avvengono su una piattaforma di trading ad alta frequenza. 
  • Elaborazione analitica online (OLAP): puoi ottimizzare un data warehouse per accelerare l'esecuzione di query complesse per un volume di transazioni relativamente inferiore. È sostanzialmente ciò che un analista utilizza per generare report di business intelligence.
  • Predictive analytics: un sistema OLAP può essere ottimizzato per prevedere eventi futuri e generare scenari "what if" per l'azienda, spesso con l'aiuto di algoritmi di machine learning.

Poiché i data warehouse sono schemi in scrittura, è importante sapere che tipo di query si desidera eseguire prima di aggiungere schemi a un data warehouse. Per gestire la complessità di più fonti di dati, un data warehouse può essere segmentato in data mart per dedicare risorse hardware e software a specifiche funzioni aziendali come il CRM.

Data warehouse, data lake e data hub a confronto

Anche se questi tre concetti possono sembrare intercambiabili, è importante comprenderne le differenze:

  • Data warehouse: un unico repository per l'integrazione e l'archiviazione di dati strutturati provenienti da più origini di dati non strutturati in tutta l'organizzazione.
  • Data lake: un unico repository non elaborato di tutte le origini di dati raw strutturati e non strutturati all'interno di un'organizzazione (compresi i data warehouse). I dati devono essere ancora elaborati per estrarre informazione approfondite di business intelligence. 
  • Data hub: un'unica interfaccia che consolida tutti i dati, strutturati e non strutturati, in un livello di dati accessibile a livello centrale. Si differenzia da un data warehouse in quanto è in grado di gestire anche dati operativi e si differenzia da un data lake per la capacità di fornire dati in più formati. 

I data hub offrono la governance dei dati necessaria per semplificare la condivisione dei dati nell'ambito di una raccolta diversificata di endpoint. In questo modo, i data hub consolidano i data lake e i data warehouse in un unico livello di accesso. L'elaborazione dei dati avviene in modo invisibile dietro il data hub, offrendo all'organizzazione una posizione centralizzata dove estrarre le informazioni approfondite di business intelligence.

Perché scegliere Pure Storage per le tue esigenze di data warehouse?

Se hai la necessità di aggiungere una nuova pipeline OLAP o OLTP alla tua infrastruttura di data warehouse esistente, potrebbe essere il momento di valutare l'opportunità di investire in una Modern Data Experience™ più avanzata con le soluzioni di storage all-flash di Pure Storage. 

In qualità di primo data hub del settore, Pure Storage®  FlashBlade®  può non solo gestire i workload di analytics and reporting di un data warehouse, ma anche fornire le qualità essenziali di un data hub:

  • Condivisione dei dati fluida tra tutti gli endpoint di dati
  • File storage e object storage unificati
  • Possibilità di gestire i dati operativi in tempo reale
  • Concepito in modalità nativa per lo scale-out
  • Progettato per fornire performance multidimensionali per qualsiasi tipo di dati
  • Parallelo dal software all'hardware

Potrebbe interessarti anche...

07/2025
Scalable Lakehouse Analytics with Everpure and Starburst | Everpure
From Hadoop sprawl to data lakehouse: Starburst + FlashBlade Object Storage delivers performance, cost, and operational gains in a scalable solution.
Reference architecture
17 pages

Esplora risorse ed eventi principali

TRADESHOW
Pure//Accelerate® 2026
June 16-18, 2026 | Resorts World Las Vegas

Preparati all'evento più importante a cui parteciperai quest'anno.

Registrati ora
DEMO DI PURE360
Esplora, scopri e prova Pure Storage.

Accedi a video e demo on demand per scoprire i vantaggi che Pure Storage ti offre.

Guarda le demo
VIDEO
Guarda: Il valore di un Enterprise Data Cloud (EDC).

Charlie Giancarlo spiega perché il futuro è nella gestione dei dati, non dello storage. Scopri in che modo un approccio unificato trasforma le operazioni IT aziendali.

Guarda
RISORSA
Lo storage legacy non può alimentare il futuro.

I workload moderni richiedono velocità, sicurezza e scalabilità AI-ready. Il tuo stack è pronto?

Effettua la valutazione
Il browser che stai usando non è più supportato.

I browser non aggiornati spesso comportano rischi per la sicurezza. Per offrirti la migliore esperienza possibile sul nostro sito, ti invitiamo ad aggiornare il browser alla versione più recente.

Personalize for Me
Steps Complete!
1
2
3
Personalize your Everpure experience
Select a challenge, or skip and build your own use case.
Strategie di virtualizzazione pronte per affrontare il futuro

Soluzioni di storage per tutte le tue esigenze

Consenti progetti di AI di qualunque dimensione

Storage a performance elevate per pipeline dei dati, formazione e inferenza

Proteggiti dalla perdita dei dati

Soluzioni di resilienza informatica che proteggono i tuoi dati

Riduci i costi delle operazioni su cloud

Storage efficiente dal punto di vista dei costi per Azure, AWS e private cloud

Accelera le performance di applicazioni e database

Storage a bassa latenza per le performance delle applicazioni

Riduci il consumo di energia e di ingombro del data center

Storage efficiente delle risorse per ottimizzare l'utilizzo dei data center

Confirm your outcome priorities
Your scenario prioritizes the selected outcomes. You can modify or choose next to confirm.
Primary
Reduce My Storage Costs
Lower hardware and operational spend.
Primary
Strengthen Cyber Resilience
Detect, protect against, and recover from ransomware.
Primary
Simplify Governance and Compliance
Easy-to-use policy rules, settings, and templates.
Primary
Deliver Workflow Automation
Eliminate error-prone manual tasks.
Primary
Use Less Power and Space
Smaller footprint, lower power consumption.
Primary
Boost Performance and Scale
Predictability and low latency at any size.
What’s your role and industry?
We've inferred your role based on your scenario. Modify or confirm and select your industry.
Select your industry
Financial services
Government
Healthcare
Education
Telecommunications
Automotive
Hyperscaler
Electronic design automation
Retail
Service provider
Transportation
Which team are you on?
Technical leadership team
Defines the strategy and the decision making process
Infrastructure and Ops team
Manages IT infrastructure operations and the technical evaluations
Business leadership team
Responsible for achieving business outcomes
Security team
Owns the policies for security, incident management, and recovery
Application team
Owns the business applications and application SLAs
Describe your ideal environment
Tell us about your infrastructure and workload needs. We chose a few based on your scenario.
Select your preferred deployment
Hosted
Dedicated off-prem
On-prem
Your data center + edge
Public cloud
Public cloud only
Hybrid
Mix of on-prem and cloud
Select the workloads you need
Databases
Oracle, SQL Server, SAP HANA, open-source

Key benefits:

  • Instant, space-efficient snapshots

  • Near-zero-RPO protection and rapid restore

  • Consistent, low-latency performance

 

AI/ML and analytics
Training, inference, data lakes, HPC

Key benefits:

  • Predictable throughput for faster training and ingest

  • One data layer for pipelines from ingest to serve

  • Optimized GPU utilization and scale
Data protection and recovery
Backups, disaster recovery, and ransomware-safe restore

Key benefits:

  • Immutable snapshots and isolated recovery points

  • Clean, rapid restore with SafeMode™

  • Detection and policy-driven response

 

Containers and Kubernetes
Kubernetes, containers, microservices

Key benefits:

  • Reliable, persistent volumes for stateful apps

  • Fast, space-efficient clones for CI/CD

  • Multi-cloud portability and consistent ops
Cloud
AWS, Azure

Key benefits:

  • Consistent data services across clouds

  • Simple mobility for apps and datasets

  • Flexible, pay-as-you-use economics

 

Virtualization
VMs, vSphere, VCF, vSAN replacement

Key benefits:

  • Higher VM density with predictable latency

  • Non-disruptive, always-on upgrades

  • Fast ransomware recovery with SafeMode™

 

Data storage
Block, file, and object

Key benefits:

  • Consolidate workloads on one platform

  • Unified services, policy, and governance

  • Eliminate silos and redundant copies

 

What other vendors are you considering or using?
Thinking...
Your personalized, guided path
Get started with resources based on your selections.