Skip to Content
Dismiss
Innovazione
Una piattaforma creata per l'AI

Unificata, automatizzata e pronta a trasformare i dati in intelligence.

Scopri come
Dismiss
16-18 giugno, Las Vegas
Pure//Accelerate® 2026

Scopri come trarre il massimo dai tuoi dati. 

Registrati ora

Che cos'è la GPFS?

In un ambiente frenetico, è necessario un file system che consenta letture simultanee da più nodi. Il General Parallel File System (GPFS) IBM è stato sviluppato nel 1998, ma è un'opzione per le aziende che sfruttano l'intelligenza artificiale (AI) e il machine learning (ML) nelle loro applicazioni. Queste applicazioni richiedono uno storage a volumi elevati e performance elevate accessibile da più nodi per un'elaborazione più rapida.

Che cos'è la GPFS?

Le applicazioni di livello enterprise funzionano con più dischi con potenziali petabyte di dati archiviati. Il file system IBM GPFS consente una rapida trasmissione dei dati per evitare colli di bottiglia dovuti a una tecnologia di storage su disco più lenta. La nuova tecnologia GPFS distribuisce i metadati su più nodi di storage su disco e i dati vengono distribuiti su più dischi. La distribuzione dei dati su più dischi consente alle applicazioni di recuperare i dati da più dischi contemporaneamente (cioè in parallelo) in modo da poter recuperare più dati contemporaneamente. Questa tecnologia supera i colli di bottiglia comuni quando le applicazioni sono costrette ad attendere il recupero di tutti i dati da un singolo disco.

Caratteristiche della GPFS

L'input e l'output paralleli in GPFS sono ciò che rende il file system una delle opzioni migliori per le applicazioni di AI e ML, ma la tecnologia ne ha diverse altre:

  • Funziona bene con miliardi di file archiviati su una rete di aree di storage (SAN) 
  • Gestione e integrazione convenienti dei dispositivi SAN e GPFS
  • Letture e scritture ad alta velocità per supportare le applicazioni con utenti simultanei con volumi elevati
  • Legge e scrive exabyte di dati con bassa latenza

Casi d'uso per GPFS

Il calcolo a performance elevate (HPC) richiede il meglio della tecnologia, ma le aziende spesso dimenticano che i colli di bottiglia avvengono a livello di storage. Puoi avere le CPU, i server, la memoria e le velocità di trasferimento di rete più veloci disponibili che si inseriscono nell'hardware di storage per leggere o scrivere i dati. Ma se la tecnologia di storage è lenta, si introduce un collo di bottiglia e si rallentano le applicazioni. 

Alcuni casi d'uso per la GPFS:

  • Ingegneria delle performance per i data center
  • Applicazioni che richiedono elevati volumi di elaborazione dati
  • Ingestione ed elaborazione del machine learning e dell'intelligenza artificiale
  • Storage ed elaborazione multi-applicazione
  • Storage a volumi elevati di diversi petabyte

Architettura GPFS

La GPFS utilizza un'architettura distribuita, il che significa che i dati coprono più dispositivi di storage. Più server o posizioni SAN contengono i dati e più connessioni di rete collegano questi dispositivi di storage. Quando un'applicazione deve leggere i dati, può utilizzare più posizioni di rete per leggere i dati in parallelo, il che significa che i dati vengono letti contemporaneamente da tutte le posizioni di storage.

Alcuni componenti chiave dell'architettura GPFS:

  • I dati vengono archiviati in più posizioni di storage, ma anche i metadati che descrivono i dati vengono memorizzati su più server.
  • I server che memorizzano i dati possono trovarsi in più posizioni cloud o on-premise.
  • Le connessioni di rete veloci collegano le posizioni e le applicazioni di storage utilizzando lo storage GPFS.
  • Le tecnologie avanzate per i dispositivi di storage sono essenziali.

Confronto tra GPFS e file system tradizionali

La GPFS viene spesso confrontata con l'Hadoop Distributed File System (HDFS). Entrambi hanno lo scopo di memorizzare grandi quantità di dati, ma presentano alcune differenze che influiscono sulle performance e sulla scalabilità. Mentre entrambi i file system suddividono i dati e li memorizzano sui nodi della rete, GPFS dispone della semantica Posix per consentire la compatibilità con varie distribuzioni e sistemi operativi Linux, tra cui Windows. 

Per l'indicizzazione Hadoop sono necessari server di metadati primari e secondari di grandi dimensioni, ma GPFS distribuisce i metadati nel sistema senza la necessità di server specializzati. I dati distribuiti sono anche in blocchi più piccoli rispetto ad Hadoop, quindi le letture avvengono più velocemente, soprattutto perché i dati vengono letti in parallelo. La GPFS richiede una maggiore capacità di data storage rispetto ad Hadoop, ma è molto più veloce durante i cicli di lettura.

Best practice GPFS

Per mantenere le letture e le scritture dei file a velocità ottimali, assicurati innanzitutto di disporre dell'infrastruttura di rete per le performance. Un sistema di storage GPFS leggerà in parallelo, quindi disporre di apparecchiature di rete che mettono le performance al primo posto garantisce che non costituisca un collo di bottiglia per il trasferimento dei dati. L'infrastruttura di Pure Storage, tra cui Pure Cloud Block Store™, Portworx® e FlashArray™, mantiene le performance delle applicazioni per le letture su dischi di grandi volumi.

La condivisione dei file deve essere utilizzata con punti di montaggio a livello di directory in modo che le applicazioni non accedano all'intero file system, compresi i file del sistema operativo. Il montaggio basato su directory invece che su interi dischi protegge meglio i dati e l'integrità dei dischi di hosting del server. Gli amministratori devono inoltre separare i file sensibili non correlati alle procedure di lettura delle applicazioni per ridurre i rischi di accesso non autorizzato.

Conclusione

Se hai bisogno di uno storage rapido per ottenere una potenza di calcolo a performance elevate nelle applicazioni di AI e machine learning, Pure Storage dispone dell'infrastruttura necessaria per garantire la scalabilità necessaria per la crescita aziendale e la soddisfazione degli utenti. Gli amministratori possono implementare dischi per HPC senza costi elevati di provisioning e installazione. La nostra infrastruttura HPC è progettata per offrire integrità, performance, scalabilità ed elaborazione di nuova generazione alle tue applicazioni ad alta velocità.

Potrebbe interessarti anche...

03/2026
The Enterprise AI Guidebook
From data sovereignty to ai factories, discover the hidden challenges of scaling AI and how to overcome them.
eBook
7 pages

Esplora risorse ed eventi principali

TRADESHOW
Pure//Accelerate® 2026
June 16-18, 2026 | Resorts World Las Vegas

Preparati all'evento più importante a cui parteciperai quest'anno.

Registrati ora
DEMO DI PURE360
Esplora, scopri e prova Pure Storage.

Accedi a video e demo on demand per scoprire i vantaggi che Pure Storage ti offre.

Guarda le demo
VIDEO
Guarda: Il valore di un Enterprise Data Cloud (EDC).

Charlie Giancarlo spiega perché il futuro è nella gestione dei dati, non dello storage. Scopri in che modo un approccio unificato trasforma le operazioni IT aziendali.

Guarda
RISORSA
Lo storage legacy non può alimentare il futuro.

I workload moderni richiedono velocità, sicurezza e scalabilità AI-ready. Il tuo stack è pronto?

Effettua la valutazione
Il browser che stai usando non è più supportato.

I browser non aggiornati spesso comportano rischi per la sicurezza. Per offrirti la migliore esperienza possibile sul nostro sito, ti invitiamo ad aggiornare il browser alla versione più recente.

Personalize for Me
Steps Complete!
1
2
3
Personalize your Everpure experience
Select a challenge, or skip and build your own use case.
Strategie di virtualizzazione pronte per affrontare il futuro

Soluzioni di storage per tutte le tue esigenze

Consenti progetti di AI di qualunque dimensione

Storage a performance elevate per pipeline dei dati, formazione e inferenza

Proteggiti dalla perdita dei dati

Soluzioni di resilienza informatica che proteggono i tuoi dati

Riduci i costi delle operazioni su cloud

Storage efficiente dal punto di vista dei costi per Azure, AWS e private cloud

Accelera le performance di applicazioni e database

Storage a bassa latenza per le performance delle applicazioni

Riduci il consumo di energia e di ingombro del data center

Storage efficiente delle risorse per ottimizzare l'utilizzo dei data center

Confirm your outcome priorities
Your scenario prioritizes the selected outcomes. You can modify or choose next to confirm.
Primary
Reduce My Storage Costs
Lower hardware and operational spend.
Primary
Strengthen Cyber Resilience
Detect, protect against, and recover from ransomware.
Primary
Simplify Governance and Compliance
Easy-to-use policy rules, settings, and templates.
Primary
Deliver Workflow Automation
Eliminate error-prone manual tasks.
Primary
Use Less Power and Space
Smaller footprint, lower power consumption.
Primary
Boost Performance and Scale
Predictability and low latency at any size.
What’s your role and industry?
We've inferred your role based on your scenario. Modify or confirm and select your industry.
Select your industry
Financial services
Government
Healthcare
Education
Telecommunications
Automotive
Hyperscaler
Electronic design automation
Retail
Service provider
Transportation
Which team are you on?
Technical leadership team
Defines the strategy and the decision making process
Infrastructure and Ops team
Manages IT infrastructure operations and the technical evaluations
Business leadership team
Responsible for achieving business outcomes
Security team
Owns the policies for security, incident management, and recovery
Application team
Owns the business applications and application SLAs
Describe your ideal environment
Tell us about your infrastructure and workload needs. We chose a few based on your scenario.
Select your preferred deployment
Hosted
Dedicated off-prem
On-prem
Your data center + edge
Public cloud
Public cloud only
Hybrid
Mix of on-prem and cloud
Select the workloads you need
Databases
Oracle, SQL Server, SAP HANA, open-source

Key benefits:

  • Instant, space-efficient snapshots

  • Near-zero-RPO protection and rapid restore

  • Consistent, low-latency performance

 

AI/ML and analytics
Training, inference, data lakes, HPC

Key benefits:

  • Predictable throughput for faster training and ingest

  • One data layer for pipelines from ingest to serve

  • Optimized GPU utilization and scale
Data protection and recovery
Backups, disaster recovery, and ransomware-safe restore

Key benefits:

  • Immutable snapshots and isolated recovery points

  • Clean, rapid restore with SafeMode™

  • Detection and policy-driven response

 

Containers and Kubernetes
Kubernetes, containers, microservices

Key benefits:

  • Reliable, persistent volumes for stateful apps

  • Fast, space-efficient clones for CI/CD

  • Multi-cloud portability and consistent ops
Cloud
AWS, Azure

Key benefits:

  • Consistent data services across clouds

  • Simple mobility for apps and datasets

  • Flexible, pay-as-you-use economics

 

Virtualization
VMs, vSphere, VCF, vSAN replacement

Key benefits:

  • Higher VM density with predictable latency

  • Non-disruptive, always-on upgrades

  • Fast ransomware recovery with SafeMode™

 

Data storage
Block, file, and object

Key benefits:

  • Consolidate workloads on one platform

  • Unified services, policy, and governance

  • Eliminate silos and redundant copies

 

What other vendors are you considering or using?
Thinking...
Your personalized, guided path
Get started with resources based on your selections.