Quali sono i fattori alla base dello sviluppo dell'HPC?
L'uso della tecnologia HPC si รจ diffuso grazie a quattro fattori in particolare:
Potenza di elaborazione
In sostanza, un singolo processore non dispone di tutta la capacitร necessaria per elaborare volumi di dati enormi. Il modello HPC consente di produrre i risultati necessari utilizzando piรน unitร di elaborazione in parallelo. Ricorda che in questo modello:
- L'insieme di piรน computer connessi in rete prende il nome di cluster.
- Ogni singola unitร di elaborazione all'interno del cluster si chiama nodo.
- Ogni processore di un nodo dispone di diversi core.ย
Ad esempio, un cluster con 16 nodi da quattro core ciascuno รจ considerato molto piccolo, ma offre un totale di 64 core che lavorano in parallelo.
Oggi, nella maggior parte degli scenari di utilizzo dell'HPC vengono utilizzati migliaia di core che lavorano in parallelo per accelerare il completamento dei processi designati. I provider di servizi Infrastructure-as-a-Service (IaaS) offrono agli utenti la possibilitร di sfruttare un numero elevato di nodi quando necessario, per poi ridurre il workload al termine dell'operazione. Gli utenti pagano solamente la potenza di elaborazione richiesta, senza sostenere i costi di capitale (CapEx, capital expenditure) associati alla costruzione dell'infrastruttura. In genere, le soluzioni IaaS permettono agli utenti di definire il layout dei nodi per applicazioni specifiche, se necessario.
Sistema operativo
Il sistema operativo รจ l'interfaccia tra l'hardware e il software utilizzati in un sistema HPC. I sistemi operativi piรน diffusi negli ambienti HPC sono Linux e Windows. Per le operazioni HPC viene solitamente utilizzato Linux, mentre Windows viene utilizzato solo quando sono necessarie applicazioni specifiche di Windows.ย
Network
In un sistema HPC, la rete connette l'hardware di elaborazione, lo storage necessario e l'utente. L'hardware di elaborazione viene connesso tramite network in grado di gestire larghezze di banda elevatissime per la trasmissione dei dati. Questi network devono presentare anche una latenza ridotta, per accelerare il trasferimento dei dati. La trasmissione dei dati e la gestione dei cluster vengono affidate a cluster manager, servizi di gestione o scheduler.ย
Il cluster manager esegue il workload suddividendolo fra le risorse di elaborazione distribuite, come CPU, FPGA, GPU e unitร disco. Per consentire al cluster manager di gestirle, tutte queste risorse devono essere connesse alla stessa rete. Quando si utilizzano i servizi di un provider IaaS, quest'ultimo attiva automaticamente tutte le funzioni necessarie per la gestione dell'infrastruttura.
Storage
Infine, i dati elaborati da un sistema HPC devono essere memorizzati in un repository di grandi dimensioni. Poichรฉ i dati possono assumere varie forme (strutturati, semistrutturati e non strutturati), per memorizzarli possono essere necessari diversi tipi di database.
I dati non elaborati vengono memorizzati in un data lake. L'elaborazione di tali dati puรฒ essere problematica, perchรฉ non sono ancora stati assegnati a uno scopo.ย I dati ripuliti ed elaborati in funzione di uno scopo specifico vengono memorizzati in unย data warehouse.ย
Storage: l'anello mancante nell'HPC
In molti scenari di utilizzo dell'HPC, lo storage, che costituisce un componente cruciale dell'architettura, viene spesso trascurato. La tecnologia HPC viene utilizzata per elaborare enormi quantitร di dati in parallelo, ma le sue performance dipendono dalla capacitร di interazione di tutti i componenti dell'architettura.ย
In genere, le soluzioni di storage legacy tradizionali non consentono di rispondere alle esigenze dell'HPC, creando colli di bottiglia durante il processo e rischiando di pregiudicare le performance. Poichรฉ il data storage deve essere in grado di tenere il passo con la velocitร di elaborazione della configurazione, molte architetture HPC si avvalgono delloย storageย UFFO (Unified Fast File and Object).
Evergreen//Oneโข offre una soluzione di storage UFFO rapida e affidabile, con tutta la praticitร del modello pay-as-you-go (PaYG). Puรฒ essere utilizzato negli ambienti on-premise e hybrid cloud ed รจ perfetto per i sistemi HPC, che richiedono scalabilitร per le operazioni senza compromettere le performance.
Acquista Evergreen//One oggi stesso. Per i nuovi clientiย i primi tre mesi di servizio sono gratuiti.