I Big Data offrono alle aziende formidabili opportunità, tra cui insight sul comportamento dei clienti, previsioni più accurate sull'attività del mercato e una maggiore efficienza complessiva.
Persone e aziende generano sempre più dati ogni anno. Secondo un report IDC, nel 2010 nel mondo sono stati creati solo 1,2 zettabyte (1,2 trilioni di gigabyte) di nuovi dati. Entro il 2025, potrebbero aumentare a 175 zettabyte (175 trilioni di gigabyte) o più1.
Con le aziende che attingono sempre di più da questa risorsa in espansione mediante predictive analytics e data mining, crescerà anche il mercato dei Big Data. La ricerca di Statista prevede che il mercato dei Big Data raddoppierà tra il 2018 e il 2027 passando da un valore di 169 miliardi di dollari a 274 miliardi di dollari.
Ma quali sono le principali differenze tra Big Data e dati tradizionali? E quali implicazioni hanno sull'attuale tecnologia di data storage, elaborazione e analisi dei dati? Qui spiegheremo i diversi scopi a cui è destinato ogni tipo di dato, sottolineando l'importanza di una strategia che punti al successo sia con i Big Data che con i dati tradizionali.
I dati tradizionali sono dati strutturati e relazionali che le organizzazioni archiviano ed elaborano da decenni. I dati tradizionali rappresentano ancora la maggior parte dei dati mondiali.
Le aziende possono utilizzare i dati tradizionali per monitorare le vendite o gestire le relazioni con i clienti o i workflow. I dati tradizionali sono spesso più facili da manipolare e possono essere gestiti con un software di elaborazione dati convenzionale. Tuttavia, in genere forniscono informazioni meno sofisticate e offrono vantaggi più limitati rispetto ai Big Data.
Il termine Big Data può fare riferimento sia a un set di dati ampio e complesso, sia ai metodi utilizzati per elaborare questo tipo di dati. I Big Data hanno quattro caratteristiche principali, spesso note come "le quattro V":
Per distinguere tra Big Data e dati tradizionali vengono utilizzate diverse caratteristiche, tra cui:
I set di dati tradizionali tendono a essere misurati in gigabyte e terabyte. Di conseguenza, le loro dimensioni possono consentire di centralizzare lo storage, anche su un server.
I Big Data si distinguono non solo per le dimensioni ma anche per il volume. I Big Data vengono solitamente misurati in petabyte, zettabyte o exabyte. Le dimensioni sempre più grandi dei set di Big Data sono uno dei principali fattori alla base della richiesta di soluzioni di data storage più moderne, ad alta capacità e basate su cloud.
I dati tradizionali sono generalmente dati strutturati organizzati in record, file e tabelle. I campi nei set di dati tradizionali sono relazionali, quindi è possibile elaborare la loro relazione e manipolare i dati di conseguenza. I database tradizionali, come SQL, Oracle DB e MySQL, utilizzano uno schema fisso, che è statico e preconfigurato.
I Big Data utilizzano uno schema dinamico. Nello storage, i Big Data sono raw, ovvero non elaborati, e non strutturati. Quando si accede ai Big Data, lo schema dinamico viene applicato ai dati non elaborati. I moderni database non relazionali o NoSQL come Cassandra e MongoDB sono ideali per i dati non strutturati, dato il modo in cui archiviano i dati nei file.
I dati tradizionali vengono in genere gestiti utilizzando un'architettura centralizzata, che può essere più conveniente e sicura per i set di dati strutturati più piccoli.
In generale, un sistema centralizzato è costituito da uno o più nodi client (ad es. computer o dispositivi mobili) connessi a un nodo centrale (ad es. un server). Il server centrale controlla la rete e ne monitora la sicurezza.
A causa della loro scala e complessità, non è possibile gestire i Big Data in modo centralizzato, ma è richiesta un'architettura distribuita.
I sistemi distribuiti collegano più server o computer su una rete, operando come nodi coeguali. L'architettura ha una scalabilità orizzontale e continuerà a funzionare anche se un singolo nodo si guasta. I sistemi distribuiti possono sfruttare l'hardware commodity per ridurre i costi.
I dati tradizionali derivano in genere da software per la pianificazione delle risorse aziendali (Enterprise Resource Planning, ERP), software per la gestione delle relazioni con i clienti (Customer Relationship Management, CRM), da transazioni online e da altri dati a livello aziendale.
I Big Data derivano da una gamma più ampia di dati a livello aziendale e non, che possono includere informazioni estratte dai social media, dati di dispositivi e sensori e dati audiovisivi. Le fonti di questo tipo sono dinamiche, in evoluzione e in crescita ogni giorno.
Le fonti dei dati non strutturati possono includere anche testo, video, immagini e file audio. Per usufruire di questo tipo di dati, non è possibile utilizzare le colonne e le righe dei database tradizionali. Poiché una quantità sempre maggiore di dati non è strutturata e proviene da più fonti, sono necessari metodi di analisi dei Big Data per estrarre il massimo valore dai dati.
L'analisi dei dati tradizionale avviene in modo incrementale: si verifica un evento, i dati vengono generati e l'analisi di questi dati avviene dopo l'evento. L'analisi dei dati tradizionale può aiutare le aziende a comprendere l'impatto di determinate strategie o modifiche su una gamma limitata di metriche in un periodo specifico.
L'analisi dei Big Data può avvenire in tempo reale. Poiché i Big Data vengono generati secondo per secondo, l'analisi può verificarsi durante la raccolta dei dati. L'analisi dei Big Data offre alle aziende una comprensione più dinamica e olistica delle loro esigenze e strategie.
Ad esempio, supponiamo che un'azienda abbia investito in un programma di formazione per il proprio personale e desideri misurarne l'impatto.
Secondo un modello tradizionale di analisi dei dati, l'azienda potrebbe decidere di determinare l'impatto del programma di formazione su una particolare area delle proprie operations, ad esempio le vendite. L'azienda rileva il volume delle vendite prima e dopo il completamento del programma di formazione ed esclude qualsiasi fattore estraneo. Può, in teoria, vedere quanto le vendite sono aumentate a seguito della formazione.
In base a un modello di analisi dei Big Data, l'azienda può lasciare da parte le domande sull'impatto che il programma di formazione ha avuto su un particolare aspetto delle sue operations. Analizzando invece una massa di dati raccolti in tempo reale nell'intera azienda, può identificare le aree specifiche che hanno subito un impatto, come le vendite, il servizio clienti, le pubbliche relazioni e altro ancora.
I Big Data e i dati tradizionali hanno scopi diversi ma correlati. Anche se può sembrare che i Big Data offrano potenzialmente maggiori vantaggi, non sono adatti (o necessari) in tutte le situazioni. Big Data:
L'ascesa dei Big Data non significa che i dati tradizionali stiano scomparendo. Dati tradizionali:
In definitiva, non si tratta di scegliere tra Big Data e dati tradizionali. Poiché sempre più aziende generano set di dati di grandi dimensioni e non strutturati, avranno bisogno degli strumenti giusti. Comprendere come utilizzare e supportare entrambi i modelli è un aspetto necessario per l'aggiornamento della propria strategia per essere pronti a un futuro dominato dai Big Data.
1https://www.forbes.com/sites/gilpress/2020/01/06/6-predictions-about-data-in-2020-and-the-coming-decade/?sh=44e375c74fc3
Hai domande o commenti sui prodotti o sulle certificazioni di Pure? Siamo qui per aiutarti.
Prenota una demo per vedere come puoi trasformare i tuoi dati in risultati concreti con Pure.
Telefono: +39 02 9475 9422
Media: pr@purestorage.com
Pure Storage Italia
Spaces c/o Bastioni di Porta Nuova, 21
Milano, 20121