Guida ai Big Data starter pack

Big Data e dati tradizionali a confronto

I Big Data offrono alle aziende formidabili opportunità, tra cui insight sul comportamento dei clienti, previsioni più accurate sull'attività del mercato e una maggiore efficienza complessiva.

Persone e aziende generano sempre più dati ogni anno. Secondo un report IDC, nel 2010 nel mondo sono stati creati solo 1,2 zettabyte (1,2 trilioni di gigabyte) di nuovi dati. Entro il 2025, potrebbero aumentare a 175 zettabyte (175 trilioni di gigabyte) o più1.

Con le aziende che attingono sempre di più da questa risorsa in espansione mediante predictive analytics e data mining, crescerà anche il mercato dei Big Data. La ricerca di Statista prevede che il mercato dei Big Data raddoppierà tra il 2018 e il 2027 passando da un valore di 169 miliardi di dollari a 274 miliardi di dollari.

Ma quali sono le principali differenze tra Big Data e dati tradizionali? E quali implicazioni hanno sull'attuale tecnologia di data storage, elaborazione e analisi dei dati? Qui spiegheremo i diversi scopi a cui è destinato ogni tipo di dato, sottolineando l'importanza di una strategia che punti al successo sia con i Big Data che con i dati tradizionali.

 

Che cosa sono i dati tradizionali?

I dati tradizionali sono dati strutturati e relazionali che le organizzazioni archiviano ed elaborano da decenni. I dati tradizionali rappresentano ancora la maggior parte dei dati mondiali.

Le aziende possono utilizzare i dati tradizionali per monitorare le vendite o gestire le relazioni con i clienti o i workflow. I dati tradizionali sono spesso più facili da manipolare e possono essere gestiti con un software di elaborazione dati convenzionale. Tuttavia, in genere forniscono informazioni meno sofisticate e offrono vantaggi più limitati rispetto ai Big Data.

 

Che cosa sono i Big Data?

Il termine Big Data può fare riferimento sia a un set di dati ampio e complesso, sia ai metodi utilizzati per elaborare questo tipo di dati. I Big Data hanno quattro caratteristiche principali, spesso note come "le quattro V":

  • Volume: i Big Data sono..."big". Sebbene i Big Data non si distinguano solo per le loro dimensioni, hanno tipicamente volumi molto elevati.
  • Varietà: un set di Big Data in genere contiene dati strutturati, semistrutturati e non strutturati.
  • Velocità: i Big Data vengono generati rapidamente e spesso vengono elaborati in tempo reale.
  • Veridicità: i Big Data non sono intrinsecamente di qualità migliore rispetto ai dati tradizionali, ma la loro veridicità (accuratezza) è estremamente importante. Anomalie, distorsioni e rumore possono avere un impatto significativo sulla qualità dei Big Data.

 

Differenze tra Big Data e dati tradizionali

Per distinguere tra Big Data e dati tradizionali vengono utilizzate diverse caratteristiche, tra cui:

  • le dimensioni dei dati
  • le modalità in cui i dati sono organizzati
  • l'architettura necessaria per gestire i dati
  • le fonti da cui derivano i dati
  • i metodi utilizzati per analizzare i dati

Dimensioni

I set di dati tradizionali tendono a essere misurati in gigabyte e terabyte. Di conseguenza, le loro dimensioni possono consentire di centralizzare lo storage, anche su un server.

I Big Data si distinguono non solo per le dimensioni ma anche per il volume. I Big Data vengono solitamente misurati in petabyte, zettabyte o exabyte. Le dimensioni sempre più grandi dei set di Big Data sono uno dei principali fattori alla base della richiesta di soluzioni di data storage più moderne, ad alta capacità e basate su cloud.

Organizzazione

I dati tradizionali sono generalmente dati strutturati organizzati in record, file e tabelle. I campi nei set di dati tradizionali sono relazionali, quindi è possibile elaborare la loro relazione e manipolare i dati di conseguenza. I database tradizionali, come SQL, Oracle DB e MySQL, utilizzano uno schema fisso, che è statico e preconfigurato.

I Big Data utilizzano uno schema dinamico. Nello storage, i Big Data sono raw, ovvero non elaborati, e non strutturati. Quando si accede ai Big Data, lo schema dinamico viene applicato ai dati non elaborati. I moderni database non relazionali o NoSQL come Cassandra e MongoDB sono ideali per i dati non strutturati, dato il modo in cui archiviano i dati nei file.

Architettura

I dati tradizionali vengono in genere gestiti utilizzando un'architettura centralizzata, che può essere più conveniente e sicura per i set di dati strutturati più piccoli.

In generale, un sistema centralizzato è costituito da uno o più nodi client (ad es. computer o dispositivi mobili) connessi a un nodo centrale (ad es. un server). Il server centrale controlla la rete e ne monitora la sicurezza.

A causa della loro scala e complessità, non è possibile gestire i Big Data in modo centralizzato, ma è richiesta un'architettura distribuita.

I sistemi distribuiti collegano più server o computer su una rete, operando come nodi coeguali. L'architettura ha una scalabilità orizzontale e continuerà a funzionare anche se un singolo nodo si guasta. I sistemi distribuiti possono sfruttare l'hardware commodity per ridurre i costi.

Fonti

I dati tradizionali derivano in genere da software per la pianificazione delle risorse aziendali (Enterprise Resource Planning, ERP), software per la gestione delle relazioni con i clienti (Customer Relationship Management, CRM), da transazioni online e da altri dati a livello aziendale.

I Big Data derivano da una gamma più ampia di dati a livello aziendale e non, che possono includere informazioni estratte dai social media, dati di dispositivi e sensori e dati audiovisivi. Le fonti di questo tipo sono dinamiche, in evoluzione e in crescita ogni giorno.

Le fonti dei dati non strutturati possono includere anche testo, video, immagini e file audio. Per usufruire di questo tipo di dati, non è possibile utilizzare le colonne e le righe dei database tradizionali. Poiché una quantità sempre maggiore di dati non è strutturata e proviene da più fonti, sono necessari metodi di analisi dei Big Data per estrarre il massimo valore dai dati.

Analisi

L'analisi dei dati tradizionale avviene in modo incrementale: si verifica un evento, i dati vengono generati e l'analisi di questi dati avviene dopo l'evento. L'analisi dei dati tradizionale può aiutare le aziende a comprendere l'impatto di determinate strategie o modifiche su una gamma limitata di metriche in un periodo specifico.

L'analisi dei Big Data può avvenire in tempo reale. Poiché i Big Data vengono generati secondo per secondo, l'analisi può verificarsi durante la raccolta dei dati. L'analisi dei Big Data offre alle aziende una comprensione più dinamica e olistica delle loro esigenze e strategie.

Ad esempio, supponiamo che un'azienda abbia investito in un programma di formazione per il proprio personale e desideri misurarne l'impatto.

Secondo un modello tradizionale di analisi dei dati, l'azienda potrebbe decidere di determinare l'impatto del programma di formazione su una particolare area delle proprie operations, ad esempio le vendite. L'azienda rileva il volume delle vendite prima e dopo il completamento del programma di formazione ed esclude qualsiasi fattore estraneo. Può, in teoria, vedere quanto le vendite sono aumentate a seguito della formazione.

In base a un modello di analisi dei Big Data, l'azienda può lasciare da parte le domande sull'impatto che il programma di formazione ha avuto su un particolare aspetto delle sue operations. Analizzando invece una massa di dati raccolti in tempo reale nell'intera azienda, può identificare le aree specifiche che hanno subito un impatto, come le vendite, il servizio clienti, le pubbliche relazioni e altro ancora.

 

Big Data e dati tradizionali a confronto: Considerazioni importanti per il futuro

I Big Data e i dati tradizionali hanno scopi diversi ma correlati. Anche se può sembrare che i Big Data offrano potenzialmente maggiori vantaggi, non sono adatti (o necessari) in tutte le situazioni. Big Data:

  • Possono fornire un'analisi più approfondita delle tendenze del mercato e del comportamento dei consumatori. L'analisi dei dati tradizionali può essere più ristretta e troppo limitata per fornire gli insight strategici che i Big Data possono offrire.
  • Offrono insight più rapidamente. Le organizzazioni possono imparare dai Big Data in tempo reale e questo, nel contesto dell'analisi dei Big Data, può fornire un vantaggio competitivo.
  • Sono più efficienti. La presenza sempre più diffusa di strumenti digitali nella nostra società comporta una generazione di enormi quantità di dati ogni giorno e persino ogni minuto. I Big Data ci consentono di sfruttare questi dati e interpretarli in modo significativo.
  • Richiedono una preparazione avanzata. Per sfruttare questi vantaggi, le organizzazioni devono prepararsi per i Big Data attraverso nuovi protocolli di sicurezza, passaggi di configurazione e un aumento della potenza di elaborazione disponibile.

L'ascesa dei Big Data non significa che i dati tradizionali stiano scomparendo. Dati tradizionali:

  • Possono essere più facili da proteggere, pertanto, nel caso di set di dati altamente sensibili, personali o riservati, potrebbero essere la scelta preferita. Poiché i dati tradizionali hanno dimensioni più piccole, non richiedono un'architettura distribuita ed è meno probabile che richiedano storage di terze parti.
  • Possono essere elaborati utilizzando un software di elaborazione dati convenzionale e una normale configurazione di sistema. L'elaborazione dei Big Data generalmente richiede un livello di configurazione più elevato, e ciò potrebbe causare un inutile aumento dei costi e dell'utilizzo di risorse nei casi in cui i metodi di elaborazione dei dati tradizionali potrebbero essere sufficienti.
  • Sono più facili da manipolare e interpretare. Poiché i dati tradizionali sono per natura più semplici e relazionali, possono essere elaborati utilizzando le normali funzioni e possono anche essere accessibili ai non esperti.

In definitiva, non si tratta di scegliere tra Big Data e dati tradizionali. Poiché sempre più aziende generano set di dati di grandi dimensioni e non strutturati, avranno bisogno degli strumenti giusti. Comprendere come utilizzare e supportare entrambi i modelli è un aspetto necessario per l'aggiornamento della propria strategia per essere pronti a un futuro dominato dai Big Data.

 

Capitoli aggiuntivi della Guida sui Big Data

  1. Dati strutturati e dati non strutturati a confronto
  2. 5 modi in cui i Big Data aiutano le aziende nella trasformazione digitale
  3. La relazione tra Big Data e IoT

1https://www.forbes.com/sites/gilpress/2020/01/06/6-predictions-about-data-in-2020-and-the-coming-decade/?sh=44e375c74fc3

800-379-7873 +44 20 3870 2633 +43 720882474 +32 (0) 7 84 80 560 +33 9 75 18 86 78 +49 89 12089 253 +353 1 485 4307 +39 02 9475 9422 +31 (0) 20 201 49 65 +46-101 38 93 22 +45 2856 6610 +47 2195 4481 +351 210 006 108 +966112118066 +27 87551 7857 +34 51 889 8963 +41 31 52 80 624 +90 850 390 21 64 +971 4 5513176 +7 916 716 7308 +65 3158 0960 +603 2298 7123 +66 (0) 2624 0641 +84 43267 3630 +62 21235 84628 +852 3750 7835 +82 2 6001-3330 +886 2 8729 2111 +61 1800 983 289 +64 21 536 736 +55 11 2655-7370 +52 55 9171-1375 +56 2 2368-4581 +57 1 383-2387