What Is Traditional Data?

Traditional data is structured, relational data organizations have been storing and processing for decades. Traditional data still accounts for the majority of the world’s data. Businesses can use traditional data for tracking sales or managing customer relations or workflows. Traditional data is often easier to manipulate and can be managed with conventional data processing software. However, it generally provides less sophisticated insights and more limited benefits than big data.

Big data can refer to both a large and complex data set, as well as the methods used to process this type of data. Big data has four main characteristics, often known as “the four Vs”: Volume: Big data is...big. While big data isn’t only distinguishable by its size, it’s also typically very high volume in nature. Variety: A big data set typically contains structured, semi-structured, and unstructured data. Velocity: Big data generates quickly and is often processed in real time. Veracity: Big data isn’t inherently better quality than traditional data, but its veracity (accuracy) is extremely important. Anomalies, biases, and noise can significantly impact the quality of big data.

The Differences between Big Data and Traditional Data

Several characteristics are used to distinguish between big data and traditional data. These include: The size of the data How the data is organized The architecture required to manage the data The sources from which the data derives The methods used to analyze the data Size Traditional data sets tend to be measured in gigabytes and terabytes. As a result, their size can allow for centralized storage, even on one server. Big data is distinguished not only by its size but also by its volume. Big data is usually measured in petabytes, zettabytes, or exabytes. The increasingly large size of big data sets is one of the main drivers behind the demand for more modern, high-capacity, cloud-based data storage solutions. Organization Traditional data is normally structured data that’s organized in records, files, and tables. Fields in traditional data sets are relational, so it’s possible to work out their relationship and manipulate the data accordingly. Traditional databases, such as SQL, Oracle DB, and MySQL, use a fixed schema that is static and preconfigured. Big data uses a dynamic schema. In storage, big data is raw and unstructured. When big data is accessed, the dynamic schema is applied to the raw data. Modern non-relational or NoSQL databases like Cassandra and MongoDB are ideal for unstructured data, given the way they store data in files. Architecture Traditional data is typically managed using a centralized architecture, which can be more cost-effective and secure for smaller, structured data sets. In general, a centralized system consists of one or more client nodes (e.g., computers or mobile devices) connected to a central node (e.g., a server). The central server controls the network and monitors its security. Because of its scale and complexity, it isn’t possible to manage big data centrally. It requires a distributed architecture. Distributed systems link multiple servers or computers over a network, operating as co-equal nodes. The architecture can scale horizontally (scale “out”) and will continue functioning even if an individual node fails. Distributed systems can leverage commodity hardware to reduce costs. Sources Traditional data typically derives from enterprise resource planning (ERP), customer relationship management (CRM), online transactions, and other enterprise-level data. Big data derives from a broader range of enterprise and non-enterprise-level data, which can include information scraped from social media, device and sensor data, and audiovisual data. These source types are dynamic, evolving, and growing every day. Unstructured data sources can also include text, video, image, and audio files. Leveraging this type of data isn’t possible using the columns and rows of traditional databases. Because an increasingly significant amount of data is unstructured and comes from multiple sources, big data analysis methods are required to extract value from it. Analysis Traditional data analysis occurs incrementally: An event occurs, data is generated, and the analysis of this data takes place after the event. Traditional data analysis can help businesses understand the impacts of given strategies or changes on a limited range of metrics over a specific period. Big data analysis can occur in real time. Because big data generates on a second-by-second basis, analysis can occur as data is being collected. Big data analysis offers businesses a more dynamic and holistic understanding of their needs and strategies. For example, suppose a business has invested in a training program for its staff and wants to measure its impact. Under a traditional model of data analysis, the business might set out to determine the impact of the training program on a particular area of its operations, such as sales. The business notes the sales volume before and after the training and excludes any extraneous factors. It can, in theory, see how much sales have increased as a result of the training. Under a big data model of analysis, the business can set aside questions regarding how the training program has impacted any particular aspect of its operations. Instead, by analyzing a mass of data collected in real time across the whole business, it can identify the specific areas that have been impacted, such as sales, customer service, public relations, and more.

Knowledge base di Pure
Guide to Big Data
Big Data e dati tradizionali a confronto

Guida ai Big Data starter pack

Big Data e dati tradizionali a confronto

I Big Data offrono alle aziende formidabili opportunità, tra cui insight sul comportamento dei clienti, previsioni più accurate sull'attività del mercato e una maggiore efficienza complessiva.

Persone e aziende generano sempre più dati ogni anno. Secondo un report IDC, nel 2010 nel mondo sono stati creati solo 1,2 zettabyte (1,2 trilioni di gigabyte) di nuovi dati. Entro il 2025, potrebbero aumentare a 175 zettabyte (175 trilioni di gigabyte) o più¹.

Con le aziende che attingono sempre di più da questa risorsa in espansione mediante predictive analytics e data mining, crescerà anche il mercato dei Big Data. La ricerca di Statista prevede che il mercato dei Big Data raddoppierà tra il 2018 e il 2027 passando da un valore di 169 miliardi di dollari a 274 miliardi di dollari.

Ma quali sono le principali differenze tra Big Data e dati tradizionali? E quali implicazioni hanno sull'attuale tecnologia di data storage, elaborazione e analisi dei dati? Qui spiegheremo i diversi scopi a cui è destinato ogni tipo di dato, sottolineando l'importanza di una strategia che punti al successo sia con i Big Data che con i dati tradizionali.

Che cosa sono i dati tradizionali?

I dati tradizionali sono dati strutturati e relazionali che le organizzazioni archiviano ed elaborano da decenni. I dati tradizionali rappresentano ancora la maggior parte dei dati mondiali.

Le aziende possono utilizzare i dati tradizionali per monitorare le vendite o gestire le relazioni con i clienti o i workflow. I dati tradizionali sono spesso più facili da manipolare e possono essere gestiti con un software di elaborazione dati convenzionale. Tuttavia, in genere forniscono informazioni meno sofisticate e offrono vantaggi più limitati rispetto ai Big Data.

Che cosa sono i Big Data?

Il termine Big Data può fare riferimento sia a un set di dati ampio e complesso, sia ai metodi utilizzati per elaborare questo tipo di dati. I Big Data hanno quattro caratteristiche principali, spesso note come "le quattro V":

Volume: i Big Data sono..."big". Sebbene i Big Data non si distinguano solo per le loro dimensioni, hanno tipicamente volumi molto elevati.
Varietà: un set di Big Data in genere contiene dati strutturati, semistrutturati e non strutturati.
Velocità: i Big Data vengono generati rapidamente e spesso vengono elaborati in tempo reale.
Veridicità: i Big Data non sono intrinsecamente di qualità migliore rispetto ai dati tradizionali, ma la loro veridicità (accuratezza) è estremamente importante. Anomalie, distorsioni e rumore possono avere un impatto significativo sulla qualità dei Big Data.

Differenze tra Big Data e dati tradizionali

Per distinguere tra Big Data e dati tradizionali vengono utilizzate diverse caratteristiche, tra cui:

le dimensioni dei dati
le modalità in cui i dati sono organizzati
l'architettura necessaria per gestire i dati
le fonti da cui derivano i dati
i metodi utilizzati per analizzare i dati

Dimensioni

I set di dati tradizionali tendono a essere misurati in gigabyte e terabyte. Di conseguenza, le loro dimensioni possono consentire di centralizzare lo storage, anche su un server.

I Big Data si distinguono non solo per le dimensioni ma anche per il volume. I Big Data vengono solitamente misurati in petabyte, zettabyte o exabyte. Le dimensioni sempre più grandi dei set di Big Data sono uno dei principali fattori alla base della richiesta di soluzioni di data storage più moderne, ad alta capacità e basate su cloud.

Organizzazione

I dati tradizionali sono generalmente dati strutturati organizzati in record, file e tabelle. I campi nei set di dati tradizionali sono relazionali, quindi è possibile elaborare la loro relazione e manipolare i dati di conseguenza. I database tradizionali, come SQL, Oracle DB e MySQL, utilizzano uno schema fisso, che è statico e preconfigurato.

I Big Data utilizzano uno schema dinamico. Nello storage, i Big Data sono raw, ovvero non elaborati, e non strutturati. Quando si accede ai Big Data, lo schema dinamico viene applicato ai dati non elaborati. I moderni database non relazionali o NoSQL come Cassandra e MongoDB sono ideali per i dati non strutturati, dato il modo in cui archiviano i dati nei file.

Architettura

I dati tradizionali vengono in genere gestiti utilizzando un'architettura centralizzata, che può essere più conveniente e sicura per i set di dati strutturati più piccoli.

In generale, un sistema centralizzato è costituito da uno o più nodi client (ad es. computer o dispositivi mobili) connessi a un nodo centrale (ad es. un server). Il server centrale controlla la rete e ne monitora la sicurezza.

A causa della loro scala e complessità, non è possibile gestire i Big Data in modo centralizzato, ma è richiesta un'architettura distribuita.

I sistemi distribuiti collegano più server o computer su una rete, operando come nodi coeguali. L'architettura ha una scalabilità orizzontale e continuerà a funzionare anche se un singolo nodo si guasta. I sistemi distribuiti possono sfruttare l'hardware commodity per ridurre i costi.

Fonti

I dati tradizionali derivano in genere da software per la pianificazione delle risorse aziendali (Enterprise Resource Planning, ERP), software per la gestione delle relazioni con i clienti (Customer Relationship Management, CRM), da transazioni online e da altri dati a livello aziendale.

I Big Data derivano da una gamma più ampia di dati a livello aziendale e non, che possono includere informazioni estratte dai social media, dati di dispositivi e sensori e dati audiovisivi. Le fonti di questo tipo sono dinamiche, in evoluzione e in crescita ogni giorno.

Le fonti dei dati non strutturati possono includere anche testo, video, immagini e file audio. Per usufruire di questo tipo di dati, non è possibile utilizzare le colonne e le righe dei database tradizionali. Poiché una quantità sempre maggiore di dati non è strutturata e proviene da più fonti, sono necessari metodi di analisi dei Big Data per estrarre il massimo valore dai dati.

Analisi

L'analisi dei dati tradizionale avviene in modo incrementale: si verifica un evento, i dati vengono generati e l'analisi di questi dati avviene dopo l'evento. L'analisi dei dati tradizionale può aiutare le aziende a comprendere l'impatto di determinate strategie o modifiche su una gamma limitata di metriche in un periodo specifico.

L'analisi dei Big Data può avvenire in tempo reale. Poiché i Big Data vengono generati secondo per secondo, l'analisi può verificarsi durante la raccolta dei dati. L'analisi dei Big Data offre alle aziende una comprensione più dinamica e olistica delle loro esigenze e strategie.

Ad esempio, supponiamo che un'azienda abbia investito in un programma di formazione per il proprio personale e desideri misurarne l'impatto.

Secondo un modello tradizionale di analisi dei dati, l'azienda potrebbe decidere di determinare l'impatto del programma di formazione su una particolare area delle proprie operations, ad esempio le vendite. L'azienda rileva il volume delle vendite prima e dopo il completamento del programma di formazione ed esclude qualsiasi fattore estraneo. Può, in teoria, vedere quanto le vendite sono aumentate a seguito della formazione.

In base a un modello di analisi dei Big Data, l'azienda può lasciare da parte le domande sull'impatto che il programma di formazione ha avuto su un particolare aspetto delle sue operations. Analizzando invece una massa di dati raccolti in tempo reale nell'intera azienda, può identificare le aree specifiche che hanno subito un impatto, come le vendite, il servizio clienti, le pubbliche relazioni e altro ancora.

Big Data e dati tradizionali a confronto: Considerazioni importanti per il futuro

I Big Data e i dati tradizionali hanno scopi diversi ma correlati. Anche se può sembrare che i Big Data offrano potenzialmente maggiori vantaggi, non sono adatti (o necessari) in tutte le situazioni. Big Data:

Possono fornire un'analisi più approfondita delle tendenze del mercato e del comportamento dei consumatori. L'analisi dei dati tradizionali può essere più ristretta e troppo limitata per fornire gli insight strategici che i Big Data possono offrire.
Offrono insight più rapidamente. Le organizzazioni possono imparare dai Big Data in tempo reale e questo, nel contesto dell'analisi dei Big Data, può fornire un vantaggio competitivo.
Sono più efficienti. La presenza sempre più diffusa di strumenti digitali nella nostra società comporta una generazione di enormi quantità di dati ogni giorno e persino ogni minuto. I Big Data ci consentono di sfruttare questi dati e interpretarli in modo significativo.
Richiedono una preparazione avanzata. Per sfruttare questi vantaggi, le organizzazioni devono prepararsi per i Big Data attraverso nuovi protocolli di sicurezza, passaggi di configurazione e un aumento della potenza di elaborazione disponibile.

L'ascesa dei Big Data non significa che i dati tradizionali stiano scomparendo. Dati tradizionali:

Possono essere più facili da proteggere, pertanto, nel caso di set di dati altamente sensibili, personali o riservati, potrebbero essere la scelta preferita. Poiché i dati tradizionali hanno dimensioni più piccole, non richiedono un'architettura distribuita ed è meno probabile che richiedano storage di terze parti.
Possono essere elaborati utilizzando un software di elaborazione dati convenzionale e una normale configurazione di sistema. L'elaborazione dei Big Data generalmente richiede un livello di configurazione più elevato, e ciò potrebbe causare un inutile aumento dei costi e dell'utilizzo di risorse nei casi in cui i metodi di elaborazione dei dati tradizionali potrebbero essere sufficienti.
Sono più facili da manipolare e interpretare. Poiché i dati tradizionali sono per natura più semplici e relazionali, possono essere elaborati utilizzando le normali funzioni e possono anche essere accessibili ai non esperti.

In definitiva, non si tratta di scegliere tra Big Data e dati tradizionali. Poiché sempre più aziende generano set di dati di grandi dimensioni e non strutturati, avranno bisogno degli strumenti giusti. Comprendere come utilizzare e supportare entrambi i modelli è un aspetto necessario per l'aggiornamento della propria strategia per essere pronti a un futuro dominato dai Big Data.

Capitoli aggiuntivi della Guida sui Big Data

Soluzione

Data analytics

Soluzione

Analytics delle IT operations

Soluzione

Data warehouse

Prodotto

File e object storage di FlashBlade

Prodotto

Infrastruttura AI AIRI

¹https://www.forbes.com/sites/gilpress/2020/01/06/6-predictions-about-data-in-2020-and-the-coming-decade/?sh=44e375c74fc3

Esplora risorse e eventi principali

VIDEO

Guarda: Il valore di un Enterprise Data Cloud (EDC).

Charlie Giancarlo spiega perché il futuro è nella gestione dei dati, non dello storage. Scopri in che modo un approccio unificato trasforma le operazioni IT aziendali.

Guarda

RISORSA

Lo storage legacy non può alimentare il futuro.

I workload moderni richiedono velocità, sicurezza e scalabilità AI-ready. Il tuo stack è pronto?

Effettua la valutazione

DEMO DI PURE360

Esplora, scopri e prova Pure Storage.

Accedi a video e demo on demand per scoprire i vantaggi che Pure Storage ti offre.

Guarda le demo

THOUGHT LEADERSHIP

La corsa per l'innovazione

Le più recenti informazioni approfondite e opinioni di leader di settore che sono all'avanguardia nell'innovazione dello storage.

Maggiori informazioni

Il browser che stai usando non è più supportato.

I browser non aggiornati spesso comportano rischi per la sicurezza. Per offrirti la migliore esperienza possibile sul nostro sito, ti invitiamo ad aggiornare il browser alla versione più recente.