What Is Traditional Data?

Traditional data is structured, relational data organizations have been storing and processing for decades. Traditional data still accounts for the majority of the world’s data. Businesses can use traditional data for tracking sales or managing customer relations or workflows. Traditional data is often easier to manipulate and can be managed with conventional data processing software. However, it generally provides less sophisticated insights and more limited benefits than big data.

Big data can refer to both a large and complex data set, as well as the methods used to process this type of data. Big data has four main characteristics, often known as “the four Vs”: Volume: Big data is...big. While big data isn’t only distinguishable by its size, it’s also typically very high volume in nature. Variety: A big data set typically contains structured, semi-structured, and unstructured data. Velocity: Big data generates quickly and is often processed in real time. Veracity: Big data isn’t inherently better quality than traditional data, but its veracity (accuracy) is extremely important. Anomalies, biases, and noise can significantly impact the quality of big data.

The Differences between Big Data and Traditional Data

Several characteristics are used to distinguish between big data and traditional data. These include: The size of the data How the data is organized The architecture required to manage the data The sources from which the data derives The methods used to analyze the data Size Traditional data sets tend to be measured in gigabytes and terabytes. As a result, their size can allow for centralized storage, even on one server. Big data is distinguished not only by its size but also by its volume. Big data is usually measured in petabytes, zettabytes, or exabytes. The increasingly large size of big data sets is one of the main drivers behind the demand for more modern, high-capacity, cloud-based data storage solutions. Organization Traditional data is normally structured data that’s organized in records, files, and tables. Fields in traditional data sets are relational, so it’s possible to work out their relationship and manipulate the data accordingly. Traditional databases, such as SQL, Oracle DB, and MySQL, use a fixed schema that is static and preconfigured. Big data uses a dynamic schema. In storage, big data is raw and unstructured. When big data is accessed, the dynamic schema is applied to the raw data. Modern non-relational or NoSQL databases like Cassandra and MongoDB are ideal for unstructured data, given the way they store data in files. Architecture Traditional data is typically managed using a centralized architecture, which can be more cost-effective and secure for smaller, structured data sets. In general, a centralized system consists of one or more client nodes (e.g., computers or mobile devices) connected to a central node (e.g., a server). The central server controls the network and monitors its security. Because of its scale and complexity, it isn’t possible to manage big data centrally. It requires a distributed architecture. Distributed systems link multiple servers or computers over a network, operating as co-equal nodes. The architecture can scale horizontally (scale “out”) and will continue functioning even if an individual node fails. Distributed systems can leverage commodity hardware to reduce costs. Sources Traditional data typically derives from enterprise resource planning (ERP), customer relationship management (CRM), online transactions, and other enterprise-level data. Big data derives from a broader range of enterprise and non-enterprise-level data, which can include information scraped from social media, device and sensor data, and audiovisual data. These source types are dynamic, evolving, and growing every day. Unstructured data sources can also include text, video, image, and audio files. Leveraging this type of data isn’t possible using the columns and rows of traditional databases. Because an increasingly significant amount of data is unstructured and comes from multiple sources, big data analysis methods are required to extract value from it. Analysis Traditional data analysis occurs incrementally: An event occurs, data is generated, and the analysis of this data takes place after the event. Traditional data analysis can help businesses understand the impacts of given strategies or changes on a limited range of metrics over a specific period. Big data analysis can occur in real time. Because big data generates on a second-by-second basis, analysis can occur as data is being collected. Big data analysis offers businesses a more dynamic and holistic understanding of their needs and strategies. For example, suppose a business has invested in a training program for its staff and wants to measure its impact. Under a traditional model of data analysis, the business might set out to determine the impact of the training program on a particular area of its operations, such as sales. The business notes the sales volume before and after the training and excludes any extraneous factors. It can, in theory, see how much sales have increased as a result of the training. Under a big data model of analysis, the business can set aside questions regarding how the training program has impacted any particular aspect of its operations. Instead, by analyzing a mass of data collected in real time across the whole business, it can identify the specific areas that have been impacted, such as sales, customer service, public relations, and more.

Pure Knowledge
Guide to Big Data
Big Data tov traditionele data

De Beginnersgids voor Big Data

Big Data tov traditionele data

Big data verschaft ongekende mogelijkheden aan bedrijven, inclusief belangrijke inzichten in klantgedrag, accuratere voorspellingen over marktactiviteit en verbeterde algehele efficiëntie.

Mensen en bedrijven creëren steeds meer data elk jaar. Volgens een IDC-rapport werd er in 2010 slechts 1,2 zettabytes (1,2 triljoen gigabytes) aan nieuwe data gecreëerd. In 2025 zal dat kunnen stijgen tot 175 zettabytes (175 triljoen gigabytes) of zelfs meer.¹.

Zodra bedrijven in deze bloeiende bron van voorspellende analytics gaan stappen, zal de markt voor big data ook verder groeien. Statista-onderzoek voorspelt dat de markt voor big data zal verdubbelen tussen 2018 en 2027 met een waarde tussen de $ 169 miljard en $274 miljard.

Maar wat zijn de belangrijkste verschillen tussen big data en traditionele data? En welke impact hebben zij op de huidige dataopslag, verwerking en analyticstechnologie? Hier zullen we de verschillende doelen van elk datatype bespreken, evenals het belang van een strategie benadrukken waarmee succes met zowel big data als traditionele data gewaarborgd wordt.

Wat is traditionele data?

Traditionele data is structured en relationele data die organisaties al tientallen jaren hebben opgeslagen en verwerkt. Traditionele data vertegenwoordigt nog steeds het allergrootste deel van de data op aarde.

Bedrijven kunnen traditionele data gebruiken om verkopen te volgen, customer relations en workflows te beheren. Traditionele data is vaak makkelijker te bewerken en kan worden beheerd met conventionele dataverwerkingssoftware. Het levert alleen doorgaans minder geavanceerde inzichten en minder voordelen op dan big data.

Wat is Big Data?

Big data kan verwijzen naar zowel een grote en complexe datase als we de manieren om dit type data te verwerken. Big data heeft vier belangrijke karakteristieken, beter bekend als de Vier V’s.

Volume: Big data is… groot. Alhoewel big data niet alleen herkenbaar is aan de grootte, is het doorgaans zeer groot van omvang.
Variety: Een big data set bevat structured, semis-structured en unstructured data.
Velocity: Big data ontstaat snel en wordt vaak verwerkt in realtime.
Veracity: Big data is niet perse kwalitatief beter dan traditionele data, maar de veracity (accuratesse) is zeer belangrijk. Afwijkingen, vooroordelen en ruis kan de kwaliteit van big data significant beïnvloeden.

De belangrijkste verschillen tussen big data en traditionele data

Een aantal karakteristieken kan worden gebruikt om de verschillen tussen big data en traditionele data aan te geven. Deze bevatten:

De grootte van de data
Hoe de data georganiseerd is
De architectuur benodigd om de data te beheren
De bronnen waar de data vandaan komt
De gebruikte methoden om de data te analyseren

Grootte

Traditionele data wordt vaak gemeten in gigabytes en terabytes. Daardoor kan het centraal worden opgeslagen, vaak op één server, door de grootte.

Big data wordt niet alleen door de grootte gekenmerkt, maar ook door het volume. Big data wordt doorgaans gemeten in petabytes, zettabytes en exabytes. De toenemende grootte van big data sets is een van de belangrijkste drijfveren voor de vraag naar meer moderne, hoogecapaciteits, cloud-based dataopslagoplossingen.

Organisatie

Traditionele data is reguliere data die is opgeslagen in records, bestanden en tabellen. Velden in traditionele datasets zijn relationeel, zodat het mogelijk is hun relatie te bepalen en zo de data te bewerken. Traditionele databases, zoals SQL, Oracle DB en MySQL gebruiken een vast schema dat statisch en pregeconfigureerd is.

Big data gebruikt een dynamisch schema. Voor opslag geldt dat big data ruw en ongestructureerd (unstructured) is. Wanneer big data wordt benaderd, wordt het dynamische schema toegepast op de raw data. Miderde non-relational of NoSQL databases zoals Cassandra of MongoDB zijn ideaal voor unstructured data, gezien de manier waarop ze data opslaan in bestanden.

Architectuur

Traditionele data wordt doorgaans beheerd in een gecentraliseerde architectuur die kostenefficiënter en veiliger kan zijn voor kleinere, gestructureede datasets.

In het algemeen bestaan een gecentraliseerd systeem uit een of meerdere vlient nodes (zoals computers of mobiele apparaten), verbonden met een centrale node (zoals een server). De centrale server controleert het netwerk en bewaakt de veiligheid.

Vanwege de schaal en de complexiteit is het niet mogelijk om big data vanaf een centrale plek te beheren. Het vereist een distributed architectuur.

Distributed systems koppelen meerdere servers op computers over een netwerk, door als co-equal nodes te fungeren. De architectuur kan horizontaal schalen (scale out) en blijft functioneren, zelfs als een node uitvalt. Distributed systems kunnen de last op commodity hardware delen om kosten te besparen.

Bronnen

Traditionele data komt normaliter uit Enterprise Resource Planning (ERP), Customer Relationship Management (CRM), online transacties en andere enterprise-level data.

Big data komt van een bredere range van enterprise- en niet-enterprise data, dat ook data uit bijvoorbeeld social media, apparaat- en sensordata en audiovisuele data kan bevatten. Deze bronnen zijn dynamisch en groeien en evolueren elke dag.

Unstructured databronnen kunnen ook tekst, video, afbeeldingen en audiobestanden bevatten. Dergelijke datatypes kunnen niet worden gestructureerd met de kolommen en rijen uit traditionele databases. Omdat een steeds groter wordende hoeveelheid data unstructurered is en vanuit verschillende bronnen komt, zijn big data analysemethoden nodig om waardevolle informatie uit te halen.

Analyse

Traditionele data-analyse gebeurt incrementeel: Een gebeurtenis vindt plaats, data wordt gegenereerd en de analyse van de data vindt plaats na de gebeurtenis. Traditionele data-analyse kan bedrijven helpen om de impact van bepaalde strategieën of veranderingen gedurende een beperkte periode te begrijpen.

Big data-analyse kan realtime plaatsvinden. Omdat big data wordt onmiddelijk wordt gegenereerd, kan de analyse daarvan plaatsvinden zodra het wordt verzameld. Big data-analyse biedt bedrijven een meer dynamisch en holistisch begrip van hun behoeften en strategieën.

Stel je voor dat een bedrijf heeft geïnvesteerd in een trainingsprogramma voor hun personeel en ze de impact ervan zouden willen meten.

In een traditioneel data-analysemodel, kan het bedrijf ervoor kiezen om de impact van het trainingsprogramma op een bepaald onderdeel te bekijken, zoals sales. Het bedrijf noteert het volume van de verkoop voor en na de training en filtert mogelijke externe facturen eruit. Het kan, in theorie, laten zien hoeveel de verkoop is toegenomen dankzij de training.

Bij een big data-analysemodel, zou het bedrijf vragen apart kunnen houden die betrekking hebben op specifieke onderdelen van de bedrijfsvoering. In plaats daarvan kan het een grote hoeveelheid data analyseren, in realtime bedrijfsbreed, en zo bekijken welke specifieke onderdelen beïnvloed zijn, zoals verkoop, customer service, public relations en meer.

Big Data tov traditionele data Belangrijke overwegingen voor de toekomst

Big data en traditionele data dienen andere maar verbonden doelen. Alhoewel het lijkt dat big data grotere voordelen heeft, is dat niet altad toepasselijk (of nodig) in alle omstandigheden. Big Data

Kan een diepere analyse van markttrends en klantgedrag leveren; Traditionele data-analyse kan nauwer en te beperkt zijn om de betekenisvolle inzichten te leveren die big data wel kan;
Geeft inzichten sneller weer; Organisaties kunnen van big data in realtime profiteren; In de context van dig data-analytics kan dit een concurrerend verschil maken;
Is efficiënter; Aangezien de maatschappij steeds digitaler wordt, gaan mensen en bedrijven grote hoeveelheden big data genereren: elke dag, elke minuut: Big data zorgt ervoor dat deze data beveiligd en op eengoede manier kan worden geïnterpreteerd;
Vereist geavanceerde voorbereiding; Om van deze voordelen te profiteren, moeten organisaties zich voorbereidenop big data met nieuwe beveiligingsprotocollen, configuratiestappen en stappen zetten in het vergroten van computerrekenkracht.

De opmars van big data betekent niet dat traditionele data zal verdwijnen. Traditionele data:

Kan eenvoudiger te beveiligen zijn, waardoor het de voorkeur krijgt voor gevoelige, persoonlijke of vertrouwelijke datasets; Omdat traditionele data kleiner is, heeft het geen distributed architectuur nodig en is de noodzaak voor third-party opslag ook kleiner;
Kan worden verwerkt met gebruik van conventionele dataverwekingssoftware en een normale systeemconfiguratie; Het verwerken van big data vereist doorgaans een higher-configuration setup, wat de druk op de resources onnodig kan verhogen, evenals de kosten, wanneer traditionele data-methoden volstaan.
Is eenvoudiger te bewerken en begrijpen; Omdat traditionele data gemakkelijker en relationeler van aard is, kan het worden verwerkt met normale functies - en zelfs toegankelijk worden voor leken;

Uiteindelijk is het geen kwestie van kiezen tussen big data en traditionele data. Aangezien steeds meer bedrijven grote, unstructured datasets genereren, moeten ze beschikken over de juiste tools. Begrijpen hoe je beide modellen gebruikt en ondersteunt is een onmisbaar onderdeel van jouw sterategie om klaar te zijn voor de big data-toekomst.

AanvullendeBig Data Gidshoofdstukken

Oplossing

Data-Analytics

Oplossing

IT Operations Analytics

Oplossing

Data-warehouse

Product

FlashBlade File en Object Storage

Product

AIRI AI-infrastructure

¹https://www.forbes.com/sites/gilpress/2020/01/06/6-predictions-about-data-in-2020-and-the-coming-decade/?sh=44e375c74fc3

Blader door key resources en evenementen

VIDEO

Bekijk: De waarde van een Enterprise Data Cloud

Charlie Giancarlo over waarom het beheren van data en niet opslag de toekomst zal zijn. Ontdek hoe een uniforme aanpak de IT-activiteiten van bedrijven transformeert.

Nu bekijken

RESOURCE

Legacy-storage kan de toekomst niet aandrijven.

Moderne workloads vragen om AI-ready snelheid, beveiliging en schaalbaarheid. Is uw stack er klaar voor?

Doe de assessment

PURE360 DEMO’S

Ontdek, leer en ervaar Pure Storage.

Krijg toegang tot on-demand video's en demo's om te zien wat Pure Storage kan doen.

Demo’s bekijken

THOUGHT LEADERSHIP

De innovatierace

De nieuwste inzichten en perspectieven van industrieleiders in de voorhoede van opslaginnovatie.

Meer lezen

Uw browser wordt niet langer ondersteund!

Oudere browsers vormen vaak een veiligheidsrisico. Om de best mogelijke ervaring te bieden bij het gebruik van onze site, dient u te updaten naar een van deze nieuwste browsers.