De Beginnersgids voor Big Data

Big Data tov traditionele data

Big data verschaft ongekende mogelijkheden aan bedrijven, inclusief belangrijke inzichten in klantgedrag, accuratere voorspellingen over marktactiviteit en verbeterde algehele efficiëntie.

Mensen en bedrijven creëren steeds meer data elk jaar. Volgens een IDC-rapport werd er in 2010 slechts 1,2 zettabytes (1,2 triljoen gigabytes) aan nieuwe data gecreëerd. In 2025 zal dat kunnen stijgen tot 175 zettabytes (175 triljoen gigabytes) of zelfs meer.1.

Zodra bedrijven in deze bloeiende bron van voorspellende analytics gaan stappen, zal de markt voor big data ook verder groeien. Statista-onderzoek voorspelt dat de markt voor big data zal verdubbelen tussen 2018 en 2027 met een waarde tussen de $ 169 miljard en $274 miljard.

Maar wat zijn de belangrijkste verschillen tussen big data en traditionele data? En welke impact hebben zij op de huidige dataopslag, verwerking en analyticstechnologie? Hier zullen we de verschillende doelen van elk datatype bespreken, evenals het belang van een strategie benadrukken waarmee succes met zowel big data als traditionele data gewaarborgd wordt.

 

Wat is traditionele data?

Traditionele data is structured en relationele data die organisaties al tientallen jaren hebben opgeslagen en verwerkt. Traditionele data vertegenwoordigt nog steeds het allergrootste deel van de data op aarde.

Bedrijven kunnen traditionele data gebruiken om verkopen te volgen, customer relations en workflows te beheren. Traditionele data is vaak makkelijker te bewerken en kan worden beheerd met conventionele dataverwerkingssoftware. Het levert alleen doorgaans minder geavanceerde inzichten en minder voordelen op dan big data.

 

Wat is Big Data?

Big data kan verwijzen naar zowel een grote en complexe datase als we de manieren om dit type data te verwerken. Big data heeft vier belangrijke karakteristieken, beter bekend als de Vier V’s.

  • Volume: Big data is… groot. Alhoewel big data niet alleen herkenbaar is aan de grootte, is het doorgaans zeer groot van omvang.
  • Variety: Een big data set bevat structured, semis-structured en unstructured data.
  • Velocity: Big data ontstaat snel en wordt vaak verwerkt in realtime.
  • Veracity: Big data is niet perse kwalitatief beter dan traditionele data, maar de veracity (accuratesse) is zeer belangrijk. Afwijkingen, vooroordelen en ruis kan de kwaliteit van big data significant beïnvloeden.

 

De belangrijkste verschillen tussen big data en traditionele data

Een aantal karakteristieken kan worden gebruikt om de verschillen tussen big data en traditionele data aan te geven. Deze bevatten:

  • De grootte van de data
  • Hoe de data georganiseerd is
  • De architectuur benodigd om de data te beheren
  • De bronnen waar de data vandaan komt
  • De gebruikte methoden om de data te analyseren

Grootte

Traditionele data wordt vaak gemeten in gigabytes en terabytes. Daardoor kan het centraal worden opgeslagen, vaak op één server, door de grootte.

Big data wordt niet alleen door de grootte gekenmerkt, maar ook door het volume. Big data wordt doorgaans gemeten in petabytes, zettabytes en exabytes. De toenemende grootte van big data sets is een van de belangrijkste drijfveren voor de vraag naar meer moderne, hoogecapaciteits, cloud-based dataopslagoplossingen.

Organisatie

Traditionele data is reguliere data die is opgeslagen in records, bestanden en tabellen. Velden in traditionele datasets zijn relationeel, zodat het mogelijk is hun relatie te bepalen en zo de data te bewerken. Traditionele databases, zoals SQL, Oracle DB en MySQL gebruiken een vast schema dat statisch en pregeconfigureerd is.

Big data gebruikt een dynamisch schema. Voor opslag geldt dat big data ruw en ongestructureerd (unstructured) is. Wanneer big data wordt benaderd, wordt het dynamische schema toegepast op de raw data. Miderde non-relational of NoSQL databases zoals Cassandra of MongoDB zijn ideaal voor unstructured data, gezien de manier waarop ze data opslaan in bestanden.

Architectuur

Traditionele data wordt doorgaans beheerd in een gecentraliseerde architectuur die kostenefficiënter en veiliger kan zijn voor kleinere, gestructureede datasets.

In het algemeen bestaan een gecentraliseerd systeem uit een of meerdere vlient nodes (zoals computers of mobiele apparaten), verbonden met een centrale node (zoals een server). De centrale server controleert het netwerk en bewaakt de veiligheid.

Vanwege de schaal en de complexiteit is het niet mogelijk om big data vanaf een centrale plek te beheren. Het vereist een distributed architectuur.

Distributed systems koppelen meerdere servers op computers over een netwerk, door als co-equal nodes te fungeren. De architectuur kan horizontaal schalen (scale out) en blijft functioneren, zelfs als een node uitvalt. Distributed systems kunnen de last op commodity hardware delen om kosten te besparen.

Bronnen

Traditionele data komt normaliter uit Enterprise Resource Planning (ERP), Customer Relationship Management (CRM), online transacties en andere enterprise-level data.

Big data komt van een bredere range van enterprise- en niet-enterprise data, dat ook data uit bijvoorbeeld social media, apparaat- en sensordata en audiovisuele data kan bevatten. Deze bronnen zijn dynamisch en groeien en evolueren elke dag.

Unstructured databronnen kunnen ook tekst, video, afbeeldingen en audiobestanden bevatten. Dergelijke datatypes kunnen niet worden gestructureerd met de kolommen en rijen uit traditionele databases. Omdat een steeds groter wordende hoeveelheid data unstructurered is en vanuit verschillende bronnen komt, zijn big data analysemethoden nodig om waardevolle informatie uit te halen.

Analyse

Traditionele data-analyse gebeurt incrementeel: Een gebeurtenis vindt plaats, data wordt gegenereerd en de analyse van de data vindt plaats na de gebeurtenis. Traditionele data-analyse kan bedrijven helpen om de impact van bepaalde strategieën of veranderingen gedurende een beperkte periode te begrijpen.

Big data-analyse kan realtime plaatsvinden. Omdat big data wordt onmiddelijk wordt gegenereerd, kan de analyse daarvan plaatsvinden zodra het wordt verzameld. Big data-analyse biedt bedrijven een meer dynamisch en holistisch begrip van hun behoeften en strategieën.

Stel je voor dat een bedrijf heeft geïnvesteerd in een trainingsprogramma voor hun personeel en ze de impact ervan zouden willen meten.

In een traditioneel data-analysemodel, kan het bedrijf ervoor kiezen om de impact van het trainingsprogramma op een bepaald onderdeel te bekijken, zoals sales. Het bedrijf noteert het volume van de verkoop voor en na de training en filtert mogelijke externe facturen eruit. Het kan, in theorie, laten zien hoeveel de verkoop is toegenomen dankzij de training.

Bij een big data-analysemodel, zou het bedrijf vragen apart kunnen houden die betrekking hebben op specifieke onderdelen van de bedrijfsvoering. In plaats daarvan kan het een grote hoeveelheid data analyseren, in realtime bedrijfsbreed, en zo bekijken welke specifieke onderdelen beïnvloed zijn, zoals verkoop, customer service, public relations en meer.

 

Big Data tov traditionele data Belangrijke overwegingen voor de toekomst

Big data en traditionele data dienen andere maar verbonden doelen. Alhoewel het lijkt dat big data grotere voordelen heeft, is dat niet altad toepasselijk (of nodig) in alle omstandigheden. Big Data

  • Kan een diepere analyse van markttrends en klantgedrag leveren; Traditionele data-analyse kan nauwer en te beperkt zijn om de betekenisvolle inzichten te leveren die big data wel kan;
  • Geeft inzichten sneller weer; Organisaties kunnen van big data in realtime profiteren; In de context van dig data-analytics kan dit een concurrerend verschil maken;
  • Is efficiënter; Aangezien de maatschappij steeds digitaler wordt, gaan mensen en bedrijven grote hoeveelheden big data genereren: elke dag, elke minuut: Big data zorgt ervoor dat deze data beveiligd en op eengoede manier kan worden geïnterpreteerd;
  • Vereist geavanceerde voorbereiding; Om van deze voordelen te profiteren, moeten organisaties zich voorbereidenop big data met nieuwe beveiligingsprotocollen, configuratiestappen en stappen zetten in het vergroten van computerrekenkracht.

De opmars van big data betekent niet dat traditionele data zal verdwijnen. Traditionele data:

  • Kan eenvoudiger te beveiligen zijn, waardoor het de voorkeur krijgt voor gevoelige, persoonlijke of vertrouwelijke datasets; Omdat traditionele data kleiner is, heeft het geen distributed architectuur nodig en is de noodzaak voor third-party opslag ook kleiner;
  • Kan worden verwerkt met gebruik van conventionele dataverwekingssoftware en een normale systeemconfiguratie; Het verwerken van big data vereist doorgaans een higher-configuration setup, wat de druk op de resources onnodig kan verhogen, evenals de kosten, wanneer traditionele data-methoden volstaan.
  • Is eenvoudiger te bewerken en begrijpen; Omdat traditionele data gemakkelijker en relationeler van aard is, kan het worden verwerkt met normale functies - en zelfs toegankelijk worden voor leken;

Uiteindelijk is het geen kwestie van kiezen tussen big data en traditionele data. Aangezien steeds meer bedrijven grote, unstructured datasets genereren, moeten ze beschikken over de juiste tools. Begrijpen hoe je beide modellen gebruikt en ondersteunt is een onmisbaar onderdeel van jouw sterategie om klaar te zijn voor de big data-toekomst.

 

AanvullendeBig Data Gidshoofdstukken

  1. Structured Data tov Unstructured Data
  2. 5 manieren waarmee big data bedrijven verder helpen
  3. Het verband tussen IoT en Big Data

1https://www.forbes.com/sites/gilpress/2020/01/06/6-predictions-about-data-in-2020-and-the-coming-decade/?sh=44e375c74fc3

800-379-7873 +44 20 3870 2633 +43 720882474 +32 (0) 7 84 80 560 +33 9 75 18 86 78 +49 89 12089 253 +353 1 485 4307 +39 02 9475 9422 +31 (0) 20 201 49 65 +46-101 38 93 22 +45 2856 6610 +47 2195 4481 +351 210 006 108 +966112118066 +27 87551 7857 +34 51 889 8963 +41 31 52 80 624 +90 850 390 21 64 +971 4 5513176 +7 916 716 7308 +65 3158 0960 +603 2298 7123 +66 (0) 2624 0641 +84 43267 3630 +62 21235 84628 +852 3750 7835 +82 2 6001-3330 +886 2 8729 2111 +61 1800 983 289 +64 21 536 736 +55 11 2655-7370 +52 55 9171-1375 +56 2 2368-4581 +57 1 383-2387