Big data verschaft ongekende mogelijkheden aan bedrijven, inclusief belangrijke inzichten in klantgedrag, accuratere voorspellingen over marktactiviteit en verbeterde algehele efficiëntie.
Mensen en bedrijven creëren steeds meer data elk jaar. Volgens een IDC-rapport werd er in 2010 slechts 1,2 zettabytes (1,2 triljoen gigabytes) aan nieuwe data gecreëerd. In 2025 zal dat kunnen stijgen tot 175 zettabytes (175 triljoen gigabytes) of zelfs meer.1.
Zodra bedrijven in deze bloeiende bron van voorspellende analytics gaan stappen, zal de markt voor big data ook verder groeien. Statista-onderzoek voorspelt dat de markt voor big data zal verdubbelen tussen 2018 en 2027 met een waarde tussen de $ 169 miljard en $274 miljard.
Maar wat zijn de belangrijkste verschillen tussen big data en traditionele data? En welke impact hebben zij op de huidige dataopslag, verwerking en analyticstechnologie? Hier zullen we de verschillende doelen van elk datatype bespreken, evenals het belang van een strategie benadrukken waarmee succes met zowel big data als traditionele data gewaarborgd wordt.
Traditionele data is structured en relationele data die organisaties al tientallen jaren hebben opgeslagen en verwerkt. Traditionele data vertegenwoordigt nog steeds het allergrootste deel van de data op aarde.
Bedrijven kunnen traditionele data gebruiken om verkopen te volgen, customer relations en workflows te beheren. Traditionele data is vaak makkelijker te bewerken en kan worden beheerd met conventionele dataverwerkingssoftware. Het levert alleen doorgaans minder geavanceerde inzichten en minder voordelen op dan big data.
Big data kan verwijzen naar zowel een grote en complexe datase als we de manieren om dit type data te verwerken. Big data heeft vier belangrijke karakteristieken, beter bekend als de Vier V’s.
Een aantal karakteristieken kan worden gebruikt om de verschillen tussen big data en traditionele data aan te geven. Deze bevatten:
Traditionele data wordt vaak gemeten in gigabytes en terabytes. Daardoor kan het centraal worden opgeslagen, vaak op één server, door de grootte.
Big data wordt niet alleen door de grootte gekenmerkt, maar ook door het volume. Big data wordt doorgaans gemeten in petabytes, zettabytes en exabytes. De toenemende grootte van big data sets is een van de belangrijkste drijfveren voor de vraag naar meer moderne, hoogecapaciteits, cloud-based dataopslagoplossingen.
Traditionele data is reguliere data die is opgeslagen in records, bestanden en tabellen. Velden in traditionele datasets zijn relationeel, zodat het mogelijk is hun relatie te bepalen en zo de data te bewerken. Traditionele databases, zoals SQL, Oracle DB en MySQL gebruiken een vast schema dat statisch en pregeconfigureerd is.
Big data gebruikt een dynamisch schema. Voor opslag geldt dat big data ruw en ongestructureerd (unstructured) is. Wanneer big data wordt benaderd, wordt het dynamische schema toegepast op de raw data. Miderde non-relational of NoSQL databases zoals Cassandra of MongoDB zijn ideaal voor unstructured data, gezien de manier waarop ze data opslaan in bestanden.
Traditionele data wordt doorgaans beheerd in een gecentraliseerde architectuur die kostenefficiënter en veiliger kan zijn voor kleinere, gestructureede datasets.
In het algemeen bestaan een gecentraliseerd systeem uit een of meerdere vlient nodes (zoals computers of mobiele apparaten), verbonden met een centrale node (zoals een server). De centrale server controleert het netwerk en bewaakt de veiligheid.
Vanwege de schaal en de complexiteit is het niet mogelijk om big data vanaf een centrale plek te beheren. Het vereist een distributed architectuur.
Distributed systems koppelen meerdere servers op computers over een netwerk, door als co-equal nodes te fungeren. De architectuur kan horizontaal schalen (scale out) en blijft functioneren, zelfs als een node uitvalt. Distributed systems kunnen de last op commodity hardware delen om kosten te besparen.
Traditionele data komt normaliter uit Enterprise Resource Planning (ERP), Customer Relationship Management (CRM), online transacties en andere enterprise-level data.
Big data komt van een bredere range van enterprise- en niet-enterprise data, dat ook data uit bijvoorbeeld social media, apparaat- en sensordata en audiovisuele data kan bevatten. Deze bronnen zijn dynamisch en groeien en evolueren elke dag.
Unstructured databronnen kunnen ook tekst, video, afbeeldingen en audiobestanden bevatten. Dergelijke datatypes kunnen niet worden gestructureerd met de kolommen en rijen uit traditionele databases. Omdat een steeds groter wordende hoeveelheid data unstructurered is en vanuit verschillende bronnen komt, zijn big data analysemethoden nodig om waardevolle informatie uit te halen.
Traditionele data-analyse gebeurt incrementeel: Een gebeurtenis vindt plaats, data wordt gegenereerd en de analyse van de data vindt plaats na de gebeurtenis. Traditionele data-analyse kan bedrijven helpen om de impact van bepaalde strategieën of veranderingen gedurende een beperkte periode te begrijpen.
Big data-analyse kan realtime plaatsvinden. Omdat big data wordt onmiddelijk wordt gegenereerd, kan de analyse daarvan plaatsvinden zodra het wordt verzameld. Big data-analyse biedt bedrijven een meer dynamisch en holistisch begrip van hun behoeften en strategieën.
Stel je voor dat een bedrijf heeft geïnvesteerd in een trainingsprogramma voor hun personeel en ze de impact ervan zouden willen meten.
In een traditioneel data-analysemodel, kan het bedrijf ervoor kiezen om de impact van het trainingsprogramma op een bepaald onderdeel te bekijken, zoals sales. Het bedrijf noteert het volume van de verkoop voor en na de training en filtert mogelijke externe facturen eruit. Het kan, in theorie, laten zien hoeveel de verkoop is toegenomen dankzij de training.
Bij een big data-analysemodel, zou het bedrijf vragen apart kunnen houden die betrekking hebben op specifieke onderdelen van de bedrijfsvoering. In plaats daarvan kan het een grote hoeveelheid data analyseren, in realtime bedrijfsbreed, en zo bekijken welke specifieke onderdelen beïnvloed zijn, zoals verkoop, customer service, public relations en meer.
Big data en traditionele data dienen andere maar verbonden doelen. Alhoewel het lijkt dat big data grotere voordelen heeft, is dat niet altad toepasselijk (of nodig) in alle omstandigheden. Big Data
De opmars van big data betekent niet dat traditionele data zal verdwijnen. Traditionele data:
Uiteindelijk is het geen kwestie van kiezen tussen big data en traditionele data. Aangezien steeds meer bedrijven grote, unstructured datasets genereren, moeten ze beschikken over de juiste tools. Begrijpen hoe je beide modellen gebruikt en ondersteunt is een onmisbaar onderdeel van jouw sterategie om klaar te zijn voor de big data-toekomst.
1https://www.forbes.com/sites/gilpress/2020/01/06/6-predictions-about-data-in-2020-and-the-coming-decade/?sh=44e375c74fc3
Hebt u een vraag of opmerking over Pure-producten of certificeringen? Wij zijn er om te helpen.
Plan een livedemo in en zie zelf hoe Pure kan helpen om jouw data in krachtige resultaten om te zetten.
Bel ons: 31 (0) 20-201-49-65
Media: pr@purestorage.com
Pure Storage
Herikerbergweg 292
1101 CT . Amsterdam Zuidoost
The Netherlands