De bedrijven van vandaag verzamelen enorme hoeveelheden data uit verschillende bronnen die vaak in realtime moeten worden geanalyseerd. Big data verwijst naar data die te groot, te snel of te complex is om met traditionele technieken te verwerken. Maar het omhelst ook meerdere soorten technologie en strategieën die door Big Data mogelijk worden gemaakt zoals zogenaamde intelligence-generating fields, voorspellende analytics, the internet of things, kunstmatige intelligentie enzovoorts.
Research and Markets meldt dat de wereldwijde big data-markt naar verwachting $156 miljard in 2026 zal behelzen — en bedrijven hebben veel goede redenen om dan ook aan boord te zijn. Dit is een overzicht van wat big data precies is, waar het vandaan komt, waar het voor kan worden gebruikt en hoe bedrijven hun IT-infrastructuur gereed maken om big data een succes te maken.
Terwijl het concept van Big Data al lang bestaat, was industrie-analist Doug Laney in 2001 de eerste om de drie V's van Big Data te benoemen: De drie V’s zijn:
Sommige data-experts breiden de definitie uit tot vier, vijf of meer V's. De vierde en vijfde V zijn:
Hoewel de lijst tot42 V’s kan gaan, worden deze vijf het meest gebruikt om Big Data te definiëren.
Er zijn ook twee soorten big data, die verschillen in de manier ze worden verwerkt en welke vragen en vraagstukken ze normaliter beantwoorden.
Lees meer over het verschil tussen big data en traditional data.
Big data wordt gebruikt om alle ongestructureerde, moderne data die wordt verzameld vandaag de dag te beschrijven, evenals hoe het wordt gebruikt voor in-depth kennis en inzichten. Deze bronnen bevatten vaak:
Verschillende soorten data vereisen verschillende soorten opslag. Dit is ook van toepassing op structured en unstructured data, die verschillende database-types, verwerking, opslag en analyse vereisen
Structured data is eigenlijk de traditional data dat netjes in een tabel past Structured data is vaak gemakkelijk te categoriseren en op te maken in entries in standaard waarden zoals prijzen, data, tijden etc.
Unstructured data is moderne data die niet zo gemakkelijk of snel in een tabel te plaatsen is Unstructured data is tegenwoordig vaan synoniem voor big data en zal de komende jaren waarschijnlijk 80% van alle data vertegenwoordigen. Het omvat alle data gegenereerd door social media, IoT, contentcreators, bewaking en meer. Het kan tekst, afbeeldingen, geluid en video bevatten. Het is de drijvende kracht achter nieuwe storagecategorieën zoals FlashBlade®, unified fast file and object (UFFO). Om gebruik te kunnen maken van unstructured data, hebben bedrijven meer storage, meer rekenkracht en betere consolidatie van verschillende datatypes nodig.
De big data lifecycle kan het volgende bevatten, onder andere:
Er zijn vele efficiënte en veelbelovende mogelijkheden voor big data. De kracht ligt in het vinden en benutten van zakelijke doorbraken die big data inzichten kunnen bewerkstelligen. Doelen en toepassingen van big data bevatten vaak:
Bekijk meer specifieke big-data-gebruikerscases en -applicaties voor jouw branche.
Big data heeft specifieke vereisten, vooral op het gebied van data-opslag. Het wordt bijna constant naar een database geschreven (net als met realtime streaming data) en bevat vaak een grote verscheidenheid aan formaten. Daardoor wordt big data meestal het best opgeslagen in schemaloze (unstructured) omgevingen op een gedistribueerd bestandssysteem, zodat verwerking ervan parallel kan worden uitgevoerd met grote datasets. Dat maakt het een perfecte omgeving voor een unstructured storageplatform dan bestanden en objectdata uniform kan maken.
Lees meer over het verschil tussen een data hub en een data lake.
De opmars van de internet of things (IoT) heeft ervoor gezorgd dat de data die over verschillende apparaten moet worden beheerd, enorm is toegenomen
In plaats van te wachten tot IoT-data op afstand verplaatst en verwerkt wordt in een gecentraliseerde locatie zoals een datacenter, is edge computing een distributed topologie waarbij informatie lokaal wordt verwerkt ‚at the edge’: de grens tussen mensen en apparaten waar nieuwe data wordt gecreëerd.
Edge computing bespaart bedrijven niet alleen geld en bandbreedte: het stelt ze ook in staat om efficiëntere realtime apps te ontwikkelen die een superieure gebruikerservaring bezorgen aan hun klanten. Deze trend zal alleen nog maar meer een vlucht nemen met de introductie van nieuwe draadloze technologie als 5G.
Doordat steeds meer apparaten verbonden zijn met het internet, zal ook de hoeveelheid data die realtime en ‚on the edge’ moet worden verwerkt verder toenemen. Dus hoe verzorg je dataopslag die wordt verspreid en bovendien agile genoeg is om aan de toenemende eisen voor dataopslag van edge computing kunnen voldoen? Het korte antwoord: container-native dataopslag.
Als we kijken naar de bestanden edge-platformen zoals AWS Snowball, Microsoft Azure Stack en Google Anthos, zien we de dat ze allemaal gebaseerd zijn op Kubernetes, een populair orchestarion-platform. Kubernetes stelt deze omgevingen in staat om workloads voor data-inname, opslag, verwerking, analyse en machine-learning in the edge te draaien.
Een multi-node Kubernetes cluster dat draait in de edge heeft een efficiënte, container-native opslagengine nodig die kan voldoen aan de specifieke behoefte van datacentic workloads. In andere woorden: containergecontaineriseerde apps die on de edge draaien hebben container-granular opslagmanagement nodig. Portworx® is een dataservicesplatform dat een stateful product levert om datavolumes te beheren die ook nog container-SLA-bewust zijn.
De voordelen van het hosten van Big Data op All-Flash Arrays:
Het relatieve volume, de variëteit en de snelheid van Big Data verandert voortdurend. Als u wilt dat uw data groot en snel blijft, wilt u er zeker van zijn dat u consequent investeert in de nieuwste dataopslagtechnologieën. De vooruitgang op het gebied van flash-geheugen heeft het mogelijk gemaakt om op maat gemaakte all-flash opslagoplossingen te leveren voor al uw data-tiers. Dit is hoe Pure Storage® u kan helpen bij het aandrijven van uw Big Data Analyticspijplijn:
Snelle en efficiënte scale-out flash storage met FlashBlade
Hebt u een vraag of opmerking over Pure-producten of certificeringen? Wij zijn er om te helpen.
Plan een livedemo in en zie zelf hoe Pure kan helpen om jouw data in krachtige resultaten om te zetten.
Bel ons: 31 (0) 20-201-49-65
Media: pr@purestorage.com
Pure Storage
Herikerbergweg 292
1101 CT . Amsterdam Zuidoost
The Netherlands