What Is Structured Data?

Structured data has a well-defined schema for the information it holds. To give an extremely simple definition, any data that can be presented in a spreadsheet program like Google Sheets or Microsoft Excel is structured data. In this example, data can be represented as rows and columns. Each column represents a different attribute, while each row will have the data associated with the attribute for a single instance. Rows and columns form a table that can be referenced easily. Different tables can be connected—that is, they can be said to be related by the common column present in both tables. If multiple tables are related in succession and combination, this creates a relational database. For instance, the customer, sales, and inventory data of a department store can be considered structured data stored as a relational database. Each customer will have a customer ID, as well as fields for their name, contact number, credit card information, address, etc. The database of customers can be connected to the database of sales, with attributes including the time of purchase, item codes purchased, total amount spent, customer ID, etc. Both the tables will be connected with the common attribute of customer ID. Finally, the sales database can be connected to the database of inventory using the common attribute of item code, effectively interconnecting all three tables into a relational database. Structured data like this is generally stored in relational database management systems (RDBMSes). Databases can be written, read, and manipulated using Structured Query Language (SQL), a language that was developed by IBM in the 1970s to support its mainframe databases (though it was initially known as Sequence English Query Language or SEQUEL). It was so named since it reads pretty much like the English language. SQL in its current form was popularized by Relational Software, Inc. (now called Oracle).

What Is Unstructured Data?

Every piece of data that is not structured data can be classified as unstructured data. It’s estimated that by 2025, 80% of the data we encounter will be unstructured data in the form of text, audio, image, or video 1 . In short, unstructured data is modern data. It’s often: Born digital and unpredictable Always being created and on the move Blended, multimodal, and interoperable Geo-distributed for better protection Unstructured data can have some associated metadata that can, in turn, have a structure. For example, a video can have metadata of video resolution, bit rate, frames per second (FPS), owner of the video, etc. But the video itself is unstructured. When there’s some structured metadata associated with unstructured data, it’s occasionally referred to as semi-structured data. Looking more closely at the example of a YouTube video, some metadata is present, such as the time of upload, date of upload, number of views (partial or full), number of likes and dislikes, etc. But the content inside the video title, the video description, and the video itself is unstructured. It has a qualitative aspect that cannot be captured purely by numbers. The most commonly used database for unstructured data is NoSQL. NoSQL stands for “not only SQL,” indicating that the database can handle a wider range of data beyond the capabilities of SQL databases. There’s no schema or tabular structure for NoSQL databases; it’s just a collection of data grouped together.

Dismiss

Innovatie

Een platform, gebouwd voor AI

Unified, geautomatiseerd en klaar om data om te zetten in informatie.

Ontdek hoe

Dismiss

16-18 juni, Las Vegas

Pure//Accelerate® 2026

Ontdek hoe u de ware waarde van uw gegevens kunt ontsluiten.

Schrijf u nu in

Neem contact met ons op

Pure Knowledge
Guide to Big Data
Big Data tov traditionele data

De Beginnersgids voor Big Data

Structured Data tov Unstructured Data

In de laatste tien jaar, is onze definitie en het begrip van way data nu precies is dramatisch toegenomen - voor een deel dankzij de groeiende toename van beschikbare nieuwe tools om unstructured data te lezen, op te slaan en analyseren.

In het verleden werd unstructured data nauwelijks gebruikt, gezien de complexiteit om deze data te begrijpen. Deze nieuwe technologieën hebben het makkelijker gemaakt om de unstructured data niet alleen te begrijpen, maar ook om waardevolle inzichten uit deze schat aan informatie te halen.

Volgens IDC is het totale volume aan gecreëerde, vastgelegde, gekopieerde en gebruikte data wereldwijd groter dan 149 zettabytes elk jaar, waarvan het grootste deel unstructured is. Elke organisatie zal profiteren van het opbouwen van unstructured data analysemogelijkheden. De eerste stap hiernaar is het begrijpen wat structured data is in vergelijking tot unstructured data.

Hier is een korte samenvatting van het verschil tussen die twee, met meer uitleg daarbij:

Karakteristiek	Structured Data	Unstructured Data
Aard van de data	Vooral kwantitatief	Vooral kwalitatief
Datamodel	Voorgedefinieerd: zodra het is vastgesteld en er data is opgeslagen, is het lastig om het model te veranderen.	Geen specifiek schema wordt gebruikt bij unstructured data: het datamodel is erg flexibel.
Dataformat	Een beperkt aantal dataformats is beschikbaar	Een grote hoeveelheid dataformats is beschikbaar voor unstructured data
Database	SQL-gebaseerde relationele databases worden gebruikt	NoSQL-databases met geen specifiek schema worden gebruikt
Zoeken	Zeer eenvoudig om data te zoeken en vinden binnen de database of het dataset	Zeer lastig om specifieke data te zoeken vanwege diens ongestructureerde aard
Analyse	Zeer eenvoudig te analyseren, gezien de kwantitatieve aard van de data	Zeer lastig om te analyseren, zelfs met de bestaande softwaretools
Opslagmethode	Data-warehouses worden gebruikt voor structured data	Data lakes worden gebruikt om unstructured data op te slaan

Slide

Wat Is structured data?

Structured data heeft een voroafbepaald schema voor de informatie dat het bevat. Om een uiterst eenvoudig voorbeeld te geven, elke data die gepresenteerd kan worden in een spreadsheetprogreamma zoals Google Sheets of Microsoft Excel is structured data.

In dit voorbeeld wordt de data voorgesteld als kolommen en rijen. Elke kolom vertegenwoordigt een ander attribuut, terwijl elke rij de data associeert met dat attribuut voor een specifieke gebeurtenis. Rijen en kolommen vormen samen een tabel die gemakkelijk als referentie kunnen dienen.

Verschillende tabellen kunnen worden verbonden: dat wil zeggen dat de gemeenschappelijke kolommen in beide tabellen kunnen worden verbonden.

Wanneer meerdere tabellen achter elkaar worden verbonden en gecombineerd, krijg je een relationele database. Zo kunnen klant-, verkoop- en voorraadgegevens van een winkel worden beschouwd als structured data in een relationele database.

Elke klant heeft een eigen klant-ID, net zoals velden voor hun naam, contactnummer, creditcardinformatie, adres, etc.
De database van klanten kan worden verbonden aan de database van verkoop, met attributen als tijd stip van aankoop, specifieke aangeschafte aankoopcodes, totaal besteede bedrag, klant-ID etc. Allebei de tabellen worden verbonden met het gemeenschappelijke attribuut klant-ID.
Tot slot kan de verkoopdatabase worden verbonden met de voorraaddatabase door middel van het gemeenschappelijke attribuut aankoopcode, waardoor feitelijk alledrie de tabellen in een relationele database worden verbonden.

Structured data zoals dit wordt doorgaans opgeslagen in een relationeel databasemanagementsysteem (RDBMS). Databases kunne worden geschreven, gelezen en bewerkt met de hulp van Structured Query Language (SQL), een taal ontwikkeld door IBM in de jaren 1970 om de mainframedatabases te ondersteunen. (Oorspronkelijk stond het bekend als Sequence English Query Language of SEQUEL). Het werd zo genoemd omdat het min of meer leest als het Engels. SQL in diens huidige vorm werd populair door Relational Software, Inc. (nu Oracle).

Wat is unstructured data?

Elk stukje data dat geen structured data is, kan worden geklassificeerd als unstructured data. Naar verwachting zal in 2025, 80% van alle data die we tegenkomen unstructured data zijn in de vorm van tekst, audio, afbeeldingen of video. ¹.

Kort gezegd, unstructured data is moderne data. Het is vaak:

Digitaal ontstaan en onvoorspelbaar
Altijd gecreëerd en beweeglijk
Blended, multimodal en interoperabel
Geo-verspreid voor betere beveiliging

Unstructured data heeft soms geassocieerde metadata dat op diens beurt wel een structuur heeft. Zo kan een video metadata als een videoresolutie hebben, maar ook bitrate, frames per seconde (FPS), eigenaar van de video etc. Maar de video op zichzelf is unstructured. Wanneer er soms structured metadata wordt geassocieerd met unstructured data, wordt het soms ook wel semi-structured data genoemd.

Als we bijvoorbeeld kijken naar een YouTube-video: sommige metadata is aanwezig, zoals de uploadtijd, aantal views (gedeeltelijk of volledig), aantal likes en niet-leuks etc. Maar de content van de video, de video-omschrijving en de video zelf zijn unstructured. Het heeft een kwalitatief aspect dat niet kan worden bepaald met getallen alleen.

De meestgebruikte database voor unstructured data is NoSQL. NoSQL staat voor „not only SQL”, waarmee wordt aangegeven dat de database een bredere range van data aankan, die verder reikt dan de mogelijkheden van een SQL-database. Er is geen schema of tabstructuur voor NoSQL-databases: het is slechts een verzameling van gegroepeerde data.

Unstructured Data opslag met UFFO

Dat gezegd hebbende: unstructured data kan dan wel significante inzichten leveren met ontzettend veel potentieel, er blijven flinke uitdagingen aan kleven. Pure’s geavanceerde UFFO opslagoplossing, Pure Storage® FlashBlade®, biedt de snelheid die past bij flash storage technologie, evenals de mogelijkheid om elke architectuur op een agile manier te schalen. Wil je meer weten? Pure biedt een gratis trial voor Pure FlashBlade zodat je de oplossing zonder verplichting kunt testen en proberen.

AanvullendeBig Data Gidshoofdstukken

Oplossing

Data-analytics

Oplossing

IT Operations Analytics

AIRI AI-infrastructure

Product

AIRI//S Moderne AI-infrastructuur

¹https://www.cio.com/article/3406806/ai-unleashes-the-power-of-unstructured-data.html

Blader door belangrijke resources en evenementen

BEURS

Pure//Accelerate® 2026

June 16-18, 2026 | Resorts World Las Vegas

Maak je klaar voor het meest waardevolle evenement dat je dit jaar zult bijwonen.

Schrijf u nu in

PURE360 DEMO’S

Ontdek, leer en ervaar Everpure.

Krijg toegang tot on-demand video's en demo's om te zien wat Everpure kan doen.

Demo’s bekijken

VIDEO

Bekijk: De waarde van een Enterprise Data Cloud

Charlie Giancarlo over waarom het beheren van data en niet opslag de toekomst zal zijn. Ontdek hoe een uniforme aanpak de IT-activiteiten van bedrijven transformeert.

Nu bekijken

RESOURCE

Legacy-storage kan de toekomst niet aandrijven.

Moderne workloads vragen om AI-ready snelheid, beveiliging en schaalbaarheid. Is uw stack er klaar voor?

Doe de assessment

Uw browser wordt niet langer ondersteund!

Oudere browsers vormen vaak een veiligheidsrisico. Om de best mogelijke ervaring te bieden bij het gebruik van onze site, dient u te updaten naar een van deze nieuwste browsers.

Structured Data tov Unstructured Data

Wat Is structured data?

Wat is unstructured data?

Unstructured Data opslag met UFFO

AanvullendeBig Data Gidshoofdstukken

Gerelateerde producten en oplossingen

Wij bevelen ook aan...

Blader door belangrijke resources en evenementen