Skip to Content

Wat is een Time-series Database (TSDB)?

Vector illustration concept of time management isolated on blue background with long shadow.

Wanneer u minuut-voor-minuut, dag-voor-dag of andere analyses van datareeksen moet tonen, gebruikt u een time-serie database. Een tijdreeksdatabase slaat datapunten op met de bijbehorende tijdstempels, zodat trends binnen een bepaalde periode aan gebruikers kunnen worden getoond. Het wordt vaak gebruikt bij de visualisatie van tijdgebaseerde informatie en analyses.

Wat is een Time-serie database?

In een tijdreeksdatabase bevat elk record een tijdstempel. De tijdstempel kan worden gebruikt om één enkel datapunt weer te geven of in grafieken en analyses. De time-serie database wordt specifiek gebruikt voor informatie die een datumbereik vereist, zoals het bijhouden van het weer of het opvragen voor specifieke gebeurtenissen die zijn geregistreerd voor monitoringdoeleinden.

Wat is een Time-serie-collectie?

Een time-serie database slaat alle data op, maar een time-serie verzameling is een stukje data dat uit de database wordt gehaald en naar de applicatie wordt teruggebracht. Tijdreeksen worden uit de database gehaald in de vorm van een dataset, en de dataset bevat datapunten voor het gegeven datumbereik. De gebruiker of applicatie stuurt het tijdsbereik als invoer naar de database en de database retourneert een verzameling voor elk datapunt dat binnen het gegeven bereik valt.

Hoe een Time-series Database werkt

Gewoonlijk wordt een time-serie database gecreëerd om grote hoeveelheden data vast te leggen voor toekomstige analyse. Gebruikers stellen hun datumbereik in een applicatie in en de database retourneert een set datapunten. De database werkt door data met tussenpozen vast te leggen. Een aandelenticker kan bijvoorbeeld elke minuut veranderingen in een aandelenprijs laten zien. De database slaat de naam van de voorraad, de prijs en het tijdstempel op om elke minuut de prijs van de voorraad bij te houden voor analyses en historische informatie.

Data uit een tijdreeksdatabase sorteert records in chronologische volgorde, zodat ontwikkelaars visualisaties kunnen bouwen zonder veel overhead. Databases zijn krachtige servers, zodat ze een dataset veel sneller kunnen sorteren dan een front-end webapplicatie. De time-serie database neemt input van de applicatie om te bepalen hoe de data moeten worden besteld, zodat ontwikkelaars analyses aan gebruikers kunnen weergeven. Een gebruiker kan bijvoorbeeld om gegevens vragen over voorraadprijzen voor een specifiek datumbereik en om deze in oplopende volgorde te sorteren.

Populaire Time-serie Databases: Vergelijkingen

Elke time-serie database heeft een back-end engine, die wordt gebruikt om data op te slaan en op te halen. De engine moet snel en efficiënt zijn om grote hoeveelheden data op te slaan terwijl hij deze met zeer weinig latency kan ophalen. U kunt tijdgebaseerde data opslaan in een traditionele database, maar verschillende tijdreeksdatabases op de markt zijn speciaal gebouwd voor het opvragen en opslaan van dit soort data.

Waarom InfluxDB gebruiken: Open source TSDB

Open-source databases hebben de voorkeur van sommige ontwikkelaars omdat ze de codebase kunnen vorken en hun eigen wijzigingen in het basisproduct kunnen aanbrengen. InfluxDB is een open source time-serie database die duizenden datapunten per seconde kan opslaan. Als u infrastructuur zoals IoT-apparaten voor industriële toepassingen wilt monitoren, is InfluxDB een goede keuze.

Prometheus vs. InfluxDB

Het belangrijkste verschil tussen InfluxDB en Prometheus is de manier waarop data worden opgehaald. Met InfluxDB stuurt een applicatie voortdurend data naar de database waar deze wordt opgeslagen en opgehaald. Prometheus werkt via een API waarbij de applicatie data pusht, en de database gebruikt de API om deze vervolgens te peilen naar opgeslagen data. Voor grote ondernemingen met systemen die zich op tal van locaties bevinden, stelt de Prometheus cloudgebaseerde API ontwikkelaars in staat data te uploaden vanaf meerdere locaties waar ze in een centraal dashboard kunnen worden beoordeeld.

TijdschemaDB vs. InfluxDB

InfluxDB is een NoSQL-database, terwijl TimescaleDB een relationele database is. Relationele databases werken heel anders dan NoSQL-databases. Een relationele database werkt met tabellen en sleutels die kunnen worden gebruikt om data samen te voegen die in elke tabel zijn opgeslagen. Het is belangrijk om te weten hoe een database zijn data opslaat, omdat de manier waarop ze worden opgehaald een andere syntaxis gebruikt. Als u de data kent die worden opgeslagen en deze in tabellen kunt ordenen, dan is TimescaleDB een haalbare optie.

Elasticsearch vs. InfluxDB

Voor een prestatieboost is Elasticsearch een veelgebruikte engine die wordt gebruikt in bedrijfsapplicaties. De prestaties zijn iets beter dan die van InfluxDB vanwege de mogelijkheid om indexen te verschuiven, wat kaarten zijn van data die in Elasticsearch als "document" zijn opgeslagen. Elasticsearch moet worden gebruikt voor grote datasets waar applicaties en gebruikers datasets zullen ophalen die miljoenen datapunten van een breed scala aan tijdstempels kunnen overbruggen. Elasticsearch is bijvoorbeeld nuttig voor het beoordelen van logbestanden die worden gebruikt om een grote netwerkomgeving van ondernemingen te controleren op verdachte gebruikersactiviteiten.

Wanneer Tijdserie Databases te gebruiken

De meeste tijdreeksdatabases worden gebruikt voor het monitoren van hardware of software, zodat een grote verzameling data kan worden gebruikt om specifieke gebeurtenissen te analyseren. Om een duidelijk beeld te krijgen van gebeurtenissen binnen een omgeving, hebt u veel data nodig die uit verschillende bronnen zijn verzameld. IoT-sensoren kunnen bijvoorbeeld temperatuurgegevens van meerdere machines verzamelen. Een time-serie database slaat de temperatuur gedurende elke minuut van de dag op, zodat ingenieurs eventuele afwijkingen kunnen identificeren en verhelpen voordat de machine uitvalt.

Relationele vs. Time-serie Databases

De meeste tijdreeksdatabases gebruiken NoSQL-documenten om data op te slaan, wat een gebruikelijke manier is om ongestructureerde data op te slaan. Ongestructureerde data betekent dat ontwikkelaars data kunnen opslaan als een tijdstempel en een naam zonder de beperkingen van het organiseren van de data in gedefinieerde tabelrijen. Relationele databases vereisen dat ontwikkelaars data opslaan met behulp van specifieke structuren, zodat het geen haalbare opties zijn voor tijdreeksdata met onbekende waarden en datatypes. Een ontwikkelaar kon bijvoorbeeld geen stringwaarde opslaan in een tijdstempelkolom met behulp van een relationele database, maar dit kan worden gedaan met een NoSQL-database uit de tijdreeks.

NoSQL vs. Time-serie Databases

Voor onbekende waarden heeft een NoSQL-database de voorkeur. U moet een database kiezen die NoSQL ondersteunt, zoals InfluxDB of Elasticsearch. Deze tijdreeksdatabases bieden bulk dataopslag met snelle prestaties tijdens query's. Ze zijn meestal gereserveerd voor grote bedrijfsapplicaties en zijn veel moeilijker te implementeren. Een onjuist geconfigureerde NoSQL-database kan de prestaties tijdens queryverwerking belemmeren.

Voordelen van Time-series Databases

Elke database slaat informatie op, maar een tijdreeksdatabase is speciaal gebouwd voor tijdgebaseerde analyses. Het voordeel van een time-serie database is dat het grote hoeveelheden data kan opslaan bij elk datapunt dat een tijdstempel bevat. Omdat het is gebouwd met grote datasets in gedachten, is een time-serie database vaak sneller en veel efficiënter in het invoegen van nieuwe records en het ophalen van grote datasets dan een traditionele database.

Tijdreeksdatabases zijn vaak nauwkeuriger voor query's met datums en tijden, en ze slaan tijdreeksgegevens veel efficiënter op. Elke organisatie die monitoringgegevens wil opslaan, zal profiteren van een time-serie database. Applicaties profiteren van een time-serie database door de mogelijkheid om grote datasets op te halen voor analytics, visualisaties, financiële trends, activiteitsinformatie en veranderingen in een omgeving die regelmatig gedurende de dag en met verschillende intervallen plaatsvinden.

Nadelen van Time-series Databases

Zoals bij elke geavanceerde infrastructuur zijn time-serie databases moeilijker te implementeren en te configureren. Omdat de meeste NoSQL zijn, zal een onjuist geïmplementeerde NoSQL-database lijden onder slechte prestaties als deze niet is geoptimaliseerd. Configuraties vereisen dat iemand binnen de organisatie de juiste manieren begrijpt om de database te optimaliseren. 

Bedrijven die tijdreeksdata willen opslaan, hebben de middelen nodig om grote hoeveelheden data op te slaan. Data kunnen in de cloud worden opgeslagen, maar dit verhoogt de IT-kosten. De infrastructuur ter ondersteuning van dataopslag en time-serie databaseverwerking kan duur zijn.

Conclusie

Als u een betere oplossing voor op tijd gebaseerde data wilt vinden, is een time-serie database een goede keuze. Bekijk de verschillende soorten database-engines, houd rekening met de kosten en vind er een die meegroeit met de groei van het bedrijf en de toename van dataopslag. Vergeet niet om configuraties en optimalisatieopties te bekijken om ervoor te zorgen dat de database zo efficiënt mogelijk draait.

NEEM CONTACT MET ONS OP
Vragen, opmerkingen?

Hebt u een vraag of opmerking over Pure-producten of certificeringen?  Wij zijn er om te helpen.

Een demo inplannen

Plan een livedemo in en zie zelf hoe Pure kan helpen om jouw data in krachtige resultaten om te zetten. 

Bel ons: 31 (0) 20-201-49-65

Media: pr@purestorage.com

 

Pure Storage

Herikerbergweg 292

1101 CT . Amsterdam Zuidoost

The Netherlands

info@purestorage.com

Sluiten
Uw browser wordt niet langer ondersteund!

Oudere browsers vormen vaak een veiligheidsrisico. Om de best mogelijke ervaring te bieden bij het gebruik van onze site, dient u te updaten naar een van deze nieuwste browsers.