¿Qué es una base de datos de serie temporal (TSDB)?

Vector illustration concept of time management isolated on blue background with long shadow.

Una base de datos de series temporales proporciona aplicaciones en tiempo real con conjuntos de registros basados en un período de tiempo. Si bien todas las bases de datos permiten almacenar datos con una marca de tiempo, se optimiza una base de datos de series temporales para los registros en los que los datos cuentan una historia en orden cronológico. La duración de un conjunto de datos podría estar a pocos milisegundos entre sí, o se podría usar una base de datos de series temporales para puntos de datos por hora, diarios, mensuales o anuales.

¿Qué es una base de datos de series temporales?

Si bien cada motor de base de datos permite a los desarrolladores almacenar una marca de tiempo en un registro, una base de datos de serie temporal (TSDB) está diseñada específicamente para registros enfocados en un período de tiempo. Por ejemplo, es posible que necesite actualizaciones minuto a minuto en una aplicación meteorológica. Una base de datos de series temporales puede almacenar datos por cada minuto para mostrarlos a los usuarios. Una TSDB puede ser una opción en lugar de bases de datos NoSQL estándar como MongoDB cuando necesita consultas más refinadas basadas en el tiempo.

Debido a que un TSDB se utiliza principalmente para recuperar datos, estas bases de datos suelen estar optimizadas para lecturas y creación de nuevos registros. Debido a que las TSDB rara vez actualizan los registros, están diseñadas para una mejor recuperación de registros basada en una marca de tiempo en comparación con otras bases de datos comunes. Los TSDB también son mejores para aplicaciones en tiempo real en las que se muestra a los usuarios un conjunto lineal de información basado en la marca de tiempo en cada registro.

¿Cómo funciona una base de datos de series temporales?

La mejor manera de comprender cómo funciona una base de datos de series temporales es usar un ejemplo. Supongamos que tiene sensores en una máquina que depende de la temperatura. Las temperaturas cambian minuto a minuto, por lo que se puede usar una base de datos de series temporales para realizar un seguimiento de la temperatura y la marca de tiempo. Podrían registrarse otras propiedades de la máquina, incluida la ubicación de la máquina, la humedad y la temperatura ambiente.

A medida que la máquina funciona, los sensores almacenan datos en un TSDB. El TSDB almacena cada registro en orden a medida que los sensores recopilan información. No necesitaría actualizar los registros, pero deberá recuperarlos para monitorear el sistema. El motor de almacenamiento TSDB funciona optimizando las consultas para grandes conjuntos de datos y recuperando datos en función de marcas de tiempo récord. Se envían flujos de datos con marca de tiempo a los analistas para monitorear la maquinaria y tomar decisiones de mantenimiento.

Beneficios de usar una base de datos de series temporales

Un motor TSDB está diseñado para almacenar grandes volúmenes de datos y ofrecer grandes conjuntos de registros. Las aplicaciones en tiempo real se benefician del motor optimizado de un TSDB para la recuperación de datos cada segundo o minuto. Las soluciones de monitoreo que requieren predicciones de grandes volúmenes de datos o información en tiempo real se benefician de la escala y la velocidad de una base de datos de series temporales.

Debido a que los registros generalmente contienen una pequeña cantidad de campos, las consultas se simplifican para los desarrolladores. Un TSDB puede devolver miles de registros, pero el conjunto de registros a menudo contiene solo algunos campos. La cantidad limitada de campos y consultas simplificadas aceleran el rendimiento de las aplicaciones en tiempo real y reducen la sobrecarga en el servidor de base de datos.

Casos de uso para bases de datos de series temporales

Las industrias en las que IoT es común o grandes puntos de datos con marcas de tiempo son necesarias para las predicciones y el monitoreo son ideales para una base de datos de series temporales. Fabricación y otras industrias en las que los sensores de IoT son fundamentales para el trabajo de tiempo de actividad con bases de datos de series temporales para predecir problemas antes de que interrumpan los servicios. Por ejemplo, un fabricante utiliza los datos del sensor IoT para predecir cuándo la maquinaria necesita mantenimiento o podría sufrir pronto una falla de hardware.

Las grandes aplicaciones de red pueden trabajar con bases de datos de series temporales para predecir interrupciones o identificar posibles amenazas. La infraestructura de red crítica podría admitir un gran proveedor de servicios de Internet o un centro de datos, y los datos con marca de tiempo podrían alertar a un analista de seguridad sobre una posible interrupción cuando las temperaturas ambiente son demasiado altas o el hardware envía información dañada, lo que indica un posible tiempo de inactividad. Cualquier aplicación crítica en tiempo real funciona con una base de datos de series temporales para el rendimiento y la escalabilidad. Por ejemplo, si el uso de la CPU del servidor aumenta con frecuencia, puede ser el momento de actualizarla o reemplazar una CPU para evitar el tiempo de inactividad y las fallas del sistema.

Soluciones populares para bases de datos de series temporales

Si no ha trabajado con una base de datos de series temporales, hay varias opciones populares para elegir. Estas son algunas soluciones TSDB para sus aplicaciones:

InflujoDB: Esta solución de columnas es para consultas optimizadas en tiempo real y análisis de columnas.
Prometheus: Este TSDB es ideal para el análisis de visualización y datos dimensionales. Los desarrolladores de Prometheus proporcionan una herramienta de monitoreo de código abierto y un motor de base de datos.
Escala de tiempo: Este popular TSDB se utiliza para IoT, sensores, criptomonedas y análisis de AI.

Conclusiones

Debido a que es difícil cambiar de proveedor de bases de datos, querrá usar la correcta desde el principio. Si su aplicación requiere análisis o resultados en tiempo real basados en datos con marca de tiempo, es probable que una base de datos de series temporales sea adecuada para usted. Ya sea que utilice una base de datos de series temporales, análisis de big data o motores de bases de datos tradicionales, Pure Storage tiene la solución de almacenamiento para admitir sus aplicaciones en tiempo real y de alto volumen.