Skip to Content

¿Qué es una base de datos de serie temporal (TSDB)?

Vector illustration concept of time management isolated on blue background with long shadow.

Cuando necesita mostrar minuto a minuto, día a día o cualquier otro análisis de rango de fechas, utiliza una base de datos de series temporales. Una base de datos de series temporales almacena los puntos de datos con sus marcas de tiempo asociadas, para que los usuarios puedan mostrar las tendencias dentro de un intervalo de tiempo. A menudo se utiliza para visualizar la información y los análisis basados en el tiempo.

¿Qué es una base de datos de serie temporal?

En una base de datos de series temporales, cada registro contiene una marca de tiempo. La marca de tiempo puede usarse para mostrar un único punto de datos o para representar gráficamente y analizar. La base de datos de series temporales se utiliza específicamente para la información que requiere un intervalo de fechas, como el seguimiento del tiempo o la consulta de eventos específicos registrados con fines de supervisión.

¿Qué es una colección de series temporales?

Una base de datos de series temporales almacena todos los datos, pero una colección de series temporales es un fragmento de datos tomado de la base de datos y devuelto a la aplicación. Las colecciones de series temporales se recuperan de la base de datos en forma de conjunto de datos y el conjunto de datos contiene puntos de datos para el intervalo de fechas dado. El usuario o la aplicación envía el intervalo de tiempo como entrada a la base de datos y la base de datos devuelve una colección para cada punto de datos que se encuentra dentro del intervalo dado.

Cómo funciona una base de datos de serie temporal

Normalmente, se crea una base de datos de series temporales para capturar grandes cantidades de datos para futuros análisis. Los usuarios establecen su intervalo de fechas en una aplicación y la base de datos devuelve un conjunto de puntos de datos. La base de datos funciona capturando datos a intervalos. Por ejemplo, una marca de valores puede mostrar cambios en el precio de una acción cada minuto. La base de datos almacena el nombre, el precio y la marca de tiempo del stock para mantener un registro del precio del stock cada minuto para los análisis y la información histórica.

Los datos recuperados de una base de datos de series temporales clasifican los registros en orden cronológico, para que los desarrolladores puedan crear visualizaciones sin sobrecargas. Las bases de datos son unos servidores potentes, por lo que pueden ordenar un conjunto de datos mucho más rápido que una aplicación web front-end. La base de datos de series temporales recibe información de la aplicación para determinar la manera en que deben pedirse los datos, de manera que los desarrolladores puedan mostrar las analíticas a los usuarios. Por ejemplo, un usuario puede solicitar datos sobre los precios de las acciones para un intervalo de fechas específico y para que se clasifiquen en orden ascendente.

Bases de datos de series temporales populares: Comparaciones

Cada base de datos de series temporales tiene un motor back-end, que se utiliza para almacenar y recuperar datos. El motor debe ser rápido y eficiente para almacenar grandes cantidades de datos y poder recuperarlos con muy poca latencia. Puede almacenar datos basados en el tiempo en una base de datos tradicional, pero varias bases de datos de series temporales del mercado se crean específicamente para consultar y almacenar este tipo de datos.

Por qué usar InfluxDB: TSDB de código abierto

Algunos desarrolladores prefieren las bases de datos de código abierto porque pueden crear la base de código y realizar sus propios cambios en el producto base. InfluxDB es una base de datos de serie temporal de código abierto que puede almacenar miles de puntos de datos cada segundo. Si desea supervisar infraestructuras como dispositivos de IoT para aplicaciones industriales, InfluxDB es una buena opción.

Prometheus frente a InfluxDB

La principal diferencia entre InfluxDB y Prometheus es el modo en que se recuperan los datos. Con InfluxDB, una aplicación envía datos continuamente a la base de datos, donde se almacenan y recuperan. Prometheus funciona a través de una API en la que la aplicación envía datos y la base de datos utiliza la API para sondearlos en busca de datos almacenados. Para las grandes empresas con sistemas ubicados en numerosas ubicaciones, la API basada en la nube de Prometheus permite que los desarrolladores carguen datos desde múltiples ubicaciones, donde pueden revisarse en un panel central.

Escala de tiempoDB frente a InfluxDB

InfluxDB es una base de datos NoSQL, mientras que TimescaleDB es una base de datos relacional. Las bases de datos relacionales funcionan de manera muy diferente a las bases de datos NoSQL. Una base de datos relacional funciona con tablas y claves que pueden usarse para unir los datos almacenados en cada tabla. Es importante saber el modo en que una base de datos almacena sus datos, porque el modo en que se recupera utiliza una sintaxis diferente. Si conoce los datos que se almacenarán y puede organizarlos en tablas, TimescaleDB es una opción viable.

Elasticsearch frente a InfluxDB

Para aumentar el rendimiento, Elasticsearch es un motor común que se utiliza en las aplicaciones empresariales. Su rendimiento es ligeramente mejor que el de InfluxDB, debido a su capacidad para fragmentar los índices, que son mapas de los datos almacenados como un “documento” en Elasticsearch. Elasticsearch debe usarse para grandes conjuntos de datos en los que las aplicaciones y los usuarios recuperen conjuntos de datos que puedan abarcar millones de puntos de datos de una amplia gama de marcas de tiempo. Por ejemplo, Elasticsearch es beneficioso para revisar los archivos de registro utilizados para supervisar un entorno de red empresarial grande en busca de cualquier actividad sospechosa del usuario.

Cuándo usar las bases de datos de serie temporal

La mayoría de las bases de datos de series temporales se utilizan para supervisar el hardware o el software, de manera que se puede usar una gran colección de datos para analizar eventos específicos. Para obtener una imagen clara de los eventos en un entorno, necesita muchos datos recopilados de numerosas fuentes. Por ejemplo, los sensores de IoT pueden recoger datos de temperatura de múltiples máquinas. Una base de datos de series temporales almacena la temperatura por cada minuto del día, para que los ingenieros puedan identificar cualquier anomalía y corregirla antes de que falle la maquinaria.

Bases de datos relacionales frente a series temporales

La mayoría de las bases de datos de series temporales utilizan documentos NoSQL para almacenar datos, lo que es una manera común de almacenar datos no estructurados. Los datos no estructurados significan que los desarrolladores pueden almacenar los datos como una marca de tiempo y un nombre, sin las restricciones de organizar los datos en filas de tabla definidas. Las bases de datos relacionales exigen que los desarrolladores almacenen los datos usando estructuras específicas, por lo que no son opciones viables para los datos de series temporales con valores y tipos de datos desconocidos. Por ejemplo, un desarrollador no pudo almacenar un valor de cadena en una columna de marca de tiempo usando una base de datos relacional, pero puede hacerse con una base de datos NoSQL de serie temporal.

NoSQL frente a bases de datos de series temporales

Para valores desconocidos, el método preferido es una base de datos NoSQL. Debe elegir una base de datos que admita NoSQL, como InfluxDB o Elasticsearch. Estas bases de datos de serie temporal ofrecen almacenamiento de datos masivo con un rendimiento rápido durante las consultas. En su mayoría, están reservadas para aplicaciones empresariales grandes y son mucho más difíciles de implementar. Una base de datos NoSQL mal configurada puede impedir el rendimiento durante el procesamiento de las consultas.

Ventajas de las bases de datos de series temporales

Cada base de datos almacena información, pero una base de datos de series temporales se crea específicamente para los análisis basados en el tiempo. La ventaja de una base de datos de series temporales es su capacidad para almacenar grandes cantidades de datos con cada punto de datos que incluye una marca de tiempo. Como se ha creado teniendo en cuenta los grandes conjuntos de datos, una base de datos de serie temporal suele ser más rápida y mucho más eficiente para insertar nuevos registros y recuperar grandes conjuntos de datos que una base de datos tradicional.

Las bases de datos de series temporales suelen ser más precisas para las consultas que implican fechas y horas y almacenan los datos de series temporales de manera mucho más eficiente. Cualquier organización que quiera almacenar datos de supervisión se beneficiará de una base de datos de serie temporal. Las aplicaciones se benefician de una base de datos de series temporales gracias a su capacidad para recuperar grandes conjuntos de datos para analíticas, visualizaciones, tendencias financieras, información de actividad y cambios en un entorno que se producen con frecuencia durante el día a diferentes intervalos.

Desventajas de las bases de datos de series temporales

Al igual que con cualquier infraestructura avanzada, las bases de datos de series temporales son más difíciles de implementar y configurar correctamente. Como la mayoría de ellos son NoSQL, una base de datos NoSQL mal implementada sufrirá un mal rendimiento si no está optimizada. Las configuraciones exigen que alguien de la organización entienda las maneras adecuadas de optimizar la base de datos. 

Las empresas que buscan almacenar datos de series temporales necesitan los recursos para almacenar grandes cantidades de datos. Los datos pueden almacenarse en la nube, pero aumentarán los costes de TI. La infraestructura para soportar el almacenamiento de datos y el procesamiento de bases de datos de series temporales puede ser costosa.

Conclusión

Si necesita encontrar una solución mejor para los datos basados en el tiempo, una base de datos de series temporales es una buena opción. Revise los diferentes tipos de motores de bases de datos, tenga en cuenta los costes y encuentre uno que se escale con el crecimiento de la empresa y el aumento del almacenamiento de datos. Recuerde revisar las configuraciones y las opciones de optimización para asegurarse de que la base de datos se ejecuta de la manera más eficiente posible.

CONTACTAR CON NOSOTROS
¿Preguntas, comentarios?

¿Tiene alguna pregunta o comentario sobre los productos o las certificaciones de Pure?  Estamos aquí para ayudarle.

Programe una Demostración

Programe una demostración en vivo y vea personalmente cómo Pure puede ayudarle a convertir sus datos en unos resultados potentes. 

Llámenos al: +34 51 889 8963

Medios de comunicaciónpr@purestorage.com

 

Castellana 81

28046 Madrid

Oficinas Pure: 1415 y 1417 (planta 14)

info@purestorage.com

CERRAR
Your Browser Is No Longer Supported!

Older browsers often represent security risks. In order to deliver the best possible experience when using our site, please update to any of these latest browsers.