Skip to Content
La Guía para principiantes sobre macrodatos

Datos estructurados frente a Datos no estructurados

En la última década, nuestra definición y comprensión de los datos ha cambiado drásticamente, impulsada en parte por la creciente disponibilidad de nuevas herramientas para leer, almacenar y analizar datos no estructurados.

En el pasado, los datos no estructurados a menudo se infrautilizaban, dada la dificultad asociada a su interpretación. Estas nuevas tecnologías han hecho que sea más fácil no solo entender los datos no estructurados, sino que también han extraído información valiosa de este tesoro oculto de información.

Según IDC , el volumen total de datos creados, capturados, copiados y consumidos en todo el mundo en 2024 superará los 149 zettabytes cada año —y gran parte de ellos no estarán estructurados—. Todas las organizaciones se beneficiarán de la creación de capacidades de análisis de datos no estructurados. El primer paso en este camino es simplemente entender qué son los datos estructurados frente a los datos no estructurados.

Aquí tiene un breve resumen de la diferencia entre los dos, con explicaciones más detalladas a continuación:

Característica

Datos estructurados

Datos no estructurados

Naturaleza de los datos

Normalmente cuantitativo

Normalmente cualitativo

Modelo de datos

Predefinido; una vez definido y guardados algunos datos, es difícil cambiar el modelo.

No hay ningún esquema concreto implicado en los datos no estructurados; el modelo de datos es muy flexible

Formato de datos

Hay un número limitado de formatos de datos disponibles

Hay una gran variedad de formatos de datos disponibles para los datos no estructurados.

Base de datos

Se utilizan bases de datos relacionales basadas en SQL.

Se utilizan bases de datos NoSQL sin esquema específico.

Buscar

Muy fácil de buscar y encontrar datos en la base de datos o el conjunto de datos

Es muy difícil buscar datos concretos debido a su naturaleza no estructurada.

Análisis

Muy fácil de analizar, dada la naturaleza cuantitativa de los datos

Es muy difícil de analizar, incluso con las herramientas de software existentes.

Método de almacenamiento

Los almacenes de datos se utilizan para los datos estructurados

Los lagos de datos se utilizan para almacenar datos no estructurados.

Slide

¿Qué son los datos estructurados?

Los datos estructurados tienen un esquema bien definido para la información que contienen. Para proporcionar una definición muy sencilla, cualquier dato que pueda presentarse en un programa de hoja de cálculo como Google Sheets o Microsoft Excel son datos estructurados.

En este ejemplo, los datos pueden representarse como filas y columnas. Cada columna representa un atributo diferente, mientras que cada fila tendrá los datos asociados con el atributo para una sola instancia. Las filas y las columnas forman una tabla a la que se puede hacer referencia fácilmente.

Pueden conectarse diferentes tablas, es decir, puede decirse que están relacionadas por la columna común presente en ambas tablas.

Si hay varias tablas relacionadas en sucesión y combinación, esto crea una base de datos relacional. Por ejemplo, los datos de cliente, ventas e inventario de un almacén pueden considerarse datos estructurados almacenados como una base de datos relacional.

  • Cada cliente tendrá un ID de cliente, así como campos para su nombre, número de contacto, información de la tarjeta de crédito, dirección, etc.
  • La base de datos de clientes se puede conectar a la base de datos de ventas, con atributos que incluyen el momento de la compra, los códigos de artículo comprados, el importe total gastado, la identificación del cliente, etc. Ambas tablas se conectarán con el atributo común de ID de cliente.
  • Por último, la base de datos de ventas puede conectarse a la base de datos del inventario usando el atributo común del código de artículo, interconectando efectivamente las tres tablas en una base de datos relacional.

Los datos estructurados como este suelen almacenarse en sistemas de gestión de bases de datos relacionales (RDBMS). Las bases de datos pueden escribirse, leerse y manipularse usando el Lenguaje de consulta estructurado (SQL), un lenguaje desarrollado por IBM en la década de 1970 para soportar sus bases de datos mainframe (aunque inicialmente se conocía como Lenguaje de consulta inglés de secuencia o SEQUEL). Se llama así, ya que se lee casi como el inglés. SQL en su forma actual fue popularizado por Relational Software, Inc. (ahora llamado Oracle ).

¿Qué son los datos no estructurados?

Cada dato que no sea estructurado puede clasificarse como datos no estructurados. Se calcula que en 2025, el 80% de los datos que encontramos serán datos no estructurados en forma de texto, audio, imagen o vídeo1.

En resumen, los datos no estructurados son datos modernos. A menudo:

  • Nacido digital e impredecible
  • Siempre creado y en movimiento
  • Combinado, multimodal e interoperable
  • Geodistribuido para una mejor protección

Los datos no estructurados pueden tener algunos metadatos asociados que, a su vez, pueden tener una estructura. Por ejemplo, un vídeo puede tener metadatos de resolución de vídeo, tasa de bits, fotogramas por segundo (FPS), propietario del vídeo, etc. Pero el vídeo en sí mismo no está estructurado. Cuando hay algunos metadatos estructurados asociados con los datos no estructurados, en ocasiones se los conoce como datos semiestructurados.

Si observamos más detenidamente el ejemplo de un vídeo de YouTube, hay algunos metadatos presentes, como la hora de la carga, la fecha de la carga, el número de vistas (parciales o completas), el número de "me gusta" y "no me gusta", etc. Pero el contenido del título del vídeo, la descripción del vídeo y el propio vídeo no están estructurados. Tiene un aspecto cualitativo que no puede capturarse únicamente con números.

La base de datos más utilizada para los datos no estructurados es NoSQL. NoSQL significa “no solo SQL”, lo que indica que la base de datos puede manejar una gama más amplia de datos más allá de las capacidades de las bases de datos SQL. No hay esquema o estructura tabular para las bases de datos NoSQL; es solo una colección de datos agrupados.

 

Almacenamiento de datos no estructurados con UFFO

Dicho esto, aunque los datos no estructurados pueden proporcionar una información significativa con un enorme potencial transformador, hay problemas para resolverlos. La solución de almacenamiento UFFO avanzada de Pure, FlashBlade FlashBlade® de Pure Storage®, ofrece la velocidad asociada con la tecnología de almacenamiento flash, así como la capacidad de escalar cualquier arquitectura de una manera ágil. ¿Quiere echar un vistazo más de cerca? Pure ofrece una prueba gratuita de FlashBlade de Pure para que pueda probar la solución sin compromiso.

Productos y Soluciones Relacionados

Solución
Analítica de Datos

1https://www.cio.com/article/3406806/ai-unleashes-the-power-of-unstructured-data.html

09/2024
Maximizing SAP HANA Performance and Reliability with Pure Storage
A reference architecture for SAP bundled application suites on SAP HANA with Pure Storage.
Arquitectura de referencia
28 páginas
CONTACTAR CON NOSOTROS
¿Preguntas, comentarios?

¿Tiene alguna pregunta o comentario sobre los productos o las certificaciones de Pure?  Estamos aquí para ayudarle.

Programe una Demostración

Programe una demostración en vivo y vea personalmente cómo Pure puede ayudarle a convertir sus datos en unos resultados potentes. 

Llámenos al: +34 51 889 8963

Medios de comunicaciónpr@purestorage.com

 

Castellana 81

28046 Madrid

Oficinas Pure: 1415 y 1417 (planta 14)

info@purestorage.com

CERRAR
Your Browser Is No Longer Supported!

Older browsers often represent security risks. In order to deliver the best possible experience when using our site, please update to any of these latest browsers.