Skip to Content
Dismiss
Innovación
Una plataforma construida para la IA

Unificado, automatizado y listo para convertir los datos en inteligencia.

Averigüe cómo
Dismiss
16-18 juni, Las Vegas
Pure//Accelerate® 2026

Ontdek hoe u de ware waarde van uw gegevens kunt ontsluiten. 

Schrijf u nu in

¿Qué es el linaje de datos?

Cuando tiene varios procesos de datos, debe saber de dónde provienen los datos, qué pasos se tomaron para transformarlos y dónde se almacenan. Contar con una solución de seguimiento de linaje de datos proporciona una mejor protección de los datos y ayuda a las empresas a realizar un seguimiento de los cambios en los datos sensibles. La mayoría de las empresas utilizan la documentación para detallar los procesos de datos y el linaje de datos, pero las herramientas de software facilitan el monitoreo y la documentación de los cambios en sus datos.

¿Qué es el linaje de datos?

El linaje de datos generalmente se presenta en forma de documentación que se utiliza para administrar mejor los datos y los cambios que se realizan. El lugar donde se almacenan los datos también se documenta para que las empresas sepan que los datos se almacenan de una manera que cumple con las reglamentaciones locales. En un proceso de datos empresariales, los datos sin procesar pueden extraerse de varias fuentes (p. ej., sitios web y archivos internos planos) y transformarse para almacenarlos en una base de datos estructurada o una base de datos no estructurada para el análisis de datos. La documentación del linaje de datos detalla dónde se extraen los datos y los cambios realizados.

Documentar los cambios de datos, las fuentes y la ubicación de almacenamiento final garantiza que las tuberías funcionen según lo esperado y que cualquier error pueda corregirse más rápidamente. Por ejemplo, la fuente de datos puede cambiar su estructura, por lo que el proceso de datos realiza cambios en un número de teléfono donde se almacenan números incorrectos en el destino final. Tener documentación de linaje de datos ayuda a los desarrolladores a identificar más rápidamente dónde se producen los errores.

Beneficios del linaje de datos

Los datos sensibles deben almacenarse utilizando ciertos estándares de seguridad. El registro debe realizarse en el acceso a datos. Un documento de linaje de datos garantiza mejores resultados para el cumplimiento y se puede usar durante cualquier procedimiento de auditoría. El cumplimiento es solo un beneficio importante del linaje de datos.

Documentar las etapas de la transformación de datos, la extracción de fuentes y el destino final del almacenamiento también hace que la resolución de problemas sea más eficiente. Cuando los desarrolladores conocen cada paso en la transformación de datos, pueden validar el código e identificar cualquier error más rápidamente. Cuando los datos se utilizan en aplicaciones orientadas al cliente, los desarrolladores pueden identificar más rápidamente dónde se almacenan los datos. Cualquier integración de datos es más eficiente, y contar con documentación para el linaje de datos reduce los riesgos de perder la integridad de los datos durante el desarrollo de la aplicación.

Implementación del linaje de datos

Puede parecer un proyecto fácil, pero implementar el linaje de datos puede ser un desafío masivo para las aplicaciones de nivel empresarial. Cada parte interesada debe estar involucrada y puede llevar meses recopilar toda la información necesaria para documentar el linaje de datos. Estos son los pasos básicos para el proceso de linaje de datos:

  1. Hable con las partes interesadas para comprender la aplicación utilizada para su función laboral.
  2. Analice las fuentes de datos de las aplicaciones con los desarrolladores.
  3. Determine los metadatos de su catálogo de datos.
  4. Cree un catálogo de datos con metadatos .
  5. Defina el nuevo seguimiento del linaje de datos.
  6. Procedimientos de seguimiento de documentos.
  7. Establezca una gobernanza sobre los cambios de datos futuros para garantizar que la documentación se mantenga actualizada.
  8. Analice los cambios con las partes interesadas.
  9. Monitoree el seguimiento del linaje de datos y cámbielo cuando sea necesario.

El descubrimiento de datos y el seguimiento de cambios es un desafío masivo, pero puede trabajar con herramientas para facilitar el proceso. Algunas herramientas lo ayudan a crear un catálogo de datos y otras descubren fuentes de datos. Lo que utilice depende de su proceso y de lo que desee lograr. Estas son algunas herramientas para comenzar:

  • Linaje de datos de Collibra: Encuentre automáticamente las fuentes de datos y asigne el flujo de trabajo desde las fuentes hasta el destino de almacenamiento final.
  • Octopai: Administre su catálogo de datos y los metadatos asignados a cada fuente de datos.
  • Atlán : Mapee los procesos de datos y asegúrese de que las ubicaciones de almacenamiento y el proceso de proceso de procesos cumplan con los requisitos regulatorios para el cumplimiento.

Mejores prácticas para el linaje de datos

Si su proceso de linaje de datos se descompone, podría perder el seguimiento de las fuentes de datos, posiblemente trabajar con datos confidenciales sin cumplir con los requisitos o perder datos cuando sus tuberías ya no funcionen correctamente. Para evitar la pérdida de datos o las costosas violaciones de cumplimiento, puede seguir algunas de las mejores prácticas para los procedimientos de linaje de datos. Estas son algunas maneras de mantener su linaje de datos y sus procesos seguros y documentados:

  • Actualice la documentación cuando haya cambios en sus procesos, destino o fuentes.
  • Audite y registre las versiones de la documentación con información sobre quién la cambió y cuándo.
  • Use la automatización para acelerar la entrega y reducir los riesgos de supervisión.
  • Desarrolle una convención de nomenclatura que se mantenga uniforme en toda su documentación.
  • Clasifique a las personas responsables de los datos y las aplicaciones que usan los datos.
  • Revise la documentación anualmente para asegurarse de que siga siendo precisa.

Desafíos y soluciones

El linaje de datos es una forma de auditoría y, al igual que con cualquier proyecto de auditoría, puede tener desafíos. El mayor desafío para la mayoría de los auditores es encontrar fuentes de datos y mapear procesos a destinos de datos. En un entorno empresarial, es posible tener cientos de fuentes de datos. La transformación de los datos podría tomar varios pasos, y los datos podrían enviarse a bases de datos en el sitio o en la nube. Puede ser difícil localizar los datos a medida que se mueven por el proceso de datos. Las herramientas de descubrimiento con inteligencia artificial ayudan con este desafío, y los desarrolladores de procesos de datos pueden ayudar con las preguntas de transformación.

Los desarrolladores y administradores de bases de datos a menudo realizan cambios sin documentarlos. Sin actualizaciones, la documentación del linaje de datos se vuelve obsoleta. Es difícil para los auditores y administradores garantizar que la documentación del linaje de datos se mantenga actualizada con los cambios en los procesos de datos. Trabajar con las partes interesadas y crear políticas que requieran documentación de los desarrolladores ayuda a reducir este riesgo. Además, se pueden usar herramientas para ayudar a automatizar los cambios y enviar alertas cuando se realizan cambios en el proceso de datos.

Conclusiones

Para el cumplimiento y una transición más fluida cuando cambia los procesos de datos, un proceso de linaje de datos puede documentar cada fuente, destino y transformación que afecta los datos. Se realiza un seguimiento de los datos confidenciales para que los controles de almacenamiento y acceso cumplan con los requisitos de cumplimiento. Puede aprovechar el almacenamiento unificado de Pure Storage para ayudar con la escalabilidad y una mejor documentación de sus datos.

Buscar recursos y eventos clave

FERIA COMERCIAL
Pure//Accelerate® 2026
June 16-18, 2026 | Resorts World Las Vegas

Prepárese para el evento más valioso al que asistirá este año.

Regístrese ahora
DEMOSTRACIONES DE PURE360
Explore, aprenda y experimente Everpure.

Acceda a videos y demostraciones según demanda para ver lo que Everpure puede hacer.

Mire las demostraciones
VIDEO
Vea: El valor de una Enterprise Data Cloud.

Charlie Giancarlo explica por qué la administración de datos, no el almacenamiento, es el futuro. Descubra cómo un enfoque unificado transforma las operaciones de TI de una empresa.

Mirar ahora
RECURSO
El almacenamiento heredado no puede impulsar el futuro.

Las cargas de trabajo modernas exigen velocidad, seguridad y escalabilidad listas para la AI. ¿Su pila está lista?

Realizar la evaluación
¡Su navegador ya no es compatible!

Los navegadores más antiguos a menudo representan riesgos de seguridad. Para brindar la mejor experiencia posible al utilizar nuestro sitio, actualice a cualquiera de estos navegadores más recientes.

Personalize for Me
Steps Complete!
1
2
3
Personalize your Everpure experience
Select a challenge, or skip and build your own use case.
Estrategias de virtualización preparadas para el futuro

Opciones de almacenamiento para todas sus necesidades

Habilite proyectos de IA a cualquier escala.

Almacenamiento de alto rendimiento para procesamiento, capacitación e inferencia de datos

Protección contra la pérdida de datos

Soluciones de ciberresiliencia que protegen sus datos

Reduzca el costo de las operaciones en la nube

Almacenamiento rentable para Azure, AWS y nubes privadas

Acelere el rendimiento de las aplicaciones y las bases de datos

Almacenamiento de baja latencia para el rendimiento de las aplicaciones

Reduzca el consumo de energía y el espacio utilizado por los centros de datos

Almacenamiento eficiente en recursos para mejorar el uso de los centros de datos.

Confirm your outcome priorities
Your scenario prioritizes the selected outcomes. You can modify or choose next to confirm.
Primary
Reduce My Storage Costs
Lower hardware and operational spend.
Primary
Strengthen Cyber Resilience
Detect, protect against, and recover from ransomware.
Primary
Simplify Governance and Compliance
Easy-to-use policy rules, settings, and templates.
Primary
Deliver Workflow Automation
Eliminate error-prone manual tasks.
Primary
Use Less Power and Space
Smaller footprint, lower power consumption.
Primary
Boost Performance and Scale
Predictability and low latency at any size.
What’s your role and industry?
We've inferred your role based on your scenario. Modify or confirm and select your industry.
Select your industry
Financial services
Government
Healthcare
Education
Telecommunications
Automotive
Hyperscaler
Electronic design automation
Retail
Service provider
Transportation
Which team are you on?
Technical leadership team
Defines the strategy and the decision making process
Infrastructure and Ops team
Manages IT infrastructure operations and the technical evaluations
Business leadership team
Responsible for achieving business outcomes
Security team
Owns the policies for security, incident management, and recovery
Application team
Owns the business applications and application SLAs
Describe your ideal environment
Tell us about your infrastructure and workload needs. We chose a few based on your scenario.
Select your preferred deployment
Hosted
Dedicated off-prem
On-prem
Your data center + edge
Public cloud
Public cloud only
Hybrid
Mix of on-prem and cloud
Select the workloads you need
Databases
Oracle, SQL Server, SAP HANA, open-source

Key benefits:

  • Instant, space-efficient snapshots

  • Near-zero-RPO protection and rapid restore

  • Consistent, low-latency performance

 

AI/ML and analytics
Training, inference, data lakes, HPC

Key benefits:

  • Predictable throughput for faster training and ingest

  • One data layer for pipelines from ingest to serve

  • Optimized GPU utilization and scale
Data protection and recovery
Backups, disaster recovery, and ransomware-safe restore

Key benefits:

  • Immutable snapshots and isolated recovery points

  • Clean, rapid restore with SafeMode™

  • Detection and policy-driven response

 

Containers and Kubernetes
Kubernetes, containers, microservices

Key benefits:

  • Reliable, persistent volumes for stateful apps

  • Fast, space-efficient clones for CI/CD

  • Multi-cloud portability and consistent ops
Cloud
AWS, Azure

Key benefits:

  • Consistent data services across clouds

  • Simple mobility for apps and datasets

  • Flexible, pay-as-you-use economics

 

Virtualization
VMs, vSphere, VCF, vSAN replacement

Key benefits:

  • Higher VM density with predictable latency

  • Non-disruptive, always-on upgrades

  • Fast ransomware recovery with SafeMode™

 

Data storage
Block, file, and object

Key benefits:

  • Consolidate workloads on one platform

  • Unified services, policy, and governance

  • Eliminate silos and redundant copies

 

What other vendors are you considering or using?
Thinking...
Your personalized, guided path
Get started with resources based on your selections.