Con igiene dei dati si intende il processo per garantire che tutti i dati, strutturati e non, all'interno di database o file condivisi siano puliti, ovvero precisi, aggiornati e privi di errori. Questo processo è detto anche "pulizia dei dati" e "qualità dei dati".
In linea generale, una scarsa qualità dei dati è dovuta a:
L'igiene dei dati migliora la sicurezza, la produttività, il rispetto delle normative e dei requisiti di conformità, nonché l'efficienza. A tale scopo, garantisce che le applicazioni e i processi aziendali utilizzino soltanto dati puliti, corretti e pertinenti, e che i dati sensibili vengano rimossi quando non sono più necessari. Senza una gestione ottimale dei dati, le informazioni disponibili saranno sommarie e incomplete con ricadute sulle attività aziendali e sul processo decisionale.
Ecco alcuni esempi di problemi, derivati da una scarsa qualità dei dati, che le organizzazioni possono trovarsi ad affrontare.
Vendite e Marketing
Secondo uno studio di DiscoverOrg, i reparti Vendite e Marketing hanno perso circa 550 ore e $ 32.000 per agente a causa dell'uso di dati errati.
Per i reparti di marketing, questi dati errati possono portare a un eccesso di spesa. Oppure, possono infastidire e allontanare i potenziali clienti. Questo può succedere quando si inviano le stesse comunicazioni commerciali più volte a causa di dati duplicati (es. record duplicati con lo stesso nome ma con qualche variante all'interno dello stesso database).
Nelle vendite online, una scarsa igiene dei dati può portare a proporre il prodotto sbagliato alla persona sbagliata, specialmente quando non sono disponibili dati sui prodotti e sul target di riferimento.
Finanza
Nei report finanziari, i dati di cattiva qualità e incoerenti possono restituire risposte diverse alle stesse domande. Di conseguenza, i report risultano imprecisi e fuorvianti e potrebbero dare un falsa impressione di sicurezza o incertezza finanziaria.
Supply chain
I dati di cattiva qualità possono interrompere le supply chain, perché diventa molto difficile automatizzare i processi se le decisioni si basano su informazioni inaffidabili.
Obiettivi aziendali globali
A livello aziendale, i problemi di qualità dei dati possono incidere enormemente sulla capacità di raggiungere gli obiettivi a lungo termine. In particolare possono causare:
Per quanto sia importante, le aziende fanno fatica a curare una buona igiene dei dati. Secondo uno studio pubblicato dalla Harvard Business Review, in media, il 47% dei nuovi record di dati presenta almeno un errore critico (es. che influisce sul lavoro) e soltanto il 3% dei punteggi sulla qualità dei dati è "accettabile" in base a standard molto blandi.
L'igiene dei dati può essere difficoltosa per vari fattori, tra cui:
Sebbene gli standard sulla qualità dei dati non siano ancora definitivi, è possibile seguire determinate best practices di igiene per garantire una qualità ottimale dei dati, ora e in futuro.
Queste includono:
L'audit dei dati è essenziale per mantenere una buona igiene e di solito è il primo passo in ogni processo di pulizia dei dati. Prima di intraprendere qualunque azione, è necessario valutare la qualità dei dati e fissare una base di partenza realistica per l'igiene dei dati aziendali. Un tipico processo di audit implica un attento esame dell'infrastruttura e dei processi IT per capire dove si trovano i dati, come vengono utilizzati e con quale frequenza vengono aggiornati.
È importante definire dei criteri sui tipi di dati raccolti e sui motivi, specialmente se sono dati personali dei consumatori, nonché consolidare le procedure di conservazione e rimozione dei dati. I periodi di conservazione indicano per quanto tempo i dati restano memorizzati in un sistema prima di essere eliminati definitivamente. Con una buona igiene è possibile sapere quali dati sono memorizzati, perché, dove e quando devono essere rimossi. Scopri di più sulle best practices di conformità dei dati.
Con governance dei dati si intende un insieme di processi, ruoli, criteri, standard e metriche per garantire un uso efficiente ed efficace dei dati in modo che un'organizzazione possa raggiungere i propri obiettivi. La governance dei dati stabilisce chi può agire, quali azioni può svolgere, su quali dati, in quali situazioni e con quali metodi. Una buona governance è essenziale per garantire una qualità ottimale dei dati in tutta l'organizzazione.
Infine, anche l'automazione dei processi correlati alla qualità dei dati può contribuire a una buona igiene. Aggiornare automaticamente i dati il più spesso possibile è un modo per garantire che siano sempre attuali e corretti. Un altro modo consiste nell'uso di sistemi di pulizia dei dati che possono vagliare grandi moli di dati e utilizzare algoritmi per rilevare le anomalie e identificare i valori erratici dovuti a errore umano. Questi sistemi possono anche cercare nei database se sono presenti record duplicati.
Si possono usare diversi aggettivi per descrivere la qualità dei dati. I dati di alta qualità sono:
Se i dati rispettano tutti questi attributi, un'azienda, i suoi sistemi e le sue applicazioni potranno basarsi sulle migliori informazioni possibili per offrire un'assistenza, un'esperienza del cliente e risultati mirati.
La deduplica dei dati, o semplicemente deduplica, è il processo che consente di eliminare le copie duplicate dei dati da un volume di storage o dall'intero sistema di storage (deduplica tra più volumi). Questo processo utilizza il riconoscimento dei pattern per identificare i dati ridondanti e sostituirli con riferimenti di una singola copia salvata. Purity Reduce di Pure Storage utilizza cinque tecnologie diverse di data reduction per una gestione ottimale dello spazio negli array all-flash. Leggi qui per maggiori informazioni.
Hai domande o commenti sui prodotti o sulle certificazioni di Pure? Siamo qui per aiutarti.
Prenota una demo per vedere come puoi trasformare i tuoi dati in risultati concreti con Pure.
Telefono: +39 02 9475 9422
Media: pr@purestorage.com
Pure Storage Italia
Spaces c/o Bastioni di Porta Nuova, 21
Milano, 20121