L’hygiène des données est une pratique consistant à s’assurer que les données structurées et non structurées dans les bases de données ou partages de fichiers sont « propres », c’est-à-dire fiables, à jour et exemptes d’erreurs. Les termes de « propreté des données » ou de « qualité des données » font également référence à l’hygiène des données.
En général, lorsque les données sont de mauvaise qualité, plusieurs facteurs entrent en ligne de compte :
L’hygiène des données favorise la sécurité, la productivité, le respect de la réglementation et de la conformité, ainsi que l’efficacité. Pour cela, vos applications et vos processus professionnels ne doivent utiliser que des données propres, correctes et pertinentes, ce qui passe par la suppression des données personnelles sensibles devenues inutiles. Sans de bonnes pratiques en matière de données, vous ne ferez que suivre des indices et des miettes de pain qui vous mèneront à des impasses et vous feront prendre de mauvaises décisions.
Voici quelques exemples de problèmes que les données de mauvaise qualité peuvent créer dans les organisations.
Vente et marketing
Une étude réalisée par DiscoverOrg a révélé que les services de vente et de marketing perdent environ 550 heures et jusqu’à 32 000 $ par représentant commercial en raison de l’utilisation de données incorrectes.
Dans le domaine du marketing, elles peuvent entraîner des dépenses excessives. Les prospects peuvent également être gênés ou fuir en recevant le même contenu plusieurs fois en raison de la duplication des données (c’est ce qu’il se produit lorsque la même base de données contient plusieurs enregistrements avec le même nom orthographié de manière un peu différente).
Dans le cas des ventes en ligne, une mauvaise hygiène des données peut vous pousser à vendre le mauvais produit au mauvais client si vous manquez de données sur vos produits et vos publics cibles.
Finance
Dans le domaine du reporting financier, vous pouvez obtenir plusieurs réponses à la même question en raison de l’incohérence des données, vos rapports seront alors inexacts et trompeurs. Ils pourraient vous donner un faux sentiment de sécurité ou, au contraire, un sentiment alarmant d’insécurité financière.
Chaîne logistique
Les données incorrectes peuvent également avoir de lourdes conséquences dans les chaînes logistiques, car il est très difficile d’automatiser les processus si les décisions sont basées sur des informations de localisation peu fiables.
Objectifs généraux de l’entreprise
Au niveau de l’entreprise, les problèmes liés à la qualité des données peuvent avoir un impact significatif sur votre capacité à atteindre vos objectifs à long terme. Ils peuvent :
Si l’importance d’une bonne hygiène des données ne fait aucun doute, de nombreuses entreprises ont du mal à assurer la qualité de leurs données. Selon une étude publiée par le Harvard Business Review, en moyenne, 47 % des nouveaux enregistrements de données comportent au moins une erreur critique (c’est-à-dire ayant un impact sur le travail) et seulement 3 % des scores de qualité des données sont jugés « acceptables », en utilisant la norme la plus faible possible.
Divers facteurs peuvent freiner l’optimisation de l’hygiène des données, notamment :
Bien que les normes de qualité des données soient encore en cours de développement, il existe certaines bonnes pratiques établies en matière d’hygiène des données que vous pouvez adopter dès maintenant pour garantir et assurer durablement la qualité élevée de vos données.
Ces bonnes pratiques incluent :
Les audits sont essentiels pour maintenir une bonne hygiène des données et constituent généralement la première étape de tout processus de nettoyage. Avant de prendre des mesures, vous devez évaluer la qualité de vos données et établir un point de référence réaliste pour l’hygiène des données de votre entreprise. Un audit de données typique consiste à examiner de près votre infrastructure et vos processus informatiques pour déterminer où se trouvent vos données, comment elles sont utilisées et à quelle fréquence elles sont mises à jour.
Il est essentiel de définir des politiques concernant les données collectées et leur objectif, en particulier si ces données proviennent de consommateurs. Il s’agit notamment de consolider les politiques de conservation et de suppression des données. Les calendriers de conservation déterminent la durée pendant laquelle les données sont stockées sur un système avant d’être supprimées. Les pratiques d’hygiène consistent à savoir quelles sont les données stockées, pourquoi, où et quand elles doivent être supprimées. En savoir plus sur les bonnes pratiques en matière de conformité des données.
La gouvernance des données correspond à l’ensemble des processus, rôles, politiques, normes et indicateurs garantissant l’utilisation efficace des informations pour permettre à une organisation d’atteindre ses objectifs. La gouvernance des données définit qui peut prendre quelle mesure, sur quelles données, dans quelles situations et à l’aide de quelles méthodes. Une bonne gouvernance est essentielle pour garantir une qualité élevée des données au sein d’une organisation.
Enfin, une bonne hygiène des données passe par l’automatisation des processus liés à la qualité des données. Cela implique principalement de mettre automatiquement à jour vos données aussi fréquemment que possible, afin de garantir qu’elles sont actuelles et correctes. Les systèmes de nettoyage des données peuvent passer au crible d’importants volumes et utiliser des algorithmes pour détecter les anomalies ou identifier les valeurs aberrantes résultant d’une erreur humaine. Ils peuvent également examiner vos bases de données pour détecter les doublons dans les enregistrements.
La qualité des données dépend de plusieurs attributs. Des données de haute qualité sont :
Si vos données répondent à tous ces critères, vous, vos systèmes et vos applications disposerez des meilleures informations possibles pour améliorer le service client, l’expérience utilisateur et les résultats commerciaux.
Le processus de déduplication consiste à éliminer les doublons de données dans un volume de stockage ou dans l’ensemble d’un système de stockage (déduplication entre volumes). Il utilise la reconnaissance des schémas pour identifier les données redondantes et les remplacer par des références à une seule copie sauvegardée. Avec Purity Reduce, Pure Storage® utilise cinq technologies de réduction de données différentes pour économiser de l’espace dans ses baies 100 % flash. En savoir plus ici.
Vous avez des questions ou des commentaires concernant des produits ou certifications Pure ? Nous sommes là pour vous aider.
Planifiez une démo en direct et découvrez comment Pure peut vous aider à transformer vos données.
Tél. : +33 1 89 96 04 00
Services Médias : pr@purestorage.com
Pure Storage France
32 rue Guersant
75017 Paris