資料衛生是確保資料庫或檔案分享內所有結構化或非結構化資料都“乾淨”的作法,這意味著資料準確、最新、無錯誤。資料衛生又稱為“資料清潔度”和“資料品質”。
總體而言,資料品質不佳來自於:
資料衛生可推動安全性、生產力、法規與合規性遵從性,以及效率。其作法是確保您的應用程式和業務流程僅使用乾淨、正確且相關的資料,包括移除不再需要的敏感個人資料。如果沒有良好的資料做法,您會追蹤線索和麵包屑,直到死去和做出錯誤決定。
以下是一些品質不佳的資料在組織中可能造成的問題範例。
銷售與行銷
DiscoverOrg 的一項研究發現,銷售與行銷部門損失了約 550 小時,每位銷售代表使用不良資料損失了高達 32,000 美元。
在行銷方面,不良資料可能導致超支。如果由於資料重複而多次收到相同的內容,也可能讓潛在客戶感到煩惱,甚至驅逐他們(亦即,相同名稱的重複記錄在同一個資料庫中拼寫有點不同)。
在線上銷售中,如果缺乏產品與目標對象的資料,資料衛生狀況不佳可能導致您嘗試將錯誤的產品銷售給錯誤的客戶。
金融
在財務報告中,由於資料不一致,不良資料可能會給您不同答案,導致不準確和誤導性的財務報告。這些報告可能會給您帶來錯誤的金融安全感,或是令人擔憂的金融不安全感。
供應鏈
不良資料也會嚴重影響供應鏈,因為如果這些流程決策是基於不可靠的位置資訊,就很難將流程自動化。
整體企業目標
在企業層面上,資料品質問題會大幅影響您達成長期目標的能力。它們可能導致:
與良好的資料衛生一樣重要,許多公司都努力維持資料的品質。根據哈佛商業評論所發表的一項研究,平均而言,47% 的新建立資料記錄至少有一項重大(例如影響工作)錯誤,而只有 3% 的資料品質分數是以最寬鬆的標準評為“可接受”。
各種因素都可能使您難以優化資料衛生。包括:
雖然資料品質標準仍在成熟中,但您現在仍能採取某些已確立的資料衛生最佳實務,以確保您的資料品質維持高水準。
最佳作法包括:
資料稽核是維持良好資料衛生的關鍵,通常是任何資料清理流程的第一步。在採取任何行動之前,您需要評估資料的品質,並建立公司資料衛生的真實基準。典型的資料稽核包括仔細檢視您的 IT 基礎架構和流程,以了解您的資料的居住地、使用方式,以及更新頻率。
定義蒐集哪些資料及其原因的相關政策至關重要,尤其是如果資料來自消費者。這包括強化資料保留與移除政策。保留時程規定資料在清除前儲存在系統上的時間。衛生是指了解您要儲存哪些資料、為何儲存、在何處儲存,以及何時需要清除資料。深入了解資料法規遵循的最佳做法。
資料治理是一系列流程、角色、政策、標準和指標的集合,確保有效和高效地使用資訊,使組織能夠實現其目標。資料治理定義了誰可以採取什麼行動、對什麼資料、在什麼情況下,以及使用什麼方法。良好的資料管理對於確保整個組織的高品質資料至關重要。
最後,實現資料品質相關流程的自動化,是實現良好資料衛生的基礎。這主要意味著盡可能頻繁地自動更新您的資料,以確保資料始終是最新且正確的。資料清理系統可篩選大量資料,並使用演算法偵測異常,並找出人為錯誤造成的異常值。他們也可以刷洗您的資料庫,以取得重複記錄。
資料品質包含多項屬性。高品質資料是:
如果您的資料符合所有這些標準,您的系統和應用程式將盡可能提供最佳資訊,以推動更好的客戶服務、更好的客戶體驗和更好的業務成果。
重複資料刪除也稱為重複資料刪除,是消除儲存磁碟區或整個儲存系統(跨磁碟區去重複)內重複資料副本的過程。去重複化使用重複排列識別技術辨認出冗餘資料,並將其以同一個已存檔副本之參考資料替代。有了 Purity,Pure Storage 使用五種不同的資料減量技術來節省全快閃陣列的空間。在這裡瞭解更多資訊。