Le nettoyage des données, aussi connu comme le nettoyage de données, est le processus de veiller à ce qu'un ensemble de données sont correctes et précises. Durant ce processus, les dossiers sont en vérifier l'exactitude et la cohérence, et ils sont soit corrigées ou supprimées au besoin. Cela peut se produire au sein d'un seul ensemble de dossiers ou entre plusieurs jeux de données qui doivent être fusionnées ou qui vont travailler ensemble.
Processus simple
Dans sa forme la plus simple, le nettoyage des données implique une ou plusieurs personnes de lecture à travers un ensemble de dossiers et vérifier leur exactitude. Fautes de frappe et d'orthographe sont corrigées, les données sont mal étiquetés correctement étiquetés et classés, et les entrées incomplètes ou manquantes sont terminées. Ces opérations purgent souvent out-of-date ou dossiers irrécouvrables afin qu'ils ne prennent pas de place et causent des opérations inefficaces.
Processus complexe
Dans les opérations plus complexes, le nettoyage des données peut être réalisé par des programmes informatiques. Ces programmes peuvent vérifier les données avec une variété de règles et procédures décidées par l'utilisateur. Un programme peut être configuré pour supprimer tous les enregistrements qui n'ont pas été mises à jour au cours des cinq années précédentes, corriger les mots mal orthographiés et de suppression des copies. Un programme plus complexe pourrait être en mesure de remplir dans une ville manquant baser sur un code postal correct ou modifier les prix de tous les articles dans une base de données à un autre type de monnaie.
Le nettoyage des données est très important pour l'efficacité de toute entreprise dépend des données. Si certains des clients au sein d'une base de données n'ont pas de numéro de téléphones précis, par exemple, les employés ne peuvent pas facilement communiquer avec eux. Si les adresses e-mail d'un client ne sont pas formatées correctement, comme autre exemple, un système de messagerie automatisé serait incapable d'envoyer les derniers coupons et des offres spéciales. Le travail de nettoyage des données est de s'assurer que les données contenues dans un système est correct, alors que le système est capable d'utiliser les données. Dossiers inexactes ou incomplètes ne sont pas très utiles à personne.
Lorsque deux systèmes de données doivent travailler ensemble, le nettoyage des données est encore plus important. Si une entreprise a deux branches qui travaillent avec bon nombre des mêmes clients, non seulement les données de chaque branche doivent être complètes et exactes, les deux branches doivent également avoir des données correspondantes. Lorsqu'un client met à jour son numéro de téléphone avec une branche, les données sur l'autre branche doit être mis à jour avec les mêmes informations pour assurer la plus grande efficacité. Le nettoyage des données ne fonctionne pas seulement pour s'assurer que les données sont exactes mais aussi qu'il est compatible entre les différents dossiers.
Chaque fois que beaucoup de données sont stockées, les erreurs sont tenues de se glisser dans le système. Le but du nettoyage des données est de minimiser ces erreurs et de rendre les données aussi utile et aussi significative que possible. Sans ce processus se fait régulièrement, des erreurs et des erreurs peuvent s'additionner, conduisant à un travail moins efficace et plus de complications.