La
déduplication est un procédé utilisé pour éliminer les données redondantes.
Durant le processus, le disque dur d'un ordinateur est scanné pour de grandes
séquences de données à travers les fenêtres de comparaison. Lors de la
numérisation des données en double, les séquences de huit kilo-octets ou plus
sont habituellement choisi. Si la séquence se trouve ailleurs sur le système de
stockage, le fichier dupliqué est référencé plutôt que stockées de nouveau.
Un succès déduplication permet
d'éliminer plusieurs kilo-octets de données sur un ordinateur, ce qui conduit à
des avantages évidents. Duplication des données prend de la place nécessaire
dans le système, et lorsque des données non pertinentes est supprimée, ce qui
laisse à l'utilisateur de l'espace de stockage sur l'ordinateur. Cela permettra
au système de fonctionner plus rapidement et plus efficacement, car il n'est
pas s'enliser avec les données supplémentaires. En outre, l'amélioration de la
bande passante est toujours plus perceptible quand un ordinateur a plus d'espace
libre.
La déduplication implique référence à
la grande quantité de données pour le premier emplacement et de suppression des
copies supplémentaires des données, qui sont, cependant, indexé au cas où ils
devraient être nécessaires. Souvent, les mêmes données exactes peuvent être stockées
dans pas moins de 100 endroits différents sur un disque dur. Si chacun prend un
méga-octet d'espace, la déduplication réduit cet espace sur le disque dur de
100 Mo à une seule. Le processus fonctionne en archivant les données, et
l'espace supplémentaire qui est à gagner est très bénéfique pour le disque dur
d'un ordinateur.
Les autres avantages de la
déduplication comprennent la réduction de la quantité de back-up espace requis
par autant que 90 pour cent, la réduction des coûts comme l'énergie, l'espace
et les besoins en refroidissement, la restauration d'un niveau de service
supérieur, ce qui élimine beaucoup de différents types d'erreurs et la
récupération de données à plusieurs différents points. Un inconvénient de déduplication
est qu'elle identifie les données en double en utilisant fonctions de hachage
cryptographiques, qui peuvent être peu fiables, et une collision ou un autre
type d'erreur se traduirait par la perte de données. En outre, si la personne
qui a autorisé la procédure n'est pas au courant de la réduction de redondance
impliquée, la fiabilité de l'ordinateur peut être affectée.
La déduplication des données consiste
tout d'abord la segmentation de chaque morceau de données qui sont traitées.
Chaque segment est identifié et comparé à des données qui sont déjà dans le
système. Si la donnée est unique, elle est stockée sur un disque. Si c'est un
morceau duplicata de données, une référence est créée à la place. La
déduplication peut être implémentée en utilisant un logiciel appelé Data
Domain, qui travaille avec des données et des systèmes de stockage de filtrer à
travers les données, référencement, l'élimination ou le stockage de chaque
octet, le cas échéant.
Rédigé par: Rachel Burkot
Edité par: Bronwyn Harris