Ce que tu cherche : Qu'est-ce que la déduplication?

samedi 30 mars 2013

Qu'est-ce que la déduplication?

La déduplication est un procédé utilisé pour éliminer les données redondantes. Durant le processus, le disque dur d'un ordinateur est scanné pour de grandes séquences de données à travers les fenêtres de comparaison. Lors de la numérisation des données en double, les séquences de huit kilo-octets ou plus sont habituellement choisi. Si la séquence se trouve ailleurs sur le système de stockage, le fichier dupliqué est référencé plutôt que stockées de nouveau.

Un succès déduplication permet d'éliminer plusieurs kilo-octets de données sur un ordinateur, ce qui conduit à des avantages évidents. Duplication des données prend de la place nécessaire dans le système, et lorsque des données non pertinentes est supprimée, ce qui laisse à l'utilisateur de l'espace de stockage sur l'ordinateur. Cela permettra au système de fonctionner plus rapidement et plus efficacement, car il n'est pas s'enliser avec les données supplémentaires. En outre, l'amélioration de la bande passante est toujours plus perceptible quand un ordinateur a plus d'espace libre.

La déduplication implique référence à la grande quantité de données pour le premier emplacement et de suppression des copies supplémentaires des données, qui sont, cependant, indexé au cas où ils devraient être nécessaires. Souvent, les mêmes données exactes peuvent être stockées dans pas moins de 100 endroits différents sur un disque dur. Si chacun prend un méga-octet d'espace, la déduplication réduit cet espace sur le disque dur de 100 Mo à une seule. Le processus fonctionne en archivant les données, et l'espace supplémentaire qui est à gagner est très bénéfique pour le disque dur d'un ordinateur.

Les autres avantages de la déduplication comprennent la réduction de la quantité de back-up espace requis par autant que 90 pour cent, la réduction des coûts comme l'énergie, l'espace et les besoins en refroidissement, la restauration d'un niveau de service supérieur, ce qui élimine beaucoup de différents types d'erreurs et la récupération de données à plusieurs différents points. Un inconvénient de déduplication est qu'elle identifie les données en double en utilisant fonctions de hachage cryptographiques, qui peuvent être peu fiables, et une collision ou un autre type d'erreur se traduirait par la perte de données. En outre, si la personne qui a autorisé la procédure n'est pas au courant de la réduction de redondance impliquée, la fiabilité de l'ordinateur peut être affectée.

La déduplication des données consiste tout d'abord la segmentation de chaque morceau de données qui sont traitées. Chaque segment est identifié et comparé à des données qui sont déjà dans le système. Si la donnée est unique, elle est stockée sur un disque. Si c'est un morceau duplicata de données, une référence est créée à la place. La déduplication peut être implémentée en utilisant un logiciel appelé Data Domain, qui travaille avec des données et des systèmes de stockage de filtrer à travers les données, référencement, l'élimination ou le stockage de chaque octet, le cas échéant.

Rédigé par: Rachel Burkot

Edité par: Bronwyn Harris

Ce que tu cherche

samedi 30 mars 2013

Qu'est-ce que la déduplication?

Libellés

Articles les plus consultés

Archives du blog