La déformation temporelle dynamique (DTW) implique une méthode de calcul, appelé un algorithme, de comparer des sons, des vidéos et des graphiques qui peuvent être similaires, mais les échantillons qui peuvent avoir des différences subtiles. Les calculs généralement formuler une représentation linéaire de l'échantillon et de mesurer les différences en fonction du temps. Les différents éléments d'un échantillon peut être mappé sur une grille pour identifier les similitudes, tandis que les commandes pour les fonctions utilisent souvent des symboles pour identifier chaque variable. La reconnaissance vocale, par exemple, utilise parfois dilatation temporelle dynamique pour faire correspondre des mots, même si on parle à des vitesses différentes ou certaines parties se prononcent différemment.
De nombreux programmes de reconnaissance vocale utilisent la déformation temporelle dynamique parce que les gens parlent souvent à des rythmes différents. Certains sons de voyelles peuvent être panneau annonciateur différemment selon les émotions ou d'autres facteurs. Certains programmes peuvent reconnaître leurs paroles, peu importe qui parle. Pour cette raison, il n'est généralement pas efficace pour additionner les distances dans des intervalles de temps pour comparer les sons. Avec DTW, divers points de délais précis pour chaque signal sont analysées, ces distances sont calculées sur une grille qui se déroule du bas à gauche vers le coin supérieur droit.
Les similitudes dans les parties correspondantes de deux échantillons peuvent être mesurés en utilisant la distance de Levenshtein. Les lettres sont utilisées pour représenter les changements entre une source et une autre. La solution de l'algorithme est généralement un plus grand nombre les plus différents, les deux échantillons sont. Ce concept est souvent utilisé pour la reconnaissance vocale ainsi que la vérification orthographique et l'analyse du matériel génétique.
En quelques mesures, les changements de fréquence peut compenser la capacité de déformation temporelle dynamique. Les signaux peuvent être calculés de telle sorte que leur forme est utilisée indépendamment de la fréquence. Signaux modulés peut poser un problème aussi, mais d'une grille qui permet de calculer les distances entre les segments de ligne au lieu de points peut compenser.
L'alignement de séquences est généralement mathématique et des connaissances en programmation informatique sont nécessaires pour bien le comprendre. Dynamic Time Warping algorithmes dépendent de certaines conditions de base pour le calcul réaliste des différences entre les échantillons sonores ou visuels. Examiner un échantillon en tant que chemin d'accès le long d'une grille, l'algorithme suit souvent des règles telles que le chemin ne peut pas revenir en arrière et qu'il est mesuré une étape à la fois. En plus de la partie inférieure gauche à en haut à droite de format, les mesures sont limitées à des emplacements proches d'une ligne diagonale. Les valeurs qui sont trop raides ou peu profondes sont souvent ignorées, car ils peuvent provoquer des erreurs dans la mesure finale.