La désambiguïsation (WSD) est au cœur des programmes de logiciels conçus pour interpréter le langage. Des mots ou des phrases ambiguës peuvent être compris de multiples façons, si un seul sens est destiné. Dis ambiguation cherche à décrypter le sens voulu de mots et de phrases. Cette zone est extrêmement difficile pour les programmeurs chargés de concevoir des interfaces précises pour combler le fossé entre parler et langage écrit, et les traductions générées par ordinateur.
Le logiciel conçu pour convertir la parole en texte peut "écouter" à un utilisateur de parler dans un microphone et de traduire des mots parlés en phrases tapées. L'utilisateur dicte la ponctuation, interposant des mots comme «virgule» et «période» le cas échéant. Cela semble assez simple, sauf que beaucoup de mots sonnent exactement semblables.
Par exemple, savoir et pas ou je et les yeux sont phonétiquement indiscernables. Désambiguïsation aide à la traduction, "je devrais savoir la semaine prochaine," bien, en utilisant ce qui est essentiellement un ensemble de «si, alors» des règles qui tiennent le placement de mot et des mots adjacents en considération comme indicateurs du mot recherché. Ce type de désambiguïsation est connu comme l '«approche superficielle», et est assez précise, mais ne peut pas toujours compter sur.
Une autre approche consiste à appliquer la «connaissance du monde», ou ce que l'informatique linguistique appeler «l'approche profonde." Cette approche repose sur des lexiques comme les dictionnaires et thésaurus pour aider à déterminer sens propre d'un mot. Malheureusement, la conception d'une base de données d'approche profonde qui est assez complet pour fournir une meilleure précision que l'approche superficielle n'est pas une tâche facile.
Logiciel qui lit à haute voix le texte (text-to-speech) exige également désambiguïsation. La basse de mot, par exemple, pourrait signifier un instrument de musique, une note ou un poisson. Dans ce dernier cas, il se prononce différemment, laissant à WSD en déduire que la prononciation à utiliser. Si la phrase tapé se trouve être, "La basse est lourde, «seule une analyse de phrases environnantes pourrait révéler des indices, tels que trouver les mots" pêche "," bateau "," quai ", ou au contraire," bande "," musique »ou« chanson. "Si le mot sens, la désambiguïsation du programme n'est pas assez robuste, ou si des indices supplémentaires sont absents, le programme peut faire des erreurs dans la traduction.
En plus de «si, alors« règles de l'approche à faible pente, les algorithmes sont également utilisés pour déterminer interprétations correctes. Dans l'exemple ci-dessus, un algorithme peut trouver des mots clés à travers le document qui indique clairement à une interprétation musicale, ou vice versa. D'autres approches sont également utilisées dans WSD qui est essentiellement améliorations ou extensions de ces approches de base.
La désambiguïsation est également essentielle dans les interfaces de commande verbale visant à remplacer le clavier - et pas seulement dans la transmission des commandes du système d'exploitation simples, mais dans ces tâches complexes comme la recherche sur le Web. Les autres domaines où WSD joue un rôle comprennent le développement de la Web sémantique et des modèles d'intelligence artificielle améliorée. En effet, n'importe quel domaine de la science qui repose sur un pont linguistique entre l'homme et la machine utilisera désambiguïsation.