La désambiguïsation lexicale (WSD) est au cœur des programmes de logiciels conçus pour interpréter le langage. Des mots ou des phrases ambiguës peuvent être compris de multiples façons, si un seul sens est destiné. Homonymie cherche à déchiffrer le sens voulu des mots et des phrases. Cette zone est extrêmement difficile pour les programmeurs chargés de la conception des interfaces précises pour combler le fossé entre la langue parlée et écrite, et les traductions générées par ordinateur.
Le logiciel conçu pour convertir la parole en texte peut «écouter» un utilisateur en parlant dans un microphone et traduire les mots parlés en phrases dactylographiées. L'utilisateur dicte la ponctuation, interposant des mots comme «virgule» et «période» le cas échéant. Cela semble assez simple, sauf que beaucoup de mots sonnent exactement semblables.
Par exemple, de savoir et pas ou je et les yeux sont phonétiquement indiscernables. Désambiguïsation lexicale permet de traduire: «Je devrais savoir la semaine prochaine», correctement, en utilisant ce qui est essentiellement un jeu de «si, alors» des règles qui tiennent placement de texte et de mots adjacents en considération comme indicateurs du mot recherché. Ce type de désambiguïsation lexicale est connu comme l '«approche superficielle», et est assez précise, mais ne peut pas toujours compter sur lui.
Une autre approche consiste à appliquer la «connaissance du monde», ou ce que la linguistique informatique appelle l '«approche profonde." Cette approche repose sur des lexiques comme les dictionnaires et thésaurus pour aider à déterminer sens propre d'un mot. Malheureusement, la conception d'une base de données approche profonde qui est assez complet pour fournir une meilleure précision que l'approche superficielle n'est pas une tâche facile.
Le logiciel qui lit le texte à haute voix (Text-to-speech) exige également la désambiguïsation lexicale. Le mot bas, par exemple, pourrait signifier un instrument de musique, une note ou un poisson. Dans ce dernier cas, il se prononce différemment, en laissant à WSD d'en déduire qui prononciation à utiliser. Si la phrase tapé se trouve être, "La basse est lourde,« seule une analyse des peines environnantes pourrait révéler des indices, tels que trouver les mots «pêche», «bateau», «quai», ou inversement, "bande", " musique »ou« chanson ». Si mot sens de la désambiguïsation du programme n'est pas assez robuste, ou si d'autres indices sont absents, le programme peut faire des erreurs de traduction.
En plus de «Si donc des« règles de l'approche superficielle, les algorithmes sont également utilisés pour déterminer interprétations correctes. Dans l'exemple ci-dessus, un algorithme peut trouver des mots clés à travers le document qui indique clairement à une interprétation musicale, ou vice versa. D'autres approches sont également utilisées dans WSD qui est essentiellement des améliorations ou extensions de ces approches de base.
La désambiguïsation lexicale est également indispensable dans les interfaces de commandes verbales visant à remplacer le clavier - et pas seulement en relayant les commandes simples du système d'exploitation, mais dans des tâches aussi complexes que des recherches sur le Web. Les autres domaines où WSD joue un rôle comprennent le développement du Web sémantique et modèles améliorés d'intelligence artificielle. En effet, n'importe quel domaine de la science qui s'appuie sur un pont linguistique entre l'humain et la machine va utiliser la désambiguïsation lexicale.