Un modèle acoustique est sensiblement sur un plan de la voix par rapport à une série de mots imprimés. Cette technologie est utilisée dans les programmes de reconnaissance de la parole pour aider un ordinateur à reconnaître les schémas de la parole d'une personne. Un modèle acoustique est l'un des deux fichiers principaux nécessaires à l'exécution d'un programme de reconnaissance vocale, l'autre est le modèle de langage, ce qui indique des mots susceptibles et formes d'expression qui peuvent être utilisés par le locuteur. Ces modèles sont créés en comparant les détails sonores d'un fichier audio parlé au texte des paroles.
Le logiciel de reconnaissance vocale est un logiciel conçu pour reconnaître et répondre à transcrire ou les mots d'une personne dit. Plusieurs systèmes d'exploitation sont conçus avec built-in de base des capacités de reconnaissance de la parole que l'utilisateur peut activer ou désactiver. Capacités de reconnaissance vocale sur les systèmes d'exploitation en général donner à l'utilisateur la possibilité de contrôler l'ordinateur et tapez des mots sur l'écran en utilisant sa voix.
Pour accéder à un logiciel de reconnaissance vocale, un utilisateur a besoin d'un microphone pour obtenir sa voix à l'ordinateur, ainsi que d'un programme qui traite le son. Alors que de nombreux ordinateurs sont équipés de micros, un micro casque externe permet à l'utilisateur l'avantage de son voix plus claire et la liberté de se déplacer autour de la salle tout en parlant. Autonomes marques de reconnaissance vocale logiciels comprennent LumenVox , Loquendo et Dragon.
La plupart des programmes de reconnaissance vocale ont programmation modèle acoustique qui permet au programme de reconnaître les variations dans la prononciation. Ils utilisent des modèles dans le son de la voix du locuteur pour identifier les mots dans le discours. Beaucoup sont conçus avec le logiciel de configuration pour aider l'utilisateur à créer un modèle acoustique conçu pour interpréter sa propre voix. Certains programmes avancés de reconnaissance vocale permet d'identifier et d'interpréter plusieurs langues, souvent avec une petite quantité de l'information sonore. Le plus avancé d'un programme de reconnaissance vocale, plus il est susceptible d'interpréter correctement les mots en fonction de son contexte, y compris dans une phrase où un mot est prononcé.
Le champ d'étude qui développe une technologie de reconnaissance de la parole est appelé la linguistique computationnelle. La linguistique computationnelle implique l'étude et la conception qui crée des logiciels programmés pour comprendre la parole humaine. Ce champ contient souvent des informations à partir de l'étude de la psychologie de créer des modèles acoustiques qui peuvent mieux interpréter la parole.
Le mot «acoustique» se réfère généralement à tout ce qui a à voir avec le son. Bien que les modèles acoustiques soient le plus souvent utilisés pour la reconnaissance de la parole, ils peuvent également être utilisés dans la musique. Un modèle acoustique d'un morceau de musique peut identifier des propriétés telles que battements par minute, les touches musicales ou emplacements dominantes de la musique. Cette information peut être utilisée par un programme d'ordinateur pour identifier un morceau de musique, ou il peut être utilisé pour déterminer le genre lâche dans laquelle la musique est susceptible classés. Modèles acoustiques sont également utilisés dans un domaine de la psychoacoustique étude appelés, dans lesquels les chercheurs espèrent en apprendre la musique structure qui affecte le cerveau prévisible.