-Anatomie et physiologie • Animaux et l'environnement • culture generale • economie • flore et ses bienfaits • Internet et Informatique • L'alimentation et la nutrition • La Biologie • Le mésothéliome • Les épices • Les fruits et légumes • Les vitamines • Maladies & Affections • Médecine et traitements • Médicaments • monde technologique • remèdes naturels • Santé et Bien-être • sciences et génie -orange

mercredi 3 avril 2013

Qu'est-ce qu'un mot vide?

Dans les applications informatiques et en ligne, un mot vide est un mot qui est filtrée pendant le traitement d'un certain type de texte, tel que lors de l'initiation d'une recherche en ligne. Connu comme l'une des composantes du traitement du langage naturel ou NLP, l'idée derrière ce type de filtrage est d'aider à accélérer les recherches en omettant des articles communs du discours de la demande. Au lieu de cela, le moteur de recherche utilise un simple marqueur de noter la présence de ce mot dans la chaîne de texte, mais n'empêche pas la présence de ce marqueur d'inclure cette page dans les résultats de recherche.

Une façon de comprendre comment les mots vides peuvent compliquer la fonction des moteurs de recherche est de considérer le fait que lorsque vous effectuez une recherche, le moteur tiendra compte de toute parole qui est inclus dans la demande de recherche soumis par l'utilisateur. Dans le cadre de cet examen, le moteur de recherche les pages contenant chaque mot. Cela signifie que si la demande de recherche contient trois mots, le moteur effectue trois balayages de l'Internet, éventuellement en donnant la priorité aux pages qui contiennent tous trois des mots.

Par exemple, une recherche comme "la maison sur la colline", il faudrait le moteur de faire des recherches sur chaque mot dans la séquence, et certains sont même en cours d'exécution d'une recherche sur le mot stop "de la" deux fois. Cela prend du temps et des ressources qui pourraient être réaffectées à aider dans les recherches de mots clés autres que les utilisateurs finaux d'autres mènent actuellement. En utilisant des marqueurs de remplacer "le" et "on" pendant la recherche, le moteur peut consacrer moins de ressources et encore des résultats qui sont très susceptibles de satisfaire l'utilisateur final.

Bien que le mot d'arrêt est parfois appelé un mot poison, il n'y a vraiment rien de particulièrement mauvais, y compris les articles de la parole dans le texte pour effectuer des recherches. L'utilisation d'un mot ou des mots d'arrêt dans le cadre de la demande de recherche peut compliquer le processus d'indexation des moteurs de recherche lors de la tentative de récupération des données qui répondent aux critères de recherche. Pourtant, l'utilisateur final ne devrait pas voir beaucoup de différence dans l'extraction de l'information qui est finalement retourné.

Il n'y a pas de liste d'arrêt dure et rapide mot qui est utilisé universellement par tous les moteurs de recherche. En fait, certains moteurs de recherche ne pas utiliser n'importe quel type de liste de mots vides dans le cadre de la tâche de traitement du langage naturel du tout. Autres moteurs, cependant, fera largement appel de la liste de mots vides comme un moyen d'allouer les ressources de manière plus efficace, tout en retournant les résultats des moteurs de recherche qui sont exacts et susceptibles d'être très approprié pour les demandes de recherche soumises par toute personne utilisant un particulier moteur.