«L'intégration sémantique» est un terme utilisé dans plusieurs contextes à travers les différents domaines de la conception par ordinateur, la programmation, la gestion et l'administration. En général, il s'agit de l'agrégation des informations d'une ou plusieurs sources disparates dans le but de créer un système dans lequel les informations sont organisées de façon logique pour un utilisateur. L'intégration sémantique traite souvent de définir et d'établir des connexions de métadonnées, ou des relations, entre les différentes parties de différentes sources de données afin qu'ils puissent être logiquement structuré. Il pourrait s'agir de la création de connexions relationnelles entre deux bases de données distinctes, la construction d'un graphique de la façon dont des portions de sites différents se rapportent à une autre, ou l'intégration des données factuelles à partir d'une inconnue, format arbitraire dans une structure d'enregistrement concise.
De nombreuses applications pratiques pour un système d'intégration sémantique pleinement mis en œuvre existent, y compris les bibliothèques de recherche ou des réseaux, plus organiques algorithmes des moteurs de recherche qui peut extrapoler à partir d'un contexte de recherche et, en fin de compte - grâce à l'utilisation de l'édition des métadonnées - intégration transparente des systèmes informatiques différents pour l'échange de données .
L'objectif ultime de l'intégration sémantique dans la plupart des cas est de pouvoir associer des informations de manière dynamique. Dans un exemple très simple, cela pourrait signifier être capable d'associer des champs dans une base de données avec des champs dans une autre base de données, en dépit du fait qu'ils ne sont pas des correspondances exactes, telles que concernant un champ nommé «taille» d'un champ nommé «hauteur». Cette association pourrait être réalisée par le biais définis par l'utilisateur des règles qui lient spécifiquement les deux, ou il pourrait être fait avec des algorithmes qui permettent de comparer les données numériques des champs et déterminer une correspondance probable. Les mots "taille" et "height" deviennent alors des termes de métadonnées externes que d'autres systèmes d'intégration sémantique pourrait être en mesure d'utiliser pour trouver l'information pour un utilisateur sans avoir à connaître précisément comment un système unique stocke les données.
Dans les systèmes complexes d'intégration sémantique, tels que ceux destinés à la recherche, la publication et le partage des métadonnées est un élément clé pour le fonctionnement. Les métadonnées peuvent être extraites de documents pour former de grandes structures de données relationnelles qui peuvent aider dans les requêtes. Cela signifie que les documents de recherche sur n'importe quel sujet peut être intégré dans un système qui mesure et enregistre la fréquence des mots, et ces mots peuvent aider dans les recherches des utilisateurs pour obtenir des informations, ce qui permet des sujets connexes à la cote de toute autre source, sans la nécessité pour les conversions spécifiques.
L'un des défis auxquels sont confrontés les concepteurs de systèmes d'intégration sémantique est de savoir comment agréger les données. Utilisation humains pour classer et rendre les relations entre les données provenant de diverses sources peut prendre beaucoup de temps et, finalement, très dépendante de l'expérience personnelle de la personne. Lorsque algorithmes sont utilisés pour automatiquement faire des associations, certaines relations pourraient être négligés en raison d'une différence mineure que l'algorithme est incapable de résoudre. Une méthode de mise en œuvre de l'intégration sémantique sur une grande échelle utilise des algorithmes d'apprentissage en conjonction avec l'homme la gestion axée sur les règles et, dans certains cas, humain réel de prise de décision au cours du processus.