L'exploration de données se réfère généralement à une méthode utilisée pour analyser les données provenant d'une source cible et composer que les commentaires en informations utiles. Cette information est généralement utilisé pour aider une organisation à réduire les coûts dans un domaine particulier, augmenter les revenus, ou les deux. Souvent facilitée par une application data-mining, son objectif principal est d'identifier et extraire des motifs contenus dans un ensemble de données.
Plus important encore, les techniques d'exploration de données visent à donner un aperçu qui permet une meilleure compréhension des données et de ses caractéristiques essentielles. Les entreprises et organisations peuvent utiliser de nombreux types de techniques d'exploration de données. Même si elles peuvent adopter une approche similaire, tous s'efforcent généralement pour atteindre des objectifs différents.
Le but des techniques de data mining prédictif est presque toujours d'identifier des modèles ou des modèles statistiques qui peuvent être utilisés pour prédire une réponse d'intérêt. Par exemple, une institution financière peut utiliser pour identifier les transactions qui ont la plus forte probabilité de fraude. C'est la technique de data mining la plus courante et qui est devenu un outil de prise de décision efficace pour la mi-aux entreprises de grande taille. Il s'est également avéré efficace pour prédire le comportement des clients, des segments de clientèle de catégoriser et de prévision des événements divers.
Les modèles analytiques reposent sur des techniques d'exploration de données qui répondent à des données résumées en conséquence. Par exemple, une organisation pourrait affecter les passagers des compagnies aériennes ou des transactions par carte de crédit en différents groupes en fonction de leurs caractéristiques extraites du processus analytique. Ce modèle peut également aider les entreprises à acquérir une compréhension plus profonde de leur clientèle.
Des modèles d'association prennent en compte que certains événements peuvent se produire ensemble sur une base régulière. Cela pourrait être l'achat simultané d'éléments tels qu'une souris et un clavier ou une séquence d'événements qui ont conduit à l'échec d'un périphérique donné. Des modèles d'association représentent les techniques de fouille de données permettant d'identifier et de caractériser ces événements associés.
Les modèles de réseau utilisent des techniques d'exploration de données pour révéler les structures de données qui sont sous la forme de nœuds et de liens. Par exemple, un réseau de fraude organisée pourrait dresser une liste de numéros de cartes de crédit volées, puis demi-tour et de les utiliser pour acheter des articles en ligne. Dans cette illustration, les cartes de crédit et les commerçants en ligne représentent les nœuds tandis que les transactions réelles agissent comme les liens.
L'exploration de données a beaucoup de buts et peut être utilisé à des fins à la fois positif et malveillant. Plus organisations viennent de découvrir les avantages de la fusion de techniques d'exploration de données pour former des modèles hybrides. Ces puissantes combinaisons donnent souvent lieu à des applications avec des performances supérieures. En intégrant les principales caractéristiques des différentes méthodes dans des solutions hybrides simples, les organisations peuvent généralement surmonter les limites des systèmes de stratégie individuelle.