L'entrepôt de données minier est l'analyse des informations contenues dans un ou plusieurs bases de données afin de rendre l'information utile. Ces bases de données, entrepôts de données, ou sont d'un dépositaire central pour les données. Les entreprises agrègent les informations qu'ils recueillent sur leurs clients dans un entrepôt de données. Une fois que l'information a été recueillie, il est «miné», et des informations utiles en est extrait pour produire des informations qui peuvent aider l'entreprise à prendre des décisions qui permettront d'accroître les profits ou réduire les coûts. Les détaillants utilisent fréquemment des mines entrepôt de données pour analyser et prédire le comportement de leurs clients.
Par exemple, quand un client va au supermarché et donne à la caissière sa carte client fréquent, des informations sur ses achats sont collectées et stockées dans l'entrepôt de données de l'entreprise. Une chaîne de supermarchés aurez des millions de morceaux de données sur ce que les gens achètent, quand, en quelle quantité et à quel prix. Un magasin peut connaître que 50.000 paquets de petits pois surgelés ont été vendus l'an dernier, mais que l'information seule n'est pas particulièrement utile. Si l'exploitation d'entrepôt de données révèle toutefois que 75% de ces petits pois surgelés ont été vendus durant les mois où petits pois frais ne sont pas disponibles, ou que 10% des pois ont été vendus dans les deux semaines précédant l'Action de grâces, l'entreprise peut être en mesure d'utiliser cette information pour augmenter leurs ventes annuelles de petits pois surgelés.
Les entreprises peuvent employer des techniques d'exploration de données d'entrepôt pour prévoir les ventes futures. L'exploration de données peut également aider à évaluer l'impact des décisions de stockage et de prix. Au supermarché, le data mining peut garder les magasins de manquer de petits pois surgelés dans le cas d'une mauvaise récolte de petits pois frais dans une année donnée.
La régression data mining est une technique d'exploration de données qui est utilisé pour montrer ce qui est susceptible d'arriver à une valeur de données si quelque chose dans l'équation est modifiée. En utilisant l'exemple supermarché, la régression serait à prévoir le niveau des ventes de pois congelés si petits pois frais ont augmenté dans le prix. Régression est basée sur des données historiques et applique une formule à elle, qui prédit le comportement futur.
Les entreprises utilisent souvent un entrepôt de données minières logiciel de collecter et d'exploiter leurs données. L'application correcte est déterminée par la quantité de données dont ils disposent et le type d'analyse qu'ils veulent faire. Choisir le bon outil d'exploration de données est essentielle pour recueillir et interpréter les données utiles.