La fouille de données spatiales est le processus d'essayer de trouver des modèles de données géographiques. Le plus couramment utilisé dans le détail, il a grandi hors du champ de l'exploration de données, qui s'est initialement concentré sur la recherche de motifs dans l'information électronique textuelle et numérique. Fouille de données spatiales est considérée comme un défi plus compliqué que l'exploitation minière artisanale en raison des difficultés liées à l'analyse des objets avec existences concrètes dans l'espace et le temps.
Comme pour l'exploration de données standard, fouille de données spatiales est principalement utilisé dans le monde du marketing et de vente au détail. Il s'agit d'une technique permettant de prendre des décisions sur l'endroit où pour ouvrir ce type de magasin. Il peut aider à éclairer ces décisions par le traitement des données pré-existantes sur les facteurs qui motivent les consommateurs à aller à un endroit et pas un autre.
Dire que Ashley veut ouvrir une boîte de nuit sur un certain bloc de ville. Si elle a eu accès aux données appropriées, elle pourrait utiliser fouille de données spatiales pour savoir quels sont les facteurs spatiaux font boîtes de nuit réussie. Elle peut poser des questions comme: Est-ce que plus de gens viennent au club si le transport en commun est à proximité? Quelle est la distance à partir d'autres lieux de vie nocturne maximise patronage? Est-ce la proximité des stations de gaz un avantage ou un inconvénient?
Ashley pourrait aussi faire en sorte que les gens qui viennent à sa discothèque arrivent dans une distribution uniforme au cours d'une nuit d'individu. Elle pourrait aussi utiliser des données spatiales minière, peut-être avec plus de précision, les données spatio-temporelles minière pour savoir comment les gens se déplacent à travers la ville à certains moments. Le même processus pourrait être appliqué à la fréquentation sur les différents soirs de la semaine.
Les difficultés de la fouille de données spatiales sont le résultat de la complexité du monde au-delà de l'internet. Alors que les efforts passés à l'exploration de données ont généralement des bases de données mûrs pour l'analyse, les entrées disponibles pour l'extraction de données spatiales ne sont pas des grilles de l'information, mais les cartes. Ces cartes ont différents types d'objets tels que les routes, les populations, les entreprises, et ainsi de suite.
Déterminer si quelque chose est "proche de" quelque chose d'autre va d'être un discret à une variable continue. Cela augmente massivement la complexité requise pour l'analyse. Incroyablement, c'est l'un des plus simples types de relations disponibles à quelqu'un de tenter fouille de données spatiales.
La fouille de données spatiales est également confrontée au problème des faux positifs. Dans le processus de recherche de données à la recherche de relations, de nombreuses tendances apparentes vont émerger comme une conséquence de faux positifs statistiques. Ce problème existe aussi pour la tâche de l'exploitation d'une base de données plus simple, mais elle est amplifiée par l'ampleur des données disponibles pour le mineur de données spatiales. En fin de compte, une tendance identifiée par forage de données spatiales doit être confirmée par le processus d'explication et de recherches supplémentaires.