-Anatomie et physiologie • Animaux et l'environnement • culture generale • economie • flore et ses bienfaits • Internet et Informatique • L'alimentation et la nutrition • La Biologie • Le mésothéliome • Les épices • Les fruits et légumes • Les vitamines • Maladies & Affections • Médecine et traitements • Médicaments • monde technologique • remèdes naturels • Santé et Bien-être • sciences et génie -orange

dimanche 21 avril 2013

Qu'est-ce que L'extraction de données statistiques?

L'extraction de données statistiques, aussi connu comme la connaissance ou la découverte de données, est une méthode informatisée de collecte et d'analyse d'informations. L'outil d'exploration de données prend des données et catégorise les informations pour découvrir les modèles ou les corrélations qui peuvent être utilisés dans des applications importantes, telles que la médecine, la programmation informatique, la promotion de l'entreprise et la conception robotique. Techniques d'exploration de données statistiques utilisent des mathématiques complexes et des processus statistiques complexes pour créer une analyse.

L'exploration de données comprend cinq étapes principales. La première application de data mining recueille des données statistiques et place les informations dans un programme de type entrepôt. Ensuite, les données dans l'entrepôt est organisé et crée un système de gestion. L'étape suivante crée un moyen d'accéder aux données gérées. Ensuite, la quatrième étape développe des logiciels pour analyser les données, aussi connu comme la régression d'exploration de données, tandis que la dernière étape facilite l'utilisation ou l'interprétation des données statistiques d'une manière pratique.
En général, les techniques d'exploration de données intègrent analytique et les systèmes de données de transaction. Sortes de logiciels d'analyse à travers les deux types de systèmes de données à l'aide de questions des utilisateurs ouvertes. Les questions ouvertes permettent d'innombrables réponses pour les programmeurs n'influencent pas les résultats du tri. Les programmeurs de créer des listes de questions pour aider à catégoriser l'information en utilisant un objectif global.

Le tri est alors basée sur le développement des classes et des groupes de données, les associations présentes dans les données, et tente de définir les caractéristiques et tendances sur la base des associations. Par exemple, Google recueille des informations sur les habitudes d'achat des utilisateurs pour aider à placer la publicité en ligne. Les questions ouvertes utilisées pour trier cet acheteur données sont axées sur les préférences d'achat ou les habitudes d'écoute des utilisateurs d'Internet.
Les informaticiens et les programmeurs se concentrent sur l'analyse des données statistiques qui sont collectées. Création d'arbres de décision, réseaux de neurones artificiels, la méthode du plus proche voisin, l'induction de la règle, de la visualisation de données et les algorithmes génétiques utilisent toutes les données statistiquement minées. Ces systèmes de classification aident  à interpréter les associations découvertes par les programmes de données analytiques. Extraction de données statistiques implique de petits projets qui peuvent être faites sur une petite échelle sur un ordinateur à la maison, mais la plupart des données minières ensembles d'associations sont si grandes et la régression de data mining si compliqué qu'ils nécessitent un supercalculateur ou un réseau d'ordinateurs à haute vitesse.

Data mining statistique recueille trois types généraux de données, y compris les données opérationnelles, les données non-opérationnelles, et des métadonnées. Dans un magasin de vêtements, les données opérationnelles sont les données de base utilisées pour diriger l'entreprise, tels que la comptabilité, les ventes et le contrôle des stocks. Les données non-opérationnelles, qui est indirectement liées à l'entreprise, comprend des estimations de ventes futures et des informations générales sur le marché national de l'habillement. Métadonnées concerne les données elles-mêmes. Un programme utilisant des méta-données peut trier les clients des magasins dans les classifications fondées sur le sexe ou la situation géographique des acheteurs de vêtements ou de la couleur préférée des clients, si ces données ont été recueillies.

Une application d'exploration de données peut être extrêmement sophistiqué et l'outil de data mining statistique peut avoir des applications pratiques répandues. L'étude des épidémies est un exemple. Un projet d'exploration de données de 2000 a analysé l'épidémie de cryptosporidium dans l'Ontario, au Canada afin de déterminer les causes de l'augmentation des cas de maladies. Les résultats de l'exploration de données ont aidé à relier l'éclosion de la bactérie à des conditions locales de l'eau et de l'absence d'un traitement adéquat de l'eau municipale. Un champ appelé «biosurveillance» utilise l'extraction de données épidémiologiques pour identifier les foyers d'une seule maladie.

Les programmeurs et les concepteurs utilisent également l'étude des probabilités et analyse statistique des données pour développer des machines et des programmes informatiques. Le moteur de recherche Internet Google a été conçu en utilisant l'extraction de données statistiques. Google continue de recueillir et d'utiliser l'exploration de données pour créer des mises à jour et des applications programmes.