La nomenclature statistique est la division des données en catégories significatives pour l'analyse. Il est possible d'appliquer des formules statistiques pour les données de le faire automatiquement, ce qui permet le traitement des données à grande échelle en vue de l'analyse. Certains systèmes standardisés existent pour les types courants de données telles que des résultats d'études d'imagerie médicale. Cela permet à plusieurs entités pour évaluer les données avec les mêmes paramètres afin qu'ils puissent comparer et d'échanger facilement des informations.
En tant que chercheurs et d'autres parties de recueillir des données, ils peuvent l'affecter à des catégories en vrac sur la base de caractéristiques similaires. Ils peuvent également développer des formules de classer leurs données comme il arrive, automatiquement le divisant en classifications statistiques spécifiques. Comme ils recueillent des informations, les chercheurs ne savent pas beaucoup au sujet de leurs données, ce qui rend difficile à classer. Les formules peuvent identifier les caractéristiques importantes pour servir d'identifiants catégorie potentiels.
Traitement des données nécessite la classification statistique de séparer les différents types d'informations pour l'analyse et la comparaison. Par exemple, lors d'un recensement, les travailleurs devraient être en mesure d'explorer de multiples paramètres à fournir une évaluation significative des données qu'ils recueillent. Utilisation de déclarations sur les formulaires de recensement, un algorithme de classification statistique peut distinguer différents types de ménages et des individus sur la base des informations comme l'âge, la configuration des ménages, le revenu moyen, et ainsi de suite.
Les données recueillies doivent être de nature quantitative pour l'analyse statistique de travailler. L'information qualitative peut être trop subjective. En conséquence, les chercheurs doivent concevoir des méthodes de collecte de données avec soin pour obtenir des informations qu'ils peuvent réellement utiliser. Par exemple, dans un essai clinique, les observateurs de remplir des formulaires lors des examens de suivi pourrait utiliser une notation rubrique pour évaluer la santé du patient. Au lieu d'une évaluation qualitative comme "le patient va bien», le chercheur pourrait attribuer une note de sept sur une échelle, une formule qui pourrait utiliser pour traiter les données.
Les statisticiens utilisent une variété de techniques pour la classification statistique et le développement de formules appropriées pour traiter leurs données. Erreurs à ce stade de l'analyse des données peuvent être composées sur la recherche et analyse ultérieure. Il est important de réfléchir à la nature de l'ensemble de données, les informations que les gens veulent sortir de celui-ci, et comment le matériel sera utilisé. Dans les documents officiels, les chercheurs doivent discuter du système de classification statistique, ils ont choisi d'utiliser et beaucoup aussi fournir des données brutes pour permettre aux examinateurs de regarder les informations pour eux-mêmes afin de déterminer la validité des conclusions de l'étude.