Un architecte de données est une personne désignée comme responsable de la conception, la structure, l'organisation et le maintien de données pour une entreprise ou un projet particulier. Tout comme un architecte conçoit soigneusement les plans d'un bâtiment, un architecte de données soigneusement mappe sur la structure et l'organisation des données pertinentes pour une entreprise ou un projet. Il ou elle peut travailler pour une seule entreprise et de se concentrer entièrement sur les données internes ou travaille pour un groupe de base de données et d'aider plusieurs entreprises avec leurs données.
Un architecte de données remplit un certain nombre de rôles et entretient un certain nombre de responsabilités. Il ou elle est responsable de l'évaluation de l'utilisation des données et concernant directement les données sur les objectifs et les pratiques d'une entreprise d'une manière qui donne des résultats clairs. Quelqu'un dans cette position doit veiller à l'exactitude et l'accessibilité de toutes les données importantes, et il ou elle est responsable de savoir quelles sont les données importantes et pourquoi. Il ou elle agit souvent comme un intermédiaire, en déduire les besoins en données d'un groupe particulier et en expliquant l'importance et l'utilisation des données les plus pertinentes pour eux.
Il y a un certain nombre d'outils que quelqu'un dans l'architecture de données utilise tout au long de sa carrière. Au-delà des bases de données de base, architecte de données crée souvent ce qu'on appelle un registre de métadonnées. C'est en quelque sorte une base de données qui catalogue les données disponibles au lieu de cataloguer les données réelles. Un registre de métadonnées peut organiser les données sur une échelle beaucoup plus massive que la base de données de base, car il n'est pas nécessaire de contenir l'information elle-même, mais seulement pour la référencer.
Presque tous les architectes de données sont familiarisés avec les langages informatiques axés sur des données telles que SQL. Dans une tentative de simplifier un système assez compliqué, SQL est un langage d'interrogation de données basée sur la récupération des données stockées selon relations mathématiques. Plutôt que de mémoriser des numéros, bases de données SQL représentent tous les types d'informations en termes mathématiques et utilisent des outils mathématiques pour trier l'information. Autres langues orientées données, telles que XML, sont susceptibles d'être des outils réguliers par des personnes dans cette situation.