L'entrepôt de données du logiciel a connu une croissance exponentielle au cours des dernières années et devrait connaître une croissance supérieure à la moyenne dans l'avenir. Un entrepôt de données est un référentiel de toutes les données transactionnelles d'une organisation ou une entreprise. Le but principal d'un entrepôt de données est d'analyser les transactions et exécuter des rapports complexes.
Il y a trois fonctions principales à chaque produit de données du logiciel d'entrepôt: extraction de données, la création de la structure de base de données, et de créer des requêtes personnalisées. Dans le secteur des technologies de l'information, de données d'entrepôt experts sont connus que des spécialistes de business intelligence. Ils ont généralement une formation en mathématiques, statistiques ou analyse de systèmes informatiques. Une formation supplémentaire est souvent nécessaire dans les bases de données relationnelles, l'architecture système et les bases de la programmation de base de données.
L'une des fonctions les plus importantes de n'importe quel logiciel d'entrepôt de données est la capacité à extraire correctement et structurer les données à partir d'une variété de sources. Ceci est souvent appelé une extraction, de transformation et de chargement (ETL). Les entrepôts de données doivent être remplis avec les données du système de transaction d'une manière qui préserve l'intégrité et inter-relations entre les données, tout en permettant au personnel de personnaliser les données extraites. Il s'agit d'une partie essentielle de l'architecture du système.
Il est important de noter que la plupart des programmes d'entrepôts de données logicielles sont utilisées pour créer, soutenir et maintenir de multiples ensembles de données. Dans de nombreuses situations, il y a quelques tables dupliquées dans tous les cubes, alors qu'il existe d'autres ensembles de données qui doivent rester séparées et distinctes. Par exemple, un cube de données avec des données d'achat aura de nombreux points de données partagées avec un cube de paiement des fournisseurs. Cependant, il y aura aussi une série d'informations spécifiques dans chaque cube qui s'applique uniquement à ce cube spécifique.
L'architecte de données est chargé d'identifier les données partagées, ce qui confirme qu'il est correct, et en permettant que cette information soit disponible dans plusieurs cubes, sans nuire à l'intégrité de chaque cube. En outre, il ou elle est responsable de la gestion des données de processus de téléchargement nécessaire pour actualiser les cubes de données. Ce peut être un processus automatisé ou manuel, selon la complexité des cubes et comment les données sont fournies.
Tous les programmes logiciels de données d'entrepôt viennent avec une gamme de rapports standards et des requêtes. Ces rapports sont basés sur les besoins opérationnels communs et ont tendance à être de nature assez générale. Par exemple, un rapport sur les dix premiers clients de volume des ventes pour l'année en cours est une demande de rapport commun et serait standard dans la plupart des programmes.
Cependant, de nombreuses entreprises constatent qu'ils nécessitent la création de rapports personnalisés pour répondre aux besoins spécifiques. Par exemple, le même rapport de vente doivent inclure les noms des représentants des ventes et de trier les données dans certains districts ou territoires. La capacité de créer rapidement un rapport personnalisé et de l'adapter pour répondre aux besoins opérationnels existants est essentielle à la réussite de ce type de logiciel.