Un entrepôt de données est un appareil intégré de collecte de matériel et de logiciels conçus pour un usage spécifique qui implique généralement le débit élevé de données et les fonctions analytiques. Il est généralement composé de serveurs, systèmes d'exploitation, les installations de stockage de données, systèmes de gestion de base de données (SGBD), et le logiciel qui est pré-installé et optimisés pour l'entreposage de données. En raison de son rapport coût-efficacité et l'efficience, l'appareil d'entrepôt de données est devenu un segment important du marché de l'entreposage de données.
Une organisation peut utiliser un appareil d'entrepôt de données pour optimiser les différents domaines du traitement des données. En général, son but principal est de supplanter les fonctions de business intelligence classiques, tels que l'entreposage, extraire, transformer, charger (ETL), l'analyse et le reporting. Le marché pour ce type de solution a rapidement attiré l'attention des grands concurrents traditionnels qui sont tenus de livrer plus ou la totalité de leur entrepôt de données au niveau le plus performant.
Certains appareils d'entrepôt de données sur le marché sont simplement ceux qui utilisent un langage tel que SQL pour faciliter l'interaction avec l'appareil à un niveau de demande de base de données. Un vrai appareil de l'entrepôt de données est généralement défini comme celui qui ne nécessite pas de réglage fin, l'indexation, le partitionnement, ou l'agrégation. Semblable à un appareil électroménager, il est facile à déployer et à maintenir, offrant la possibilité de mettre en place un entrepôt de données volumineux dans ce qui est généralement un temps relativement court laps de temps.
Un entrepôt de données appareil exploite sa puissance de traitement d'un tableau de traitement massivement parallèle (MPP) des noeuds. Ceux-ci sont déployés dans ce qu'on appelle une architecture de rien partagé, qui offre un moyen efficace de combiner plusieurs nœuds dans un environnement hautement parallèle. Contrairement aux solutions traditionnelles où le coût et la complexité de chaque nœud supplémentaire empêche un haut niveau de parallélisme par le matériel, un entrepôt de données appareil est capable de déployer des centaines de milliers de nœuds de traitement des requêtes dans un seul paquet de l'appareil.
S'appuyant sur une architecture d'entrepôt de données entièrement intégré, un appareil d'entrepôt de données peut fournir un avantage important sur les performances, l'exécution allant de 10 à 100 fois plus rapide que les systèmes d'entreposage de données à usage général. Cette architecture attribue le faible coût de l'appareil réel ainsi que la maintenance réduite, car aucune indexation ou les méthodes traditionnelles sont nécessaires pour ajuster les performances. Elle attribue également aux exigences de faible puissance de refroidissement et parce que les processeurs ne sont pas obligés de traiter des quantités écrasantes de données.
Un appareil d'entrepôt de données peut avoir un impact positif considérable sur l'entreprise. Il peut aider le personnel des grandes organisations de leur entrepôt de données de manière plus efficace, tout en aidant les entreprises à mi-niveau dans la résolution des défis de business intelligence. De plus en plus adopté dans diverses industries, l'entrepôt de données change fondamentalement la façon dont les entreprises fonctionnent de toutes sortes.