Datamart vs. reporting Cube, quelles sont les différences?

les termes sont utilisés partout, et je ne connais pas de définitions croustillantes. Je suis presque sûr de savoir ce qu'est un data mart. Et j'ai créé des cubes de rapports avec des outils comme des objets de travail et des Cognos.

j'ai aussi demandé à des gens de me dire qu'un datamart est plus qu'une collection de cubes.

j'ai aussi eu des gens qui m'ont dit qu'un datamart est un cube de rapports, rien de plus.

quelles sont les distinctions que vous comprenez?

16
demandé sur S.Lott 2008-12-12 00:03:46

8 réponses

Cube peut (et devrait sans doute) signifier quelque chose de très spécifique - artéfacts OLAP présentés par le biais d'un OLAP serverservices D'analyse MS Oracle (nee Hyperion) Essbase. Cependant, il est également utilisé beaucoup plus librement. Les cubes OLAP de ce type utilisent des outils de requête conscients du cube qui utilisent une API différente d'une base de données relationnelle standard. Généralement, les serveurs OLAP gèrent leurs propres structures de données optimisées (connues sous le nom de MOLAP), bien qu'elles puissent être mises en œuvre comme une première extrémité à une source de données relationnelles (connue sous le nom de ROLAP) ou en divers modes hybrides (connus sous le nom de HOLAP)

j'essaie d'être spécifique et d'utiliser 'cube' spécifiquement pour faire référence à des cubes sur des serveurs OLAP tels que SSAS.

Objets fonctionne en interrogeant des données à travers une ou plusieurs sources (qui pourraient être des bases de données relationnelles, des cubes OLAP, ou des fichiers plats) et en créant un structure de données en mémoire appelée MicroCube il utilise pour le soutien interactif tranche et dés activités. Les services d'analyse et MSQuery peuvent faire un cube (.cub) fichier qui peut être ouvert par le logiciel client AS ou Excel et tranché-et-découpé de manière similaire. Les versions récentes d'objets D'affaires de L'IIRC peuvent également s'ouvrir .dossiers cub.

Pour être pédant, je pense que Business Objects se trouve dans un " semi-structurée de la déclaration de l'espace quelque part entre un vrai OLAP système tel que ProClarity et outil de rapport ad hoc tel que Générateur De Rapports, Oracle Discoverer ou Brio. Les voyages aller-retour vers le Panneau D'interrogation le rendent quelque peu grotesque en tant qu'outil OLAP pur flux de pensée, mais il offre un niveau d'interactivité que les rapports traditionnels n'offrent pas. Je considère que le point positif des objets D'affaires est de s'asseoir à deux endroits: rapports ad hoc par le personnel pas nécessairement familier avec SQL et provding un rapport prévu livré dans un format interactif qui permet de faire des percées dans les données.

'Data Mart' est aussi un terme assez peu utilisé et peut signifier n'importe quel support d'accès de données pour un système d'entrepôt de données. La définition peut inclure ou non les outils de déclaration et les couches de métadonnées, les tableaux des couches de déclaration ou d'autres éléments comme les Cubes ou d'autres systèmes analytiques.

j'ai tendance à penser à un data mart comme la base de données à partir de laquelle le rapport est fait, en particulier si elle est un sous-système facilement définissable de l'architecture globale de l'entrepôt de données. Toutefois, il est tout à fait raisonnable de penser qu'il s'agit de l'utilisateur faisant face à la couche de déclaration, en particulier s'il existe des outils de déclaration ad hoc tels que les objets D'affaires ou les systèmes OLAP qui permettent aux utilisateurs finals d'obtenir les données directement.

27
répondu ConcernedOfTunbridgeWells 2008-12-26 14:16:08

le terme "data mart" est devenu quelque peu ambigu, mais il est traditionnellement associé à un sous-ensemble thématique des systèmes d'information d'une organisation. Data mart n'implique pas explicitement la présence d'une technologie multidimensionnelle comme OLAP et data mart n'implique pas explicitement la présence de données numériques résumées.

un cube, d'autre part, tend à laisser entendre que les données sont présentées Selon une nomenclature multidimensionnelle (typiquement un OLAP les données sont généralement résumées comme des intersections de hiérarchies multiples. (c.-à-d. la valeur nette de votre famille par rapport à votre valeur nette personnelle et tout ce qui se trouve entre les deux) en général, "cube" implique quelque chose de très spécifique alors que "data mart" a tendance à être un peu plus général.

je suppose que, dans la POO parler vous pourriez dire avec précision que d'un data mart "a-un" cube", a-une" base de données relationnelle, "a-un" chouette interface de reporting, etc... mais ce serait moins correct de dire que n'importe lequel d'entre eux est un data mart. Le terme data mart est plus inclusif.

8
répondu J.Biard 2009-01-07 03:52:02

Comme son nom l'indique, un cube est structuré de données multidimensionnelles, (généralement trois dimensions représentant chacune des trois faces d'un cube). Un data mart n'est qu'un conteneur et non une structure en soi, bien qu'il contienne des ensembles de données organisés (sous forme de tableaux) en dimensions et en faits.

la structure d'un cube rend facile de visualiser ou de conceptualiser des données le long de différentes dimensions d'un cube. Ainsi, la plupart des analystes d'affaires ou les développeurs trouvent qu'il est facile d'interroger et de interagir avec le cube.

puisqu'un data mart n'est qu'un container avec un tas de tables, les utilisateurs doivent d'abord conceptualiser et comprendre les structures dimensionnelles avant d'interroger et d'analyser les données.

4
répondu connectHeavenAndEarth 2012-11-20 22:26:04

Data mart signifie traditionnellement des données statiques, généralement axées sur la date et l'heure, utilisées par les analystes pour les statistiques, la budgétisation, les rapports sur le rendement et les ventes, et d'autres activités de planification.

un Cube est une base de données OLAP qui convertit assez exhaustivement les données OLTP en un schéma statique, orienté date/heure qui utilise un langage de requête qui n'est pas SQL, mais construit spécifiquement pour répondre aux questions de type data mart. Il utilise des termes comme mesures, dimensions, Star-schema, etc. plutôt que de des tables, des colonnes et des rangées. La meilleure analogie familière pourrait être des tables pivotantes dans un tableur.

3
répondu dkretz 2009-01-07 04:27:33

Data mart est une collection de données d'un processus d'entreprise précis. Il est indifferent comment les données sont stockées. Un cube stocke les données d'une manière spéciale, en plusieurs dimensions, contrairement à une table avec ligne et Colonne. Un cube dans une base de données olap est comme une table dans une base de données traditionnelle. Un data mart peut avoir des tables ou des cubes. Les Cubes accélèrent l'analyse parce qu'ils calculent à l'avance les agrégations.

3
répondu Mathew nguyen 2011-09-30 07:37:22

n'oubliez pas:

D'Entreposage De Données est le processus qui consiste à extraire des données des bases de données existantes et des bases de données sur les transactions et à les transformer en renseignements organisés dans un format convivial afin d'encourager l'analyse des données et d'appuyer la prise de décisions d'affaires fondées sur les faits.

Entrepôt De Données est un système qui extrait, nettoie, conforme, et offre les données de source dans un magasin de données dimensionnelles et puis soutient et met en œuvre interrogation et analyse aux fins de la prise de décision.

KIMBALL, par exemple, a constamment défini data mart comme un sous-ensemble de données de l'organisation globale axé sur les processus basé sur une base de données atomiques, et cela dépend uniquement de la physique des événements de mesure des données, et non des questions de l'utilisateur prévu.

  • Data marts sont basés sur la source de données, pas sur un département de la vue de données.
  • Data marts contenir tous atomique de détail nécessaires à l'appui de forage au niveau le plus bas.
  • les Data marts peuvent être centralisés ou décentralisés.

DÉFINITION CORRECTE

  • basé sur le processus
  • Atomique De La Fondation De Données
  • Mesure Des Données

DÉFINITION ERRONÉE

  • Basé Sur Le Ministère
  • Données Agrégées Seulement
  • Question De L'Utilisateur Basée
3
répondu Ageu 2014-01-03 00:43:33

pour moi, un datamart est juste un endroit où les données sont déchargées dans un format relativement plat, inutilisable.

Cube prend ces données et les fait danser.

1
répondu Brian Knoblauch 2008-12-11 21:07:43

Je suis D'accord avec Matthew. Nous avons tendance à utiliser le terme "Data Mart" pour toutes les sources de données qui stockent des données génériques et des correspondances utilisées dans diverses applications d'une entreprise. Nous ne stockons pas les données mesurables dans un data mart, donc je vois un data mart comme l'une des multiples sources de données pour un cube. Ceci, cependant, est à quel point nous