Peut-on construire un cube OLAP là où les détails du modèle ne sont pas connus à l’avance?

StackOverflow https://stackoverflow.com/questions/1002334

  •  05-07-2019
  •  | 
  •  

Question

Pardonnez-moi pour la question laineuse - je ne connais pas très bien OLAP & amp; cubes. Laisse-moi expliquer ma situation ...

J'aimerais construire une base de données pour stocker les résultats du questionnaire, où il pourrait y avoir quelques dizaines de questions par questionnaire. Après avoir rassemblé quelques milliers de questionnaires remplis, j'aimerais analyser les résultats, ce qui semble être un bon candidat pour les projets de type OLAP (dont je connais très peu). Je dois pouvoir interroger "tous les hommes interrogés âgés de 20 à 30 ans qui possèdent un chien". - c’est-à-dire en combinant les réponses à "quel âge avez-vous", "possédez-vous un chien", etc.

Je veux aussi pouvoir stocker les résultats de l'enquête du mois prochain, du mois suivant, etc., et lancer des requêtes indiquant le mois précédent, etc., etc. Jusqu'ici, tout va bien, je suppose.

Voici le coeur de ma question: alors que ce mois-ci, mon questionnaire pourrait avoir des questions sur le sexe, l'âge et propriétaire du chien, le questionnaire du mois prochain pourrait inclure une question sur (par exemple) la couleur des yeux. Cela pourrait (ou non) également laisser tomber certaines questions. Est-ce faisable dans le monde OLAP, ou avez-vous besoin de connaître toutes les "dimensions"? (si j'utilise le bon terme) en avance lorsque vous concevez votre cube?

De plus, si j'utilise plusieurs enquêtes différentes avec des questions différentes mais qui se chevauchent, puis-je les stocker toutes dans le même cube et exécuter des requêtes sur plusieurs enquêtes? Chaque enquête peut comporter quelques dizaines de questions, dont une douzaine se chevauchant avec d'autres enquêtes. Les systèmes OLAP répondent-ils à ce genre de problème? Je ne sais tout simplement pas à quel point ils sont rigides et s'ils conviennent à ce type d'utilisation.

Toute aide grandement appréciée.

PS. Avant que quelqu'un ne le suggère, je viens d'acheter le kit d'entrepôt de données de Kimball mais je n'ai pas encore eu l'occasion de le lire. (J'imagine que cela ne répond peut-être pas directement à cette question de toute façon).

Était-ce utile?

La solution

Il existe un livre blanc ici qui comporte une section couvrant la modélisation des données d’enquête. C’est peut-être le genre de chose que vous recherchez.

Autres conseils

Je commencerai par dire que je suis moi aussi un novice OLAP, mais je pense avoir une idée de ce que vous souhaitez atteindre.

En fait, vos questions sont l’une de vos dimensions, la réponse à cette question faisant partie du tableau des faits, c’est-à-dire que le tableau des faits a la réponse et des dimensions qui lui sont associées pour l’âge, le sexe, la localité (peut-être) et les questions. Cela peut sembler un peu à l’avant, mais c’est quelque chose que je suis en train de régler pour OLAP.

Vous pouvez également souhaiter une autre dimension liée à la question qui les regroupe dans des questionnaires, mais qui pourrait simplement constituer une valeur dans la dimension de la question elle-même, à savoir Question {QuestionnaireID = 1, QuestionNumber = 4, QuestionText = " Possédez-vous un chien? ? " }.

Je ne sais pas si cela vous aidera, mais j'espère vous donner quelques idées si rien d'autre.

Un autre débutant chez OLAP, ici aussi ...

1) Je n'ai que de l'expérience dans la création de cubes OLAP avec Mondrian (Pentaho), ce qui vous permet de réviser le schéma du cube, qui n'est qu'un fichier XML, et de les reconstruire (ou de parler Pentaho, publier). Donc, pour cette plate-forme, de toute façon, il n’existe aucune exigence de connaître à l’avance toutes vos dimensions

2) Je suis d'accord avec la recommandation de Lazurus concernant la création d'une dimension de questions. Il n’est pas nécessaire que chacun de vos "faits" a une valeur qui est présente dans toutes les dimensions, donc si vous examiniez la dimension de la "Question n", alors je pense qu’elle devrait uniquement vous fournir des données pour les questionnaires où "Question n". est une dimension pertinente.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top