È possibile costruire un cubo OLAP in cui i dettagli del modello non sono noti in anticipo?

StackOverflow https://stackoverflow.com/questions/1002334

  •  05-07-2019
  •  | 
  •  

Domanda

Scusami per la domanda lanosa: non ho molta familiarità con OLAP & amp; cubi. Lasciami spiegare la mia situazione ...

Vorrei creare un database per archiviare i risultati del questionario, dove potrebbero esserci alcune dozzine di domande per questionario. Avendo raccolto alcune migliaia di questionari compilati, mi piacerebbe analizzare i risultati, e questo suona come un buon candidato per materiale di tipo OLAP (di cui conosco molto poco). Devo essere in grado di eseguire query su " tutti gli intervistati di sesso maschile di età compresa tra 20 e 30 anni che possiedono un cane " - ovvero combinando le risposte a "quanti anni hai", "possiedi un cane", ecc.

Voglio anche essere in grado di memorizzare i risultati del sondaggio del mese prossimo, e il mese successivo, ecc., ed eseguire query che mostrano questo mese rispetto allo scorso, ecc. Finora, tutto bene, suppongo.

Ecco il nocciolo della mia domanda: mentre questo mese il mio questionario potrebbe avere domande su sesso, età e amp; proprietà del cane, il questionario del mese prossimo potrebbe includere una domanda (per esempio) sul colore degli occhi. Potrebbe (o non potrebbe) anche far cadere alcune domande. È fattibile nel mondo OLAP o hai bisogno di conoscere tutte le "dimensioni"? (se sto usando il termine giusto) in anticipo quando progetti il ??cubo?

Inoltre, se sto eseguendo diversi sondaggi diversi con domande diverse ma sovrapposte, posso archiviarli tutti nello stesso cubo ed eseguire query tra sondaggi? Ogni sondaggio potrebbe avere alcune dozzine di domande, con un paio di dozzine sovrapposte ad altri sondaggi. I sistemi OLAP soddisfano questo genere di cose? Semplicemente non so quanto siano rigidi e se siano effettivamente appropriati per questo tipo di utilizzo.

Qualsiasi aiuto è stato molto apprezzato.

PS. Prima che qualcuno lo suggerisse, ho appena acquistato il Data Warehouse Toolkit di Kimball ma non ho ancora avuto la possibilità di leggerlo. (Sospetto che potrebbe non rispondere direttamente a questa domanda in ogni caso).

È stato utile?

Soluzione

C'è un libro bianco qui che ha una sezione relativa alla modellazione dei dati dell'indagine. Questo forse è il tipo di cosa che stai cercando.

Altri suggerimenti

Inizierò dicendo che sono anch'io un principiante OLAP, ma penso di avere un controllo su ciò che stai cercando di ottenere.

In effetti le tue domande sono una delle tue dimensioni, la risposta a quella domanda fa parte della tabella dei fatti, cioè la tabella dei fatti ha la risposta e ha dimensioni associate ad essa per età, sesso, località (forse), domande. Potrebbe sembrare un po 'indietro ma è qualcosa con cui sto venendo a patti per OLAP.

Potresti anche desiderare un'altra dimensione correlata a una domanda che li raggruppa in questionari ma che potrebbe essere solo un valore nella dimensione della domanda stessa, ad esempio Domanda {QuestionnaireID = 1, QuestionNumber = 4, QuestionText = " Possiedi un cane ? " }.

Non sono sicuro se questo aiuta, ma spero che ti dia qualche idea se non altro.

Un altro principiante OLAP anche qui ...

1) Ho solo esperienza nella creazione di cubi OLAP con Mondrian (Pentaho), che consente di rivedere lo schema del cubo, che è solo un file XML, e di ricostruirli (o in Pentaho-speak, pubblicare). Quindi, per quella piattaforma, comunque, non esistono tali requisiti per conoscere tutte le dimensioni in anticipo

2) Concordo con la raccomandazione di Lazurus sulla creazione di una dimensione di domande. Non è un requisito che ciascuno dei tuoi "fatti" ha un valore presente in tutte le dimensioni, quindi se dovessi guardare attraverso la dimensione per "Domanda n", allora credo che dovrebbe darti solo dati per i questionari in cui "Domanda n" è una dimensione pertinente.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top