Come essere fisicamente / logicamente separare il livello di integrazione e il data warehouse ed è necessario?

StackOverflow https://stackoverflow.com//questions/25085968

Domanda

Sul nostro test DWH server, stiamo utilizzando Vertica Community Edition.Siamo molto soddisfatti del processo ETL e delle prestazioni delle domande.

Importiamo dati da poche fonti (Informix, SQL Server, MySQL, Google Docs) che lo mettono in uno schema, con prefisso BussinessProcessName_Stage _

Alla fine del processo ETL ci sono molte tabelle chiamate bussinessprocessname_fact e bussinessprocessname_dim_dimname e pochi shared_dim_dimname .

C'è bisogno di separare tali tabelle in uno schema diverso, o forse diverso database? La stessa domanda è per i dati Marts all'interno DWH.

Stiamo usando lo schema a stella, per lo più, mostrare poche volte, e ci sono anche un Data Mart progettato da tavolino.

È stato utile?

Soluzione

La maggior parte dei sistemi di database utilizza il livello del database come la più alta gerarchia logica. Tuttavia, Vertica consente solo a un singolo database di essere in esecuzione in una sola volta. Ciò significa che il design logico avviene a livello dello schema. Ad esempio, un sistema di database tradizionale può avere database come customers e orders. In Vertica, questi sarebbero identificati a livello dello schema.

L'organizzazione logica e la convenzione di denominazione varia tra le organizzazioni. Ciò che conta è che sia standard e usato in modo coerente. Potresti voler guardare cosa si adatta logicamente e di conseguenza dei tabelle di gruppo. Ad esempio, ogni nome del processo aziendale può avere il proprio schema (business_process_name.fact_table). È una pratica migliore essere esplicita piuttosto che usare un singolo schema, anche se hai poche tabelle. Se in futuro aggiungi tabelle aggiuntive, sarà più facile da gestire.

Un altro vantaggio dell'utilizzo degli schemi sarebbe per l'amministrazione. Quando si eseguono backup o attività di manutenzione, possono essere eseguiti a livello dello schema.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top