Pregunta

Es una Estrella de Esquema de diseño esencial para un almacén de datos?O se puede hacer de almacenamiento de datos con otro patrón de diseño?

¿Fue útil?

Solución

El uso de los esquemas de estrella para un sistema de almacenamiento de datos, obtiene varios beneficios y en la mayoría de los casos, es apropiado para el uso de ellos para la capa superior.Usted también puede tener una operational data store (ODS) - una cantidad normalizada de la estructura que sostiene 'estado actual' y facilita las operaciones, tales como los datos de su conformación.Sin embargo, existen razonables situaciones donde esto no es deseable.He tenido la ocasión de construir sistemas con y sin ODS capas, y había razones específicas para la elección de la arquitectura en cada caso.

Sin entrar en el subtlties de la arquitectura del data warehouse o el comienzo de un Kimball vsInmon la llama de la guerra de las principales ventajas de un esquema de estrella son:

  • La mayoría de los sistemas de gestión de base de datos tiene instalaciones en el optimizador de consultas la 'Estrella de Transformaciones" que uso Índice De Mapas De Bits las estructuras o Índice De Intersección para un rápido predicado de la resolución.Esto significa que la selección de un esquema de estrella, se puede hacer sin golpear la tabla de hechos (que es generalmente mucho más grande que la de los índices) hasta que la selección se ha resuelto.

  • Particionamiento un esquema en estrella es relativamente sencillo, ya que sólo la tabla de hechos debe ser particionado (a menos que usted tenga algunos bíblicamente grandes dimensiones). Partición de eliminación significa que la consulta optimizador de conversiones puede ignorar patitions que no podían participar en los resultados de la consulta, que se guarda en la I/O.

  • Cambiando poco a poco las dimensiones de son mucho más fáciles de implementar en un esquema en estrella de un copo de nieve.

  • El esquema es más fácil de entender y tiende a involucrar a menos que se une a un copo de nieve o E-R del esquema.Su equipo de reportaje te amo para este

  • Los esquemas de estrella, son mucho más fáciles de usar, y (más importante) hacer funcionar bien con la consulta ad hoc de herramientas tales como Objetos De Negocio o El Generador De Informes.Como desarrollador, usted tiene muy poco control sobre el SQL generado por estas herramientas que usted necesita para darle a la consulta del optimizador de ayuda tanto como sea posible.Los esquemas de estrella, dar la consulta del optimizador de relativamente poca oportunidad para equivocarse.

Normalmente, los informes de capa de uso de esquemas de estrella, a menos que tenga una razón específica para no hacerlo.Si usted tiene múltiples sistemas de origen, puede que desee implementar un Operational Data Store con una normalizado o esquema de copo de nieve que se acumulan los datos.Esto es más fácil porque un ODS no se suele hacer historia.Histórico del estado se registran en los esquemas de estrella, donde es mucho más fácil de hacer que con normalización de estructuras.Una normalizado o copo de nieve, los Datos Operativos de la Tienda refleja el actual estado y no tienen un punto de vista histórico por encima de cualquier que es inherente en los datos.

ODS procesos de carga se ocupa de los datos de depuración y conformes, lo que es más fácil de hacer con una estructura normalizada.Una vez limpio de datos en un ODS, la dimensión y el hecho de cargas puede realizar el seguimiento de la historia (cambios en el tiempo) con el genérico o relativamente simples mecanismos relativamente simple;esto es mucho más fácil hacerlo con un esquema en estrella, Muchas herramientas ETL (por ejemplo) se provee facilidades para cambiar lentamente las dimensiones y la implementación de un mecanismo genérico es relativamente sencillo.

Estratificación del sistema de esta manera providies una separación de responsabilidades - negocios y limpieza de datos lógica que se aborda en el ODS y el esquema en estrella de las cargas de acuerdo con el estado histórico.

Otros consejos

Hay un debate en curso en el datawarehousing literatura acerca de donde en el almacenamiento de datos-arquitectura de la Star-Esquema el diseño debe ser aplicado.

En breve Kimball los defensores de muy alta para el uso de sólo las Estrellas-diseño de Esquema en el almacenamiento de datos, mientras que Inmon primero quiere construir una Empresa de Almacenamiento de datos utilizando normalizado 3NF diseño y uso posterior de las Estrellas-diseño de Esquemas en los datamarts.

Además aquí también se puede decir que Esquema de copo de nieve de diseño es otro enfoque.

Un cuarto diseño podría ser el Datos De La Bóveda De Modelado enfoque.

Los esquemas en estrella se utilizan para permitir una alta velocidad de acceso a grandes volúmenes de datos.El alto rendimiento está habilitado por la reducción de la cantidad de combinaciones necesarias para satsify cualquier consulta que se pueden hacer en contra de la materia.Esto se hace por que permite la redundancia de datos en las tablas de dimensiones.

Hay que recordar que el esquema en estrella es un patrón para la parte superior de la capa para el almacén.Todos los modelos también implican la estadificación de los esquemas en la parte inferior de la bodega de la pila, y algunos también incluyen una persistente transformado fusionado área de ensayo donde todos los sistemas de origen, se combinan en una 3NF modelado de esquemas.Las diferentes materias sentarse encima de este.

Alternativas a los esquemas en estrella en el nivel superior incluyen una variación, que es un esquema de copo de nieve.Un nuevo método que se puede llevar a cabo un poco de investigación así es Datos De La Bóveda De La Modelización propuesto por Dan Linstedt.

La cosa acerca de los esquemas en estrella es que se trata de un modelo natural para el tipo de cosas que la mayoría de la gente quiere hacer con un almacén de datos.Por ejemplo, es fácil producir informes con diferentes niveles de granularidad (mes, día o año, por ejemplo).También es eficaz para insertar los datos de negocio típicos en un esquema de estrella, de nuevo, una común y característica importante de un almacén de datos.

Ciertamente, usted puede utilizar cualquier tipo de base de datos que quieras, pero a menos que usted sabe que su dominio de la empresa, muy bien es probable que sus informes no funciona tan eficientemente como podría si usted ha utilizado un esquema en estrella.

Los esquemas de estrella, son un ajuste natural para la última capa de un almacén de datos.La forma de llegar allí es otra cuestión.Que yo sepa, hay dos grandes campos, los de Bill Inmon y Ralph Kimball.Es posible que desee buscar en las teorías de estos dos chicos si/cuando usted decide ir con una estrella.

Además, algunas herramientas de generación de informes gusta mucho el esquema de estrella de la instalación.Si estás atrapado en un informe específico de la herramienta, que puede conducir a lo que la presentación de informes mart se ve como en su almacén.

Esquema en estrella es un modelo de datos lógicos de bases de datos relacionales que se ajusta al regular el almacenamiento de datos de las necesidades;si el entorno relacional es dada, de una estrella o de un esquema de copo de nieve va a ser un buen patrón de diseño, de cableado en muchos de DW metodologías de diseño.

Sin embargo, hay otros que los motores de base de datos relacional demasiado, y pueden ser utilizados para un eficiente almacenamiento de datos.Multidimensional motores de almacenamiento puede ser muy rápido para OLAP tareas (TM1 eg.);no podemos aplicar el diseño de esquema en estrella en este caso.Otros ejemplos que requieren especial de los modelos lógicos incluyen XML bases de datos o columna orientado a bases de datos (por ejemplo.la experimental C-store)).

Es posible hacer sin.Sin embargo, usted va a hacer la vida difícil para usted, su organización desea utilizar las herramientas estándar que viven en la parte superior de DWs, y esas herramientas esperar un esquema en estrella-un montón de esfuerzo gastado el ajuste de una clavija cuadrada en un agujero redondo.

Una gran cantidad de base de datos a nivel de optimizaciones suponga que tiene un esquema de estrella;usted va a pasar mucho tiempo en la optimización y reestructuración para obtener la base de datos para hacer "lo correcto" con su no del todo-estrellas de diseño.

Asegúrese de que los pros superan a los contras..

(¿Suena como yo he estado allí antes?)

-D

Hay tres problemas que tenemos que resolver.

1) ¿Cómo obtener los datos de la operativa del sistema de la fuente sin ejercer excesiva presión sobre ellos por la combinación de tablas dentro de y entre ellos, la limpieza de datos, como podemos extraer, crear obras derivadas, etc.

2) Cómo combinar datos de fuentes dispares - algunos legado, algunos basados en archivo, procedentes de diferentes departamentos en un integral, precisa, eficiente almacenado todo el que los modelos de los negocios, y no reflejan las estructuras de los sistemas de origen.Recuerde, el cambio de los sistemas / se reemplazan de forma relativamente rápida, pero el modelo básico de los negocios cambia lentamente.

3) la estructura de datos para cumplir analíticos específicos y requisitos de presentación de informes para las personas en particular/departamentos en la empresa, ya que de forma rápida y precisa como sea posible.

La solución a estos tres muy diferentes problemas requieren diferentes capas arquitectónicas para resolverlos

Ensayo De La Capa De Nos replicar las estructuras de las fuentes, pero sólo los datos modificados a partir de las fuentes se cargan cada noche.una vez que los datos se han tomado de la puesta en escena de la capa en la capa siguiente, los datos se cayó.Las consultas son solo preguntas de la tabla con un simple data_time filtro.Muy poco efecto sobre la fuente.

La Empresa De La Capa De Este es un negocio orientado a la 3ª forma normal de la base de datos.Se extraen los datos (y posteriormente abandonado) a partir de la puesta en escena de la capa en la empresa de la capa, donde se limpia, integrada y normalizada.

Presentación (Esquema En Estrella) De La Capa Aquí, el modelo de dimensiones para satisfacer los requisitos específicos.Datos es deliberadamente de normalizar para reducir el número de combinaciones.Las jerarquías que pueden ocupar varias tablas en la Empresa de la Capa se contraen en una sola dimensión de las tablas, y varias tablas transaccionales pueden ser fusionadas en una sola tabla de hechos.

Usted siempre de cara a estos tres problemas.Si usted decide acabar con la empresa de la capa, usted todavía tiene que resolver el segundo problema, pero tienes que hacerlo en el esquema en estrella de la capa, y en mi opinión, este es el lugar equivocado para hacerlo.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top