عكس (أو التراجع) عبء كبير إلى جدول مستودع الحقيقة

StackOverflow https://stackoverflow.com/questions/422041

  •  05-07-2019
  •  | 
  •  

سؤال

وحاليا، ونحن نخطط لتسجيل "الهوية دفعة" لكل دفعة من الحقائق أننا تحميل. وبهذه الطريقة، يمكننا التراجع عن الحمل في حالة نجد المشاكل.

وإذا ما اعتبرنا تتبع هوية دفعة على الصفوف البعد، أيضا؟

ويبدو أن صفوف البعد لديها قواعد مختلفة. إذا كان لنا أن نعاملهم كما ببطء المتغيرة، واستخدام واحدة من خوارزميات SCD أن يحفظ التاريخ، ثم إعادة تحميل لا يعني حقا من ذلك بكثير.

وسيناريو نموذجي. تتفق البعد، والتعامل مع SCD. حقائق الحمل. القيام به.

والإرشاد. تتفق البعد، والتعامل مع SCD. حقائق الحمل. العثور على المشكلة. حذف مجموعة من الحقائق. حل المشكلة. تحديث الحقائق. القيام به.

والسيناريو المحتمل. تتفق البعد، والتعامل مع SCD. حقائق الحمل. العثور على المشكلة. حذف مجموعة من الحقائق والصفوف البعد. حل المشكلة. تتفق البعد، والتعامل مع SCD. حقائق الحمل. القيام به.

ولا يبدو مثل تعقب التغييرات البعد يساعد كثيرا على الإطلاق. أي توجيهات بشأن أفضل السبل للتعامل مع "التراجع" أو "التراجع" من حمولة مستودع البيانات؟

وأدوات ETL لدينا هي تطبيقات بيثون تماما نما المنزل.

هل كانت مفيدة؟

المحلول

من وجهة نظري طالما كنت لا يسيئون أبعاد الخاص بك (مثل تتبع الوقت لميلي ثانية واحدة) لم يكن هناك الكثير من مكاسب قد يكون من خلال تتبع أبعاد العودة إلى الحالة السابقة. كما يمكنك بناء أداة لأبعاد غير مرجعية تنظيف مرة واحدة في الشهر.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top