سؤال

في مستودع البيانات الجديد الخاص بي والذي تم إنشاؤه (بالطبع) من قاعدة بيانات OLTP، قمت بإسقاط جميع أعمدة IDENTITY وغيرتها إلى أعمدة INT.

ما هي أفضل الممارسات فيما يتعلق بما يلي خاصة وأن المستودع غير طبيعي:

  1. المفتاح الأساسي
    -> قد يكون هذا الآن مفتاحًا مركبًا نظرًا لدمج العديد من الجداول معًا
    -> هل أحتاج إلى اتباع البنية الرئيسية من OLTP؟

  2. قيود
    -> هناك بعض القيود (ليست فارغة) ذات القيم الافتراضية (0) لأعمدة البت
هل كانت مفيدة؟

المحلول

بالنسبة لمفتاحك الأساسي، فكر في استخدام مفتاح بديل أو بديل؛ستحتاج إلى تلبية الأبعاد المتغيرة ببطء، على سبيل المثال.إذا كنت تقوم بإعداد تقرير على مدى السنوات الخمس الماضية عن متوسط ​​المبيعات لكل مندوب مبيعات متزوج/غير متزوج، فستحتاج إلى تسجيل حقيقة أن شخصًا ما كان غير متزوج لمدة عامين، ثم تزوج خلال آخر 3 سنوات.وهذا يعني أن مستودع البيانات الخاص بك سيحتوي على صفين من جدول الأبعاد لنفس الشخص.سيكون اتباع بنية OLTP لذلك أمرًا صعبًا :)

القيود ليست مشكلة أقل.تم تحسين DWs بشكل كبير للقراءات (بافتراض أنك تقوم بالتعبئة كدفعة)، ولا تؤثر القيود حقًا في عمليات القراءة.يمكنك عادةً التغلب على أي مشكلات تتعلق بالقيود المتعلقة بمهمة نشر DW الخاصة بك، والتعامل مع القيم الخالية وما إلى ذلك.في أداة الإبلاغ إذا لزم الأمر.من الأهم بكثير التأكد من أن القيم الافتراضية تتناسب مع نموذج البيانات المفاهيمية الخاص بك، ولا تسبب مشكلات في أدوات عميل DW.

نصائح أخرى

ل البعد الجداول:

  • احتفظ بالزيادة التلقائية البديلة (الهوية) PK، باستثناء بُعد التاريخ (انظر أدناه).
  • تأكد من أن لديك "مفتاحًا طبيعيًا" بديلاً للسماح بتغيير الأبعاد ببطء (النوع 2).
  • لا يُسمح بالقيم الخالية في جداول الأبعاد، واستبدلها بـ "غير متوفر، غير مُدخل، غير معروف.."
  • إذا كان ذلك ممكنًا، قم بتغيير العلامات المنطقية (1/0) إلى "نعم، لا" مطولة، لجعل التقرير/الأعمال سهل الاستخدام.
  • تخلص من الحقول المحسوبة واستبدلها بالقيم، أو على الأقل استمر في الحقل المحسوب - يعتمد على قاعدة بيانات.
  • قم بتنفيذ مخطط النجمة إذا استطعت، واستبدل المساحة بالسرعة.ندفة الثلج فقط إذا كان عليك ذلك.
  • تحقق من استفساراتك، إذا كانت هناك وظيفة في WHERE جملة، أضف عمودًا إلى جدول الأبعاد واحسب القيم مسبقًا.
  • من السهل تقسيم بُعد التاريخ إذا كان PK يبدو مثل 20090619.
  • تخلص من قيود التحقق والإعدادات الافتراضية، وانقل ذلك إلى ملف يتوافق مرحلة عملية ETL.تعمل عمليات التحقق والإعدادات الافتراضية على إبطاء التحميل، وبمجرد الانتهاء من التحميل، لا تلعب أي دور.

ل حقيقة الجداول:

  • ضع في اعتبارك وجود PK بديل للزيادة التلقائية (الهوية) للسماح بالتقسيم السهل، إذا كنت تستخدم PK المركب، فيمكنك إنشاء مركب فريد غير متجمع بدلاً من ذلك.

  • احتفظ بنصوص مفاتيحك الخارجية في مكان آمن، فمن الممارسات الشائعة إسقاط المفاتيح قبل تحميل جداول الحقائق لتسريع عملية التحميل.يقوم بعض الأشخاص بتشغيل DW باستخدام المفاتيح الخارجية "المنطقية فقط"، ويستخدمون استعلامات "البحث عن الأيتام" بعد التحميل.

إيتل

  • صمم عملية ECCD (ETL) الخاصة بك خلال جميع المراحل:استخراج، تنظيف، مطابقة، تسليم.
  • إذا أمكن، احتفظ بالنتائج (الملفات) المتوسطة بعد كل مرحلة لأغراض التدقيق والتصحيح.
  • قم بتوثيق ETL، وفي حالة استخدام البرامج النصية، استخدم التحكم في الإصدار حتى تتمكن من مطابقة إصدارات البرامج النصية مع الملفات المؤرشفة (الوسيطة).
  • إذا كان لديك مخطط نسب بيانات، فإن برنامج Excel أفضل من لا شيء.احتفظ بالإصدارات أيضًا.

أود أن أقول عن 2.:أعمدة البت -> تعمل كأعمدة منطقية -> يُسمح فقط بـ 1/0 (صواب/خطأ) -> القيد موافق

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top