بيانات Oracle تصميم مستودع - الواقع الجدول بوصفها البعد ؟

StackOverflow https://stackoverflow.com/questions/1638076

  •  08-07-2019
  •  | 
  •  

سؤال

شكرا:كل الإجابات هنا هي مفيدة جدا ولكن يمكنني اختيار واحد فقط.أنا حقا أقدر النصيحة!

لدينا datawarehouse سيتم استخدام أكثر عن سير العمل تقارير من التقارير التحليلية.لدينا المستخدمين يهتمون "الصورة الحالية" أكثر بكثير من التاريخ.(على الرغم من أن التاريخ مهم أيضا.) نحن حكومة الكيان الذي لا يملك تكاليف أو الحسابات ذات الصلة.في الغالب مجرد تهم الناس في مواقع معينة و مع ذات التاريخ.

نحن باستخدام أوراكل ، و قد وجدت ميزة واضحة في استخدام نجوم الانضمام كلما أمكن ذلك و أود أن rearchitect كل شيء كما تشبه نجمة المخطط كما هو معقول لدينا الاستخدامات التجارية.السرعة في هذا DW أمر حيوي ، و عدد من الاختبارات أثبتت النجم مخطط نهج لي.

لدينا "شخص" الجدول مفتاح - أنه يحتوي على أكثر من 4 ملايين السجلات وسوف تكون الأكثر استخداما مصدر في الاستعلامات. يمكن أن ينظر إليه في مركز نجم مع أبعاد متعددة (مثل العمر, الجنس, الانتماء, موقع, الخ.).فمن طاولة طويلة جدا ، خاصة عندما أنضم إلى عنوان ومعلومات الاتصال.

ومع ذلك ، فمن أشبه البعد الجدول عندما تبدأ في النظر في التاريخ.على سبيل المثال, هناك نوعان من تاريخ مختلف الجداول أن يكون الشخص مفتاح لافتا إلى الشخص الجدول.واحدة لديها أكثر من 20 مليون السجلات الأخرى لديها ما يقرب من 50 مليون ينمو يوميا.

هذا الجدول حقيقة المائدة أو بعد المائدة ؟ يمكن العمل على حد سواء ؟ إذا كان الأمر كذلك ، هل سيكون كبيرا الأداء المشكلة ؟ هو شائع الاستعلام أكثر من البعد من الحقيقة ؟ ماذا يحدث إذا المختلفة جدول حقيقة أن يستخدم الشخص الجدول كبعد هو في الواقع فقط من 60 ، 000 السجلات (أصغر من ذلك بكثير.).

أعتقد أن المشكلة هي أن لدينا البيانات واستخدامها لا يتناسب مع عادة استخدام أمثلة من نجوم المخططات.

التوضيح: بعض الأفكار الجيدة تم إضافة أدناه ، ولكن ربما تركت الكثير حقا شرح حسنا.هنا بعض مزيد من المعلومات:

علينا التعامل مع قواعد بيانات الناخبين.ونحن لم يكن لديك أي التدابير باستثناء الناخبين التهم من قبل مختلف الفئات:الناخبين التهم من قبل الحزب ، حسب العمر حسب الموقع ؛ الناخبين التهم من قبل الاقتراع نوع الانتخاب بالاقتراع حالة الانتخابات ، إلخ.لدينا "التصويت التاريخ" سجل فضلا عن نشاط التدقيق سجل (تغيير العنوان, حزب, الخ.).لدينا معلومات عن الناخبين في الانتخابات العمال وجميع المعلومات ذات الصلة.أعتقد أنني سوف تحصل على الطرفية الاشياء في وقت لاحق.

الآن أنا أركز على اثنين الرئيسية "العمليات التجارية":تسجيل الناخبين(وهو الناخبين.) و نسبة الإقبال على الانتخابات.في أول الناخبين هو الواقع.في الثانية الناخبين هو البعد ، جنبا إلى جنب مع الطرف, الانتخابات, و نوع من الاقتراع.(و في حالة أي شخص قلق - لا نحن لا نعرف كيف يصوت الناس.فقط أن يفعلوا.لول )

أتمنى أن يوضح الأمور قليلا.

هل كانت مفيدة؟

المحلول 3

حسنا هذا ليس كامل "الجواب" ، لكنه قريب.

لاحظ هذا بلوق الدخول واصفا كيمبل المحاضرة:http://database-geek.com/2005/03/28/a-day-with-ralph-kimball-part-2/

السبب أنا تكافح هو أن هذا هو "المنحطة" البعد.بلدي الناخبين رنيم و المعلومات المرتبطة واحد إلى واحد "التسجيل" الواقع الجدول.لذلك يبدو أنه حتى موافق مع كيمبل لرمي أن في الواقع الجدول.

حتى الآن أنا فقط أنظر إلى ما يحدث عندما جدول حقيقة من الواقع الجدول.

تحرير:أيضا, لقد وجدت غوغلينغ مصطلح "الوحش" البعد أن تكون مفيدة جدا.هذا هو مثل الكثير من التغير ببطء العملاء البعد.طالما أنا على استعداد ندفة الثلج ، لا أستطيع تحقيق ما أريد نجوم ينضم عند الاستعلام عن الناخبين ، و لا تسبب مشاكل استخدام الناخب البعد عن الواقع مختلف الجداول.

تحرير:هنا كان الاستنتاج النهائي:كما نصحت أعلاه ، الهدف من ذلك هو تسهيل العملية التجارية ، لا يصلح كتاب الرسم البياني.

عملنا هو أن هناك على الإطلاق أي سبب تفكك الناخبين الجدول (وجود الواقع الجدول "تسجيل" و البعد عن "الناخبين") - عند الاستعلام عن هذا الجدول سوف تريد كل الصفات وكذلك كل الأعلام والمعلومات النص.لا أريد أن كسر سمات بشكل منفصل في "الواقع" (مثل كيمبل الكتاب يدل على العملاء وأوامر) لأن هذه الصفات تعني شيئا مختلفا عندما تعلق الوقائع من عند تعلق الأبعاد.مزيد من الناخبين يتم استخدام سمة في عدة أماكن أخرى لا تناسب التقليدية نجوم.

هدفي الرئيسي هو السرعة.لذلك اخترت صيغة معدلة - الكثير مثل ندفة الثلج - أين الناخبين هو مركز جداول متعددة و أوراكل يمكن استخدام نجوم الانضمام عندما مؤشر الحق في كل شيء.ثم يمكنني استخدام الناخب البعد في جميع أخرى "النجوم".في كل حال, أنا وضعت حتى أن معظم إن لم يكن جميع الجداول يمكن انضم باستخدام النجم الانضمام ، على الرغم من أنها ليست "الكتب المدرسية".

شكرا مرة أخرى للحصول على مساعدة!

نصائح أخرى

إذا كان ذلك ممكنا ، اقتراحي سيكون ريفاكتور هذه الجداول بحيث تكون في محاذاة مع نجمة حقيقية المخطط.على الرغم من أن 50 مليون سجل يبدو مثل الكثير (عند التفكير في المعاملات النظام) لدينا عدة الواقع الجداول مع ما يصل إلى 500 مليون الصفوف.على افتراض أن الجهاز كان speced لهذا النوع من العمل ، يجب أن لا يكون لديك أي مشاكل مع الجمع بين الجداول الخاصة بك في الواقع الجدول (على افتراض انهم جميعا في نفس المجال).

وقال مع ذلك, تأكد من أن حساب العوامل الأخرى التي ينبغي النظر فيها عند اختيار للغاية denormalized هيكل.النجم مخطط تصميم كبير في الإبلاغ عن البيانات بسبب انخفاض اللازمة ينضم, ومع ذلك ، غالبا ما يدفع كبيرة ثمن هذا أثناء تحديث الجداول في مساحة القرص.عندما كنت أقول أن كنت تفكر في استخدام هذا المخطط على أكثر من تطبيق سير العمل بدلا من أن معظمها تحليلات, ثم أود أن تأكد من أن حساب للحصول على التحديثات.هي التحديثات اللازمة في الوقت الحقيقي أو قرب الوقت الحقيقي ؟ إذا كان الأمر كذلك ، مرة أخرى قد لا ترغب في النظر في النجوم.

أخيرا, نعم في بعض الحالات ونحن الاستعلام فقط لدينا الجداول البعد في كثير من الأحيان عندما يحتاج تطبيق قائمة محددة من العناصر (أيالمنتجات للعملاء ، إلخ) هذا العرض ساري على حل أفضل من المرجح أن نفوذ نظام الوثائق الرسمية بدلا من نجمنا المخطط.

ما وجدت هو بقدر ما أنا أحاول أن أجعل المخطط تبدو وكأنها شيء الحق في الخروج من Inmon أو كيمبل كتاب تقريبا لم يعمل دون بعض العالم الحقيقي custimization.

تحرير أنا متأكد من أن يكون أكثر تحديدا مع الإشارة إلى المواد المستنفدة للأوزون.

تنفيذية مخزن البيانات (أو "المواد المستنفدة للأوزون") هي قاعدة بيانات تهدف إلى دمج البيانات من مصادر متعددة لجعل التحليل والإبلاغ أسهل.لأن البيانات تأتي من مصادر متعددة ، التكامل غالبا ما ينطوي على تنظيف, حل التكرار والتحقق ضد قواعد العمل من أجل النزاهة.نظام الوثائق الرسمية عادة ما تكون مصممة تحتوي على مستوى منخفض أو الذرية (غير قابلة للتجزئة) البيانات (مثل المعاملات والأسعار) المحدودة التاريخ التي يتم التقاطها في "الوقت الحقيقي" أو "قرب الوقت الحقيقي" بدلا من كميات أكبر من البيانات المخزنة في مستودع البيانات عموما على أقل تواترا.

وفقا بيل Inmon ، المنشئ مفهوم ، المستنفدة للأوزون هو "موضوع المنحى ، متكاملة ، متقلبة ، الحالي الكرام مفصلة فقط جمع البيانات في دعم المنظمة تحتاج لمدة تصل إلى الثانية التشغيلية المتكاملة الجماعية المعلومات."

المواد المستنفدة للأوزون تختلف من Inmon تعريف مستودع بيانات المؤسسة من خلال وجود محدود التاريخ ، وأكثر تواترا التحديث من EDW.في الممارسة المواد المستنفدة للأوزون تميل إلى أن تكون أكثر تعبيرا من مصدر الهياكل من أجل سرعة التنفيذ وتوفير أصدق تمثيل بيانات الإنتاج.

http://en.wikipedia.org/wiki/Operational_data_store

كبيرة "الشعب" (العملاء) أبعاد هي متكررة في الاتصالات والبنوك والتأمين وما إلى ذلك.كيمبل قسم اسمه "كبير العملاء المتغيرة الأبعاد" تحت CRM الفصل (6).فإنه يوضح كيفية إنشاء "minidimensions".تغيير في كثير من الأحيان أو في كثير من الأحيان بتحليل سمات (الأعمدة) هي كسر في فصل مصغرة البعد الجداول.هذه مصغرة الأبعاد ترتبط عبر جدول حقيقة, لذلك الواقع الجدول يحتوي على FK لكل من هذه الجداول بشكل منفصل.

يبدو لي أن المثال الخاص بك هو قريب من هذا.

كقاعدة عامة, جدول البعد هو البحث في الجدول عن الأشياء التي نادرا ما تغير (الناس, حسابات, الوقت, منتجات, متجر) و الواقع الجدول يلتقط النشاط (التاريخ) التفاعلات بين هذه الكائنات.الواقع الجدول يحتوي على التدابير التي كنت تريد أن إجمالي (إجمالي المبيعات ، عدد ساعات العمل ، عدد الأجزاء المنتجة ، الخ..).

بعد التوضيح:
أود أن أقول أن الناخب هو في الواقع تتفق مع البعد -- مشتركة لجميع مراكز بيانات (العمليات التجارية).أخرى مطابقة أبعاد ليكون:تاريخ الحزب الانتخابات ، VotingStations.مصغرة الأبعاد سيكون الديمغرافي GeoArea.الواقع الجداول ليكون:RegistrationEvent (من متى و أين مسجلة) ElectionEvent (من متى و أين صوت في الانتخابات ، وذلك باستخدام ما).
البعد الناخبين و الواقع RegistrationEvent يتم تحميلها من أنظمة التشغيل التي القبض على تسجيل الناخبين وغيرها من التغيرات.
هذا هو المبسطة ، ولكن آمل أن يلتقط الفكرة الأساسية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top