دمج حقائق من مصادر مختلفة؟ أو تحميل بشكل منفصل؟

StackOverflow https://stackoverflow.com/questions/227990

  •  03-07-2019
  •  | 
  •  

سؤال

لقد حصلت البيانات مع اثنين من أصول مختلفة: يأتي بعض من العملاء، ويأتي بعض من مختلف البائعين. حاليا، نحن جسديا "دمج" هذه البيانات في جدول واسع مع ما يقرب من مائة والأعمدة، وعشرات الآلاف من الصفوف وأي فصل رسمي من البعدين. ونتيجة لذلك، لا يمكننا فعلا استخدام هذا الجدول لمن ذلك بكثير.

وانا ذاهب الى إعادة تصميم هذه الفوضى إلى السليم، ولكن صغيرة، نجم المخطط.

والبعدين واضحة. واحد منهم، على سبيل المثال، هو الوقت.

والبيانات التي يتم توفيرها للعملاء يوفر عددا من القيم الحقيقة. كل بائع قد (أو قد لا) توفر القيم الحقيقة الإضافية التي تتناسب مع نفس الأبعاد.

وبيانات هذه الحقيقة لديه كل نفس التفاصيل. يمكن أن يطلق عليه "متفرق" لأننا لا غالبا الحصول على معلومات من جميع البائعين.

وهنا معضلة بلادي.

هل هذا الجدول حقيقة واحدة - مع بعض بلا قيم - تعبئة من مصادر مختلفة

وأم أن هذا <م> ن +1 الجداول حقيقة - واحد بالسكان من العملاء، وغيرها بالسكان من كل بائع

وهناك إيجابيات وسلبيات لكل تصميم. انا بحاجة الى بعض الآراء الثانية على الاختيار بين "دمج" أو "تحميل بشكل منفصل".


والإيرادات إمدادات العملاء، والتكلفة، والتهم، والأوزان، وغيرها من الامور يعرفون عن نهايتهم من الصفقة.

وبائع واحد لوازم بعض تفاصيل إضافية حول بعض المعاملات - الأوزان والتكاليف وفترات. فإن المعاملات الأخرى ليس لها قيمة من بائع واحد.

والبائع اثنين من لوازم بعض تفاصيل إضافية حول بعض المعاملات - مجلدات، المدد، أطوال، وأسعار العملات الأجنبية. فإن المعاملات الأخرى لا قيمة للبائع اثنين.

وبعض المعاملات سيكون كل من البائعين. وهناك عدد قليل المعاملات لا يملكون البائع.

وجدول واحد مع القيم الخالية؟ ثلاثة جداول؟

هل كانت مفيدة؟

المحلول

وكنت اذهب للجدول حقيقة واحدة. أبرز المؤيدين لهذا النهج هو أنه يترك كل العمل الشاق في وقت التحميل وليس في وقت الاستعلام.

نصائح أخرى

ومن ما تصفون، وهذا يبدو وكأنه الجدول حقيقة واحدة هو الطريق للذهاب.

وهذا يبدو وكأنه الجدول حقيقة سيكون له ذرة من الوقت س س معاملة العملاء (؟).

كان

وسؤالي مسبق تحاول حقا لمعرفة ما إذا كانت بعض البيانات بائع مرشح لالبعد الخاص بها. سأترك لك لتحديد ذلك. ولكن لا يبدو حقا مثل ذلك.

والحقائق خالية يمكن أن يلقي تحذيرات أثناء تجمعات (اعتمادا على منصة) لكن البديل لملء لهم الأصفار ربما مضللة هو أسوأ.

وأعتقد أنه منذ كلا مصادر يشتركان فى نفس الحبوب والجواب هو أنه يجب أن يكون الجدول حقيقة واحدة. التفكير في كيف تريد للمستخدمين النهائيين الخاص للتفاعل مع المعلومات. إذا كان من المنطقي وسوف تفيد تقارير الأعمال من تلك البيانات كونها تشترك في الموقع ثم وهذا هو جوابك. محاولة الرغم من تجنب بلا قيم في جداول الحقيقة الخاصة بك. إذا يمكنك إدخال صفر (والصفر المنطقي للبيانات، أي التفكير في درجة الحرارة) ثم فعل ذلك. كما انها ستوفر للمستخدمين بعض الارتباك وكما أشار TrickyNixon من سوف يسبب مشاكل التجميع.

وفي الواقع كنت في نقطة كبيرة هنا على تطبيق "براونفيلد". يمكنك أن تبحث في ما هو موجود اليوم والخبرة النفوذ لإنشاء تصميم أفضل. هذا هو الوقت الأكثر أهمية لاختيار أفضل الحبوب التي نأمل أن لا تغيير للحياة DW.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top