سؤال

قد يكون هذا سؤالًا سخيفًا! لدي صفيف p الذي يمثل توزيع احتمال بعض البيانات على سبيل المثال [0 ؛ 0.3 ؛ 0.7] كيف يمكنني تحديد نوع أو فئة توزيع الاحتمالات المنفصلة لـ p؟ البيانات الأصلية غير متوفرة بالنسبة لي.

يتطلب مني Dfittool أو FitDist إعطاء البيانات كمدخلات ، بينما لدي بالفعل توزيع الاحتمالات. أيه أفكار؟

هل كانت مفيدة؟

المحلول

لا يمكن معرفة ذلك مسبق ما هو نوع التوزيع الذي يأتي منه بعض البيانات (خاصةً مع انخفاض N كما في مثالك).

إذا كانت لديك فكرة عن العملية التي ولدت بياناتك ، فقد تتمكن من الحصول على فكرة عن التوزيعات التي يجب اختبارها. ربما تأتي بياناتك من عائلة توزيعات Gamma ، وربما تأتي بياناتك من عائلة توزيعات Weibull وما إلى ذلك. ثم يمكنك وضع هذه التوزيعات العامة ومعرفة ما إذا كان من المحتمل أن تبسيط إلى توزيع أكثر شيوعًا.

للحصول على تمثيل مرئي لمدى جودة بياناتك التي يمكن أن تقارب توزيع معين ، يمكنك استخدامها Problot.

بمجرد تحديد التوزيعات المحتملة ، يمكنك وضعها مع البيانات واستخدامها معيار المعلومات بايزي (BIC) لمقارنة ما الذي يصف البيانات الأفضل. لاحظ أنه ما لم يكن لديك أعداد هائلة من البيانات الخالية من الضوضاء ، فمن المستحيل معرفة أي ملاءمة صحيحة إذا كان لديك العديد من التوزيعات المحتملة مع BIC منخفضة نسبيًا.

نصائح أخرى

ربما تكون قد رأيت توزيعات احتمالية مختلفة أثناء محاضرة أو قراءتك. كل ما عليك فعله هو تخطيط التوزيع المعطى ضد المرشحين. نظرًا لأن التوزيعات نفسها معتمدة ، فإن خطأ المنحنى أو خطأ في نهاية التجربة. قد يكون التوزيع بأقل خطأ ، أفضل ملاءمة ، هو الذي تبحث عنه.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top