سؤال

لقد دهشت R quantile وظيفة كل يوم.

لدي بديهية فكرة كيف quantiles العمل, و M. S.في احصائيات, ولكن يا فتى, وثائق أنها مربكة بالنسبة لي.

من مستندات:

Q[أنا](p) = (1 - جاما) × [ي] + غاما x[j+1],

أنا مع ذلك حتى الآن.عن نوع أنا quantile ، الاستيفاء بين x[ي] x [j+1] ، استنادا إلى بعض غامضة المستمر غاما

حيث 1 <= أنا <= 9, (ي-م)/n <= p < (j-m+1)/ n, x[ي] هو jth النظام إحصائية, n هو حجم العينة ، و م هو ثابت يحدده عينة quantile نوع.هنا غاما يعتمد على الجزء الكسري من ز = np+m-j.

حتى, كيفية حساب جي ؟ م ؟

المستمر عينة quantile أنواع (من 4 إلى 9) ، العينة quantiles يمكن الحصول عليها عن طريق الخطية الاستيفاء بين kth النظام إحصائية و p(k):

p(k) = (ك - ألفا) / (n - ألفا - بيتا + 1), حيث β α و هي الثوابت تحديد حسب نوع.كذلك m = alpha + p(1 - ألفا - بيتا) و جاما = g.

الآن أنا حقا فقدت.ع ، الذي كان ثابتا من قبل ، هو الآن على ما يبدو وظيفة.

حتى نوع 7 quantiles ، الافتراضي...

نوع 7

p(k) = (k - 1) / (n - 1).في هذه الحالة, p(k) = وضع[F(x[ك])].هذا يستخدم من قبل S.

أي شخص تريد أن تساعدني ؟ وبخاصة أنا في حيرة من تدوين p كونه وظيفة ثابتة, ما هيك م و الآن لحساب ي عن بعض p.

أتمنى أنه بناء على الإجابات هنا ، يمكننا تقديم بعض الوثائق المنقحة أن أفضل ما يفسر ما يجري هنا.

quantile.R البرمجية المصدر أو من نوع:quantile.الافتراضي

هل كانت مفيدة؟

المحلول

أنت الخلط المفهوم.هذا التوثيق هو رهيبة.واضطررت إلى العودة إلى ورقة تقوم على (Hyndman, R. J.;مروحة, Y.(تشرين الثاني / نوفمبر 1996)."عينة Quantiles في الحزم الإحصائية". أمريكا إحصائي 50 (4): 361–365. دوى:10.2307/2684934) للحصول على فهم.دعونا نبدأ مع أول مشكلة.

حيث 1 <= أنا <= 9, (ي-م)/n <= p < (j-m+1)/ n, x[ي] هو jth النظام إحصائية ، n هو حجم العينة ، و م هو ثابت يحدده عينة quantile نوع.هنا غاما يعتمد على جزء كسري من ز = np+m-j.

الجزء الأول يأتي مباشرة من الورق ، ولكن ماذا وثائق الكتاب محذوفة كان ذلك j = int(pn+m).وهذا يعني Q[i](p) يعتمد فقط على اثنين من أجل إحصاءات أقرب إلى كونها p جزء من الطريق من خلال (فرز) الملاحظات.(لمن مثلي الذين لم يعتادوا على مصطلح "النظام إحصاءات" سلسلة من الملاحظات هو فرز السلسلة.)

كما أن الجملة الأخيرة هو مجرد خطأ.يجب قراءة

هنا غاما يعتمد على جزء كسري من np+m ، g = np+m-j

أما بالنسبة m هذا واضحة. m يعتمد على أي من 9 خوارزميات تم اختياره.حتى مجرد مثل Q[i] هو quantile وظيفة ، m وينبغي النظر m[i].عن الخوارزميات 1 و 2 ، m 0 ، 3 ، m هو -1/2 ، للآخرين, هذا في الجزء التالي.

المستمر عينة quantile أنواع (من 4 إلى 9) ، العينة quantiles يمكن الحصول عليها عن طريق الاستيفاء الخطي بين kth أجل إحصاء و p(k):

p(k) = (ك - ألفا) / (n - ألفا - بيتا + 1) ، حيث β α و هي الثوابت تحديدها من قبل نوع.كذلك m = alpha + p(1 - الفا - بيتا) و جاما = g.

هذا هو مربكة حقا.ما الوثائق المكالمات p(k) ليس هو نفسه كما p من قبل. p(k) هو بالتآمر الموقف.في ورقة ، والمؤلفون كما pk, الذي يساعد.خصوصا في التعبير عن m, ، p هو الأصلي p, ، m = alpha + p * (1 - alpha - beta).من الناحية النظرية ، خوارزميات 4 إلى 9 نقاط (pk, x[k]) هي محرف للحصول على الحل (p, Q[i](p)).كل خوارزمية فقط يختلف في خوارزمية pk.

أما عن الجزء الأخير ، R هو مجرد ذكر ما يستخدم.

الورقة الأصلية يعطي قائمة من 6 "من المرغوب فيه خصائص عينة quantile" وظيفة ، والدول تفضيل #8 الذي يرضي كل من 1.#5 يرضي كل منهم ولكنهم لا ترغب في ذلك على أسس أخرى (أنه من أكثر الظواهر من المستمدة من مبادئ).#2 ما هو غير ستات المهوسون مثل نفسي ستنظر في quantiles و هو ما هو موضح في ويكيبيديا.

راجع للشغل, استجابة dreeves الإجابة, الرياضيات يفعل الأشياء بشكل مختلف إلى حد كبير.أعتقد أنني أفهم رسم الخرائط.في حين أن الرياضيات هي أسهل للفهم ، (أ) أنه من الأسهل أن تطلق النار على قدمك مع لا معنى لها المعلمات ، و (ب) لا يمكن أن تفعل R خوارزمية #2.(هنا Mathworld هو Quantile الصفحة, التي تنص على الرياضيات لا تستطيع أن تفعل #2, ولكنه يعطي أبسط التعميم من جميع خوارزميات أخرى في أربع معلمات.)

نصائح أخرى

هناك طرق مختلفة من الحوسبة quantiles عند إعطائها ناقلات, و لا يعرف CDF.

النظر في مسألة ما يجب القيام به عندما الملاحظات الخاصة بك لا تقع على quantiles بالضبط.

و "أنواع" هي مجرد تحديد كيفية القيام بذلك.لذا ، فإن أساليب تقول "استخدام الخطية بين ك ال من أجل إحصاء و p(k)".

إذا ، ما هو p(k)?واحد يقول الشاب: "حسنا, أود أن استخدام k/n".رجل آخر يقول: "أود أن استخدام (k-1)/(n-1)" إلخ.كل هذه أساليب مختلفة الخصائص التي هي أكثر ملاءمة مشكلة واحدة أو أخرى.

الاسم \ألفا و \بيتا هي مجرد طرق parameterize وظائف p.في حالة واحدة ، هم 1 و 1.في حالة أخرى, أنهم 3/8 و -1/4.أنا لا أعتقد أن ف أي وقت ثابت في الوثائق.انهم فقط لا تظهر دائما الاعتماد صراحة.

انظر ما يحدث مع أنواع مختلفة عندما كنت وضعت في النواقل مثل 1:5 و 1:6.

(لاحظ أيضا أنه حتى إذا كان لديك ملاحظات تقع بالضبط على quantiles أنواع معينة سوف لا تزال تستخدم الخطية).

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top