Frage

Ich habe durch die R Quantilsfunktion den ganzen Tag mystifiziert worden.

Ich habe eine intuitive Vorstellung davon, wie Quantile Arbeit und eine M.S. in Statistiken, aber Junge, Junge, die Dokumentation ist verwirrend für mich.

Aus der Dokumentation:

  

Q [i] (p) = (1 - gamma) x [j] + gamma   x [j + 1],

Ich bin mit ihm so weit. Für einen Typen i Quantil, es ist eine Interpolation zwischen x [j] und x [j + 1], basierend auf einer mysteriösen Konstante Gamma

  

, wobei 1 <= i <= 9, (j-m) / n <= p <   (J-m + 1) / n, x [j] ist die j-ten Ordnung   Statistik, n ist die Stichprobengröße und m   eine Konstante ist, die von der Probe bestimmt,   Quantil-Typ. Hier Gamma hängt davon ab,   der Bruchteil von g = np + m-j.

Also, wie j berechnen? m?

  

Für die kontinuierliche Probe Quantil   Typen (4 bis 9), wobei die Probe   Quantile kann durch lineare erhalten werden   Interpolation zwischen der k-ten Ordnung   Statistik und p (k):

     

p (k) = (k - alpha) / (n - alpha - beta   + 1),   wobei α und β Konstanten sind, bestimmt,   durch die Art. Ferner m = alpha + p (1   - alpha - beta) und Gamma = g

.

Jetzt bin ich wirklich verloren. p, die eine konstante vorher war, ist nun offenbar eine Funktion.

Also für Typ 7 Quantile der Standard ...

  

Typ 7

     

p (k) = (k - 1) / (n - 1). In diesem Fall wird p (k) = Modus [F (x [k])]. Dies wird verwendet, um S.

Wer will mir helfen? Insbesondere bin ich durch die Notation von p verwirrt eine Funktion und eine Konstante ist, was zum Teufel m ist, und jetzt j einen bestimmten Namen p zu berechnen.

Ich hoffe, dass auf der Grundlage der Antworten hier, können wir eine überarbeitete Dokumentation vorlegen, die besser erklärt, was hier vor sich geht.

quantile.R Quellcode oder Typ: quantile.default

War es hilfreich?

Lösung

Sie sind verständlicherweise verwirrt. Diese Dokumentation ist schrecklich. Ich musste auf das Papier zurückgehen seine basierend auf (Hyndman, RJ; Fan, Y. (November 1996) "Probe Quantile in Statistischem Packages" American Statistician 50 (4):.. 361-365 . doi: 10,2307 / 2684934 ) ein Verständnis zu bekommen. Beginnen wir mit dem ersten Problem starten.

  

, wobei 1 <= i <= 9, (jm) / n <= p <(jm + 1) / n, x [j] ist die j-te Ordnungsstatistik, n ist die Probengröße und m eine konstante, die von der Probe Quantil Typ bestimmt. Hier Gamma ist abhängig von dem Bruchteil von g = np + m-j.

Der erste Teil kommt direkt aus dem Papier, aber was die Dokumentation Autoren weggelassen war, dass j = int(pn+m). Das bedeutet, Q[i](p) hängt nur von der beide Auftragsstatistik am nächsten p Bruchteil des Weges durch die (sortiert) Beobachtungen zu sein. (Für diejenigen, die wie mich, der mit dem Begriff nicht vertraut sind, die „Auftragsstatistik“ eine Reihe von Beobachtungen ist die sortierte Serie).

Auch der letzte Satz ist einfach falsch. Es sollte lesen

  

Hier Gamma ist abhängig von dem Bruchteil von np + m, g = np + m-j

Wie bei m, die unkompliziert ist. m hängt davon ab, welche der 9-Algorithmen gewählt. So wie Q[i] die Quantilsfunktion ist, sollte m m[i] in Betracht gezogen werden. Für Algorithmen 1 und 2 ist m 0, 3, m ist -1/2, und für die andere, das ist im nächsten Teil.

  

Für die kontinuierlichen Proben Quantil-Typen (4 bis 9), wobei die Probe Quantile kann durch lineare Interpolation zwischen der k-ten Ordnungsstatistik und p (k) erhalten:

     

p (k) = (k - alpha) / (n - alpha - beta + 1), wobei α und β Konstanten sind, durch die Art bestimmt. Weiterhin m = alpha + p (1 - alpha - beta) und Gamma = g

.

Das ist wirklich verwirrend. Was die Dokumentation nennt p(k) ist nicht das gleiche wie die p aus der Zeit vor. p(k) ist die Position Plotten. In dem Papier, schreiben die Autoren es als p k , was hilft. Vor allem, da in dem Ausdruck für m ist die p die ursprüngliche p und die m = alpha + p * (1 - alpha - beta). Konzeptionell für Algorithmen 4-9, die Punkte (p k , x[k]) interpoliert, um die Lösung zu erhalten (p, Q[i](p)). Jeder Algorithmus unterscheidet sich nur in den Algorithmus für die p k .

Wie für das letzte Bit, R nur sagen, was S verwendet wird.

Das ursprüngliche Papier gibt eine Liste von 6 „wünschenswerten Eigenschaften für eine Probe Quantil“ -Funktion, und stellt fest, eine Präferenz für # 8, die alle von ihnen alle um 1 # 5 erfüllt erfüllt, aber sie mögen es nicht auf andere Gründe (es ist mehr als phänomenologische von Prinzipien abgeleitet). # 2 ist, was nicht-Stat-Freaks wie mich würde die Quantile betrachten und ist das, was in Wikipedia beschrieben wird.

BTW, in Reaktion auf dreeves beantworten , Mathematica macht deutlich anders. Ich denke, dass ich das Mapping verstehen. Während Mathematicas leichter zu verstehen ist, (a) ist es einfacher, sich in den Fuß mit unsinnigen Parameter zu schießen, und (b) es Algorithmus # ist R 2 nicht tun können. (Hier Mathworld der Quantile , die Mathematica heißt es kann nicht # 2 tun, sondern gibt eine einfachere Verallgemeinerung aller anderen Algorithmen in Bezug auf die vier Parameter.)

Andere Tipps

Es gibt verschiedene Möglichkeiten, quantiles Computing, wenn Sie es einen Vektor geben, und keine bekannten CDF haben.

Betrachten wir die Frage, was zu tun ist, wenn Sie Ihre Beobachtungen auf quantiles fallen nicht genau.

Die „Typen“ sind nur zu bestimmen, wie das zu tun. So ist die Methoden sagen: "verwenden, um eine lineare Interpolation zwischen der k-ten Ordnungsstatistik und p (k)".

Also, was ist p (k)? Ein Mann sagt: „Nun, Ich mag k / n verwenden“. Ein anderer Mann sagt, usw. Jede dieser Methoden haben unterschiedliche Eigenschaften „I (k-1) / (n-1) verwenden möchten“, die besser für ein Problem oder eine andere geeignet sind.

Die \ alpha und \ beta ist nur Möglichkeiten sind die Funktionen p zu parametrieren. In einem Fall, sie sind 1 und 1. In einem anderen Fall sind sie 3/8 und -1/4. Ich glaube nicht, das P ist immer eine Konstante in der Dokumentation. Sie zeigen nur nicht immer die Abhängigkeit explizit.

Sehen Sie, was mit den verschiedenen Typen passiert, wenn man in Vektoren wie 1 gesetzt: 5 und 1: 6.

(beachten Sie auch, dass, selbst wenn Sie Ihre Beobachtungen fallen genau auf die Quantile, bestimmte Arten noch lineare Interpolation verwenden).

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top