설명한 변위치()함수에서 R

https://stackoverflow.com/questions/95007

01-07-2019
|

문제

나는 느끼 R quantile 기능습니다.

내가 있는 직관적인 개념을 어떻게 변위치 작업,그리고 M.S.통계에,하지만 소년은 oh boy,문서에 대한 그것이 나에게 혼란.

에서 docs:

Q[i](p)=(1-gamma)x[j]+gamma x[j+1],

나와 함께 있도록 최선을 다하고 있습니다..에 대한 유형 나 quantile,그것은 보간 사 x[j]x[j+1]에 기초하여,어떤 신비한 일정 gamma

1 <=i <=9 일(j-m)/n <=p < (j-m+1)/n,x[j]는 j 번째 순서 통계,n 는 샘플 크기,그리고 m 일정에 의해 결정된 샘플 quantile 유형입니다.여기에는 감마에 따라 달라집 의 소수부 g=np+m-j.

그래서,어떻게 계산 j?m?

에 대한 지속적인 샘플 quantile 형식(4 를 통해 9),샘플 사분위수여 얻을 수 있습니다형 보간 사 kth 순서 통계 및 p(k):

p(k)=(k-alpha)/(n-알파-베타 +1), α 및 β 은 상수 결정 에 의해 유형입니다.또한,m=alpha+p(1 -alpha-beta),감마=g.

지금 난 정말 잃었습니다.p 는 일정기 전에,지금은 명백 기능이 있습니다.

그래서 유형 7 사분위수,기본...

유형 7

p(k)=(k-1)/(n-1)입니다.이 경우에는 p(k)=모드[F(x[k])].이것은 사용 S.

사람이 나를 도와주고 싶어요?특히 난 혼동해 표기법의 p 는 함수와 일정하게 뭐 m 은,그리고는 지금 계산 j 일정 p.

나는 희망한 답변을 바탕으로 여기,우리는 제출할 수 있습니다 일부는 개정된 문서는 더 나은 무엇인지 설명하는 것입니다.

quantile.R 소스 코드 또는 유형:quantile.기본

해결책

당신이 당연하게도 혼란이다.는 문서가 끔찍하다.응용 프로그램에 대한 종이에 그에 기반한(Hyndman,R.J.;팬,Y.(월 1996)."Sample 사분위수에 통계적 패키지". 미국의 통계 50 (4): 361–365. doi:10.2307/2684934)이해를 얻을.자를 시작으로 첫 번째 문제입니다.

1 <=i <=9 일(j-m)/n <=p < (j-m+1)/n,x[j]는 j 번째 순서 통계,n 는 샘플 크기,m 은 상수에 의해 결정된 샘플 quantile 유형입니다.여기에는 감마에 따라 달라집의 소수부 g=np+m-j.

첫 번째 부분에서 바로 오는 종이지만,무엇이 문서를 작가의 생략이었다 j = int(pn+m).이 Q[i](p) 만 보고서에 따르기 위해 통계에 가장 가까운 것 p 분수의 방법을 통해(정렬)관측이다.(나 같은 사람들을 위해,사람에 익숙하지 않은 용어는"순서 statistics"시리즈의 관찰을 정렬된 시리즈입니다.)

또한,마지막 문장은 잘못된 것입니다.읽어야 합니다

여기에는 감마에 따라 달라집의 소수부 np+m,g=np+m-j

로 m 는 간단합니다. m 에 따라 달라는 9 개의 알고리즘을 선택되었다.그래서 그냥 좋 Q[i] 는 변위치 기능 m 고려해야 m[i].를 위한 알고리즘 제 1,2 m 0 3, m 가 -1/2,및 다른 사람들을 위해,그것에서 다음 부분입니다.

에 대한 지속적인 샘플 분위수 유형(4 를 통해 9),샘플분위수여 얻을 수 있습 선형 보간 사 kth 기 위해 통계 및 p(k):

p(k)=(k-alpha)/(n-알파-베타+1)α 및 β 은 상수에 의해 결정됩니다.또한,m=alpha+p(1-알파-베타이),gamma=g.

이것은 정말 혼란스럽습니다.무슨 문서화 p(k) 지 않으로 동일 p 앞에서. p(k) 가 플롯 위치.에서는 종이,저자로 쓰기 p_k, 는 도움이 됩니다.때문에 특히 표현에 대 m, 이, p 은 원 p, 고 m = alpha + p * (1 - alpha - beta).개념적으로는 알고리즘에 대한 4-9,포인트(p_k, x[k] 용)삽입된 솔루션을 얻을 수있(p, Q[i](p)).각 알고리즘은 다른 알고리즘에 대 p_k.

으로 지난 비트,R 진술은 무엇 S 를 사용합니다.

원래 종이의 목록을 제공합 6"바람의 속성에 대한 샘플 quantile"기능,고국에 대한 선호#8 을 만족하는 모든 1.#5 을 모두 만족하지만 그들이 그것을 좋아하지 않는 다른 부(그것은 더 현상보다에서 파생된 원칙).#2 은 어떤 비 stat 괴짜 자신과 같은 것을 고려 사분위수하고 무엇에서 설명 wikipedia.

BTW,에 대응하여 dreeves 응답,Mathematica 는 것에 크게 다릅니다.나는 생각을 이해합니다.는 티카의 것은 이해하기 쉽고,(a)의 촬영에서 자신을 발와 무의미한 매개변수,그리고(b)이것은 할 수 없습 R 의 알고리즘#2.(기 학 백과사전 Quantile 페이지, 는 states Mathematica 할 수 없#2 만,간단한 일반화의 모든 다른 알고리즘 관점에서 네 개의 매개 변수입니다.)

다른 팁

거기에 다양한 방법으로 컴퓨팅 변위치 때 당신이 그것을 벡터,고 있지 않 알려진 CDF.

의 문제를 고려 할 때 무엇을 관찰에 떨어지지 않 변위치다.

는"종류"는 단지하는 방법을 결정한다.래 방법들을 통해 말하고,"사용하여 선형 보간 사이 k 번째 순서 통계 및 p(k)".

So,what's p(k)?한 사람은 말하길,"내가 사용하고 싶 k/n".다른 사람이 말하기를,"내가 사용하는 것을 좋아(k-1)/(n-1)"등입니다.이 방법의 각각 다른 속성에 더 적합한 하나의 문제 또는 다른입니다.

의\알파와\베타의 방법으로 매개변수화 하는 기능 p.하나의 경우에,그들은 1 1.다른 경우에,그들은 3/8 및 -1/4.나는 생각하지 않 p 는 이제까지 일정에서 문서입니다.그들이 단지 항상 종속성을 명시적으로 합니다.

무슨 일이 일어 나 다른 유형을 넣으면 벡터처럼 1:5 1:6.

(또한 참고하는 경우에도 당신의 관찰을 가을에 정확히 변위치 특정 유형이 아직도 사용하여 선형 보간).

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow