R : 여러 선형 회귀 분석의 모든 계수에 대해 p 값을 가져옵니다 (참조 레벨 포함).
-
21-12-2019 - |
문제
예제
3 개의 설명 요소 변수가있는 숫자 종속 변수가있는 선형 회귀가 있습니다.각 팩터 변수에는 2 단계가 있습니다.
install.packages("robustbase")
install.packages("MASS")
require(robustbase)
require(MASS)
# Example data
data(npk)
df= npk[,-1]
str(df)
# 'data.frame': 24 obs. of 4 variables:
# $ N : Factor w/ 2 levels "0","1": 1 2 1 2 2 2 1 1 1 2 ...
# $ P : Factor w/ 2 levels "0","1": 2 2 1 1 1 2 1 2 2 2 ...
# $ K : Factor w/ 2 levels "0","1": 2 1 1 2 1 2 2 1 1 2 ...
# $ yield: num 49.5 62.8 46.8 57 59.8 58.5 55.5 56 62.8 55.8 ...
set.seed(0)
model <- lmrob(yield ~ N + P + K - 1, data= df)
.
작업
나는 model
객체의 각 계수에 대해 p 값에 액세스하려고합니다.불필요한 가로 촬영을 피하기 위해 이미 공식에서 - 1
를 사용하고 있습니다.
summary(model)$coefficients
# Estimate Std. Error t value Pr(>|t|)
# N0 54.644672 2.400075 22.7678995 8.972084e-16
# N1 60.166737 1.966661 30.5933467 2.858276e-18
# P1 -1.059299 2.139443 -0.4951286 6.259053e-01
# K1 -3.905052 2.226012 -1.7542822 9.469295e-02
.
P
및 K
의 기준선 (참조) 레벨이 숨겨져있는 것으로 보입니다.
질문
어떻게 P-values에 대한 P-values에 대한 P-value에 대한 프로세스를 변경할 수 있습니까?
참고 : 나는 실제로 실제로 실제로 내 실제 문제를 강력한 회귀 함수로 사용하고 있기 때문에 실제로는 실제로 regression 함수로 사용하기 때문에 재현 할 수없는 것에 더 잘 유지하기로 결정했습니다.예제.
해결책
추정되는 p 값은 다음과 같습니다.
coef(summary(model))[, 4]
.
기준 레벨에 관해서, 모델은 치료 대조를 이용하여 기준 레벨의 값이 모두 0이므로 p 값을 요구하는 것은 의미가 없습니다.
제휴하지 않습니다 StackOverflow