3つ以上のパラメトリック予測因子を備えたRでのローースの実装または同様の効果へのトリックはありますか?
-
28-10-2019 - |
質問
すべての専門家に電話します ローカル回帰 および/または r!
私は標準の制限に遭遇しました 黄土 機能します r そして、あなたがいくつかのアドバイスをすることを願っています。現在の実装 1〜4の予測因子のみをサポートします. 。アプリケーションのシナリオを設定して、これが採用したいとすぐに簡単に問題になる理由を示しましょう グローバルにパラメトリックな共変量を適合させます.
基本的に、空間的な歪みがあります s(x、y) 多くの測定値にわたってオーバーレイされます z:
z_i = s(x_i,y_i) + v_{g_i}
これらの測定 z 同じ基礎となる歪みのない測定値によってグループ化できます v 各グループに対して g. 。グループメンバーシップG_Iは各測定で知られていますが、グループの根底にある歪みのない測定値V_Gは知られておらず、()によって決定されるべきである必要があります。グローバル, 、ローカルではなく)回帰。
2次元の空間的傾向を推定する必要があります s(x、y), 、それを削除したいと思います。当社のアプリケーションでは、最も単純なシナリオでは、それぞれ少なくとも35の測定値の20のグループがあるとします。測定値はランダムに配置されます。最初のグループを参照として使用すると、19の不明なオフセットがあります。
以下のおもちゃのデータのコード(1つの次元の空間的傾向があります バツ)2つまたは3つのオフセットグループで動作します。
残念ながら、 黄土 エラーメッセージを使用して、4つ以上のオフセットグループでコールが失敗します
Error in simpleLoess(y, x, w, span, degree, parametric, drop.square,
normalize, :
only 1-4 predictors are allowed"
制限を無効にしようとしました
k>d2MAX in ehg136. Need to recompile with increased dimensions.
それはどれほど簡単でしょうか?の定義が見つかりません d2max どこでも、これはハードコードされているようです - エラーは明らかに行#1359でトリガーされます loessf.f
if(k .gt. 15) call ehg182(105)
あるいは、ここで適用できるグローバルな(パラメトリック)オフセットグループを使用したローカル回帰の実装を知っている人はいますか?
それとも、これに対処するより良い方法はありますか?私は試した LME 相関構造では、それははるかに遅いようです。
どんなコメントも大歓迎です!
どうもありがとう、
デビッド
###
#
# loess with parametric offsets - toy data demo
#
x<-seq(0,9,.1);
x.N<-length(x);
o<-c(0.4,-0.8,1.2#,-0.2 # works for three but not four
); # these are the (unknown) offsets
o.N<-length(o);
f<-sapply(seq(o.N),
function(n){
ifelse((seq(x.N)<= n *x.N/(o.N+1) &
seq(x.N)> (n-1)*x.N/(o.N+1)),
1,0);
});
f<-f[sample(NROW(f)),];
y<-sin(x)+rnorm(length(x),0,.1)+f%*%o;
s.fs<-sapply(seq(NCOL(f)),function(i){paste('f',i,sep='')});
s<-paste(c('y~x',s.fs),collapse='+');
d<-data.frame(x,y,f)
names(d)<-c('x','y',s.fs);
l<-loess(formula(s),parametric=s.fs,drop.square=s.fs,normalize=F,data=d,
span=0.4);
yp<-predict(l,newdata=d);
plot(x,y,pch='+',ylim=c(-3,3),col='red'); # input data
points(x,yp,pch='o',col='blue'); # fit of that
d0<-d; d0$f1<-d0$f2<-d0$f3<-0;
yp0<-predict(l,newdata=d0);
points(x,y-f%*%o); # spatial distortion
lines(x,yp0,pch='+'); # estimate of that
op<-sapply(seq(NCOL(f)),function(i){(yp-yp0)[!!f[,i]][1]});
cat("Demo offsets:",o,"\n");
cat("Estimated offsets:",format(op,digits=1),"\n");
解決
これに加算モデルを使用してみませんか?パッケージ MGCV あなたの質問を理解しているなら、この種のモデルを処理します。私はこれを間違っているかもしれませんが、あなたが示すコードはx〜yに関連していますが、あなたの質問はz〜s(x、y) + gに言及しています。以下に示したもの gam()
応答用です z
空間的な滑らかでモデル化されています x
と y
と g
パラメトリックに推定される g
データフレームの要因として保存されています:
require(mgcv)
m <- gam(z ~ s(x,y) + g, data = foo)
それとも、私はあなたが欲しいものを誤解しましたか?データの小さなスニペットを投稿したい場合は、適切な例を使用して提供できます MGCV...?