質問

apache.commons.math ライブラリを使用して、rスクリプトをJavaに変換しようとしています。 org.apacheを使用できますか。 commons.math.Analysis.Interpolation.loessInterpolator r less ?私は同じ結果を得ることができません。

編集

これは、ランダムな配列(x、y)を作成し、LoessInterpolatorを使って貸し出しを算出するJavaプログラムです。最後に、結果が印刷されます。

import java.io.*;
import java.util.Random;

import org.apache.commons.math.analysis.interpolation.LoessInterpolator;


public class TestLoess
    {
    private String RScript="/usr/local/bin/Rscript";
    private static class ConsummeInputStream
        extends Thread
        {
        private InputStream in;
        ConsummeInputStream(InputStream in)
            {
            this.in=in;
            }
        @Override
        public void run()
            {
            try
                {
                int c;
                while((c=this.in.read())!=-1) 
                    System.err.print((char)c);
                }
            catch(IOException err)
                {
                err.printStackTrace();
                }
            }
        }
    TestLoess()
        {

        }
    private void run() throws Exception
        {
        int num=100;
        Random rand=new Random(0L);
        double x[]=new double[num];
        double y[]=new double[x.length];
        for(int i=0;i< x.length;++i)
            {
            x[i]=rand.nextDouble()+(i>0?x[i-1]:0);
            y[i]=Math.sin(i)*100;
            }
        LoessInterpolator loessInterpolator=new LoessInterpolator(
            0.75,//bandwidth,
            2//robustnessIters

            );
        double y2[]=loessInterpolator.smooth(x, y);

        Process proc=Runtime.getRuntime().exec(
            new String[]{RScript,"-"}
            );
        ConsummeInputStream errIn=new ConsummeInputStream(proc.getErrorStream());
        BufferedReader stdin=new BufferedReader(new InputStreamReader(proc.getInputStream()));
        PrintStream out=new PrintStream(proc.getOutputStream());
        errIn.start();
        out.print("T<-as.data.frame(matrix(c(");
        for(int i=0;i< x.length;++i)
            {
            if(i>0) out.print(',');
            out.print(x[i]+","+y[i]);
            }
        out.println("),ncol=2,byrow=TRUE))");
        out.println("colnames(T)<-c('x','y')");
        out.println("T2<-loess(y ~ x, T)");
        out.println("write.table(residuals(T2),'',col.names= F,row.names=F,sep='\\t')");
        out.flush();
        out.close();
        double y3[]=new double[x.length];
        for(int i=0;i< y3.length;++i)
            {
            y3[i]=Double.parseDouble(stdin.readLine());
            }
        System.out.println("X\tY\tY.java\tY.R");
        for(int i=0;i< y3.length;++i)
            {
            System.out.println(""+x[i]+"\t"+y[i]+"\t"+y2[i]+"\t"+y3[i]);
            }
        }

    public static void main(String[] args)
        throws Exception
        {
        new TestLoess().run();
        }
    }
.

コンパイル&exec:

javac -cp commons-math-2.2.jar TestLoess.java && java -cp commons-math-2.2.jar:. TestLoess
.

出力:

X   Y   Y.java  Y.R
0.730967787376657   0.0 6.624884763714674   -12.5936186703287
0.9715042030481429  84.14709848078965   6.5263049649584 71.9725380029913
1.6089216283982513  90.92974268256818   6.269100654071115   79.839773167581
2.159358633515885   14.112000805986721  6.051308261720918   3.9270340708818
2.756903911313087   -75.68024953079282  5.818424835586378   -84.9176311089431
3.090122310789737   -95.89242746631385  5.689740879461759   -104.617807889069
3.4753114955304554  -27.941549819892586 5.541837854229562   -36.0902352062634
4.460153035730264   65.6986598718789    5.168028655980764   58.9472823439219
5.339335553602744   98.93582466233818   4.840314399516663   93.3329030534449
6.280584733084859   41.21184852417566   4.49531113985498    36.7282165788057
6.555538699120343   -54.40211108893698  4.395343460231256   -58.5812856445538
6.68443584999412    -99.99902065507035  4.348559404444451   -104.039069260889
6.831037507640638   -53.657291800043495 4.295400167908642   -57.5419313320511
6.854275630124528   42.016703682664094  4.286978656933373   38.1564179414478
7.401015387322993   99.06073556948704   4.089252482141094   95.7504087842369
8.365502247999844   65.02878401571168   3.7422883733498726  62.5865641279576
8.469992934250815   -28.790331666506532 3.704793544880599   -31.145867173504
9.095139297716374   -96.13974918795569  3.4805388562453574  -98.0047896609079
9.505935493207435   -75.09872467716761  3.3330472034239405  -76.6664588290508
.

Yの出力値は明らかにRとJavaの間では同じではありません。それらは列がよく見えます(元のY列の近くにあります)。 y.java~ y.rを取得するためにこれをどのように変更すればいいですか?

役に立ちましたか?

解決

JavaとRバージョンを同じにするには、3つの入力パラメータのデフォルト値を変更する必要があります。

  1. Java LoessInterPolatorは線形局所多項式回帰のみを行いますが、Rは線形(度= 1)、2次(度= 2)、および奇妙な程度= 0オプションをサポートします。そのため、Rのdegree=1をJavaと同じにする必要があります。

  2. loessInterpolatorのデフォルトの繰り返しDEFAULT_ROBUSTNESS_ITERS=2の数ですが、R Defaults iterations=4の数。そのため、R(Xは反復数です)でcontrol = loess.control(iterations=X)を設定する必要があります。

  3. loessInterpolatorのデフォルトはDEFAULT_BANDWIDTH=0.3ですが、R Defaults span=0.75

他のヒント

Javaの実装のために話すことはできませんが、lowessにはフィットの帯域幅を制御する多くのパラメータがあります。同じコントロールパラメータでフィットするのでない限り、結果が異なると予想されます。データを平滑化しているときはいつでも私の推薦は元のデータとフィットをプロットし、そして自分の管理パラメータを忠実度と平滑化(別名ノイズ除去)の間のあなたの希望のトレードオフを生み出すのかを決めることです。

ここには2つの問題があります。最初にあなたが生成しているデータをプロットすると、ほとんどランダムに見え、Rの黄口によって生成されたフィットは非常に貧弱です。

plot(T$x, T$y)
lines(T$s, T2$fitted, col="blue", lwd=3)
.

R

によって生成された黄率フィットで上記のJavaコードによって生成されたデータのプロット

それからあなたのRスクリプトであなたは予測ではなく残差を書いているので、この行で

out.println("write.table(residuals(T2),'',
   col.names= F,row.names=F,sep='\\t')");
.

residuals(T2)predict(T2) e.gに変更する必要があります。

out.println("write.table(predict(T2),'',
   col.names= F,row.names=F,sep='\\t')");
.

だからあなたのコード例の純粋なチャンスで、Rによって生成された残差の最初の2行の残差が良いフィット感を見ました。

私がもう少し適切なデータでフィットすると、JavaとRは似ていますが、同じ結果を返します。また、デフォルトの robustnessiter 設定を調整しなかった場合、結果が近づいていました。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top