PL/RでRモジュールと機能をロード、リスト、および使用する
-
05-10-2019 - |
質問
私は苦労しています:
- PostgreSQLで利用可能なRパッケージと機能をリストします。
- パッケージのインストール(など ケンドール)PL/Rで使用するため
- PostgreSQL内のR関数を呼び出す
利用可能なRパッケージをリストします
Q.1。 どのRモジュールがロードされているかをどのように見つけますか?
SELECT * FROM r_typenames();
それは利用可能なタイプを示していますが、チェックするのはどうですか Kendall( X, Y )
ロードされていますか?たとえば、 ドキュメンテーション ショー:
CREATE TABLE plr_modules (
modseq int4,
modsrc text
);
これにより、記録を挿入してそれを決定することができるようです Kendall
ロードされることになりますが、次のコードは、構文的に、それがロードされることを確認する方法を説明していません。
INSERT INTO plr_modules
VALUES (0, 'pg.test.module.load <-function(msg) {print(msg)}');
Q.2。 あなたがロードしようとしていた場合、上記の線はどのように見えますか Kendall
?
Q.3。 該当しますか?
Rパッケージのインストール
「シナプス」パッケージマネージャーを使用して、次のパッケージがインストールされています。
r-base
r-base-core
r-base-dev
r-base-html
r-base-latex
r-cran-acepack
r-cran-boot
r-cran-car
r-cran-chron
r-cran-cluster
r-cran-codetools
r-cran-design
r-cran-foreign
r-cran-hmisc
r-cran-kernsmooth
r-cran-lattice
r-cran-matrix
r-cran-mgcv
r-cran-nlme
r-cran-quadprog
r-cran-robustbase
r-cran-rpart
r-cran-survival
r-cran-vr
r-recommended
Q.4。 ケンドールがそこにいるかどうかをどうやって知ることができますか?
Q.5。 そうでない場合、どのようなパッケージにあるかを知るにはどうすればよいですか?
Q.6。 インストールに適したパッケージに含まれていない場合 apt-get
(aptitude
, synaptic
, dpkg
, 、あなたは何ですか)、ubuntuにインストールするにはどうすればよいですか?
Q.7。 インストール手順はどこで文書化されていますか?
r関数を呼び出します
次のコードがあります。
EXECUTE 'SELECT '
'regr_slope( amount, year_taken ),'
'regr_intercept( amount, year_taken ),'
'corr( amount, year_taken ),'
'sum( measurements ) AS total_measurements '
'FROM temp_regression'
INTO STRICT slope, intercept, correlation, total_measurements;
このコードは、postgreSQL関数を呼び出します corr
データに対するピアソンの相関を計算します。理想的には、次のことをしたい(切り替えによって corr
にとって plr_kendall
):
EXECUTE 'SELECT '
'regr_slope( amount, year_taken ),'
'regr_intercept( amount, year_taken ),'
'plr_kendall( amount, year_taken ),'
'sum( measurements ) AS total_measurements '
'FROM temp_regression'
INTO STRICT slope, intercept, correlation, total_measurements;
Q.8。 私は書く必要がありますか plr_kendall
私自身?
Q.9。 どこにありますか 単純 通り抜ける例:
- RモジュールをPGにロードします。
- 目的のR関数のPGラッパーを書きます。
- SelectからPGラッパーを呼び出します。
たとえば、最後の2つのステップは次のようになります。
create or replace function plr_kendall( _float8, _float8 ) returns float as '
agg_kendall(arg1, arg2)
' language 'plr';
CREATE AGGREGATE agg_kendall (
sfunc = plr_array_accum,
basetype = float8, -- ???
stype = _float8, -- ???
finalfunc = plr_kendall
);
そして、 SELECT
上記のように?
ありがとうございました!
解決
概要
これらの手順には、pl/rを使用してpostgresqlからR関数を呼び出す方法をリストします。
前提条件
既にPostgreSQL、R、およびPL/Rがインストールされている必要があります。
ステップ
- Rモジュール名を見つけます(例:
Kendall
) - データベースユーザーに変更:
sudo su - postgres
- rを実行します
R
- Rモジュールをインストールします(Accept
$HOME/R/x86_64-pc-linux-gnu-library/2.9/
):install.packages("Kendall", dependencies = TRUE)
- プロンプトが表示されたら、クランミラーを選択します。
- 次の表を作成します。
CREATE TABLE plr_modules ( modseq int4, modsrc text );
- そのテーブルに挿入された指令を問題のRモジュールにロードするよう指示してください。
INSERT INTO plr_modules VALUES (0, 'library(Kendall)' );
- データベースを再起動します(または
SELECT * FROM reload_plr_modules();
):sudo /etc/init.d/postgresql-8.4 restart
- PostgreSQLでラッパー関数を作成します。
CREATE OR REPLACE FUNCTION climate.plr_corr_kendall( double precision[], double precision[] ) RETURNS double precision AS $BODY$ Kendall(arg1, arg2) $BODY$ LANGUAGE 'plr' VOLATILE STRICT;
- ラッパー関数を使用する関数を作成します。
- 新しい関数をテストします。
ラッパー関数
この関数は、データベースからデータを収集し、2つの配列を作成する作業を実行します。これらの配列はに渡されます plr_corr_kendall
ラッパー関数。
CREATE OR REPLACE FUNCTION climate.analysis_vector()
RETURNS double precision AS
$BODY$
DECLARE
v_year_taken double precision[];
v_amount double precision[];
i RECORD;
BEGIN
FOR i IN (
SELECT
extract(YEAR FROM m.taken) AS year_taken,
avg( m.amount ) AS amount
FROM
climate.city c,
climate.station s,
climate.station_category sc,
climate.measurement m
WHERE
c.id = 5148 AND
earth_distance(
ll_to_earth(c.latitude_decimal,c.longitude_decimal),
ll_to_earth(s.latitude_decimal,s.longitude_decimal)) <= 30 AND
s.elevation BETWEEN 0 AND 3000 AND
s.applicable AND
sc.station_id = s.id AND
sc.category_id = 1 AND
extract(YEAR FROM sc.taken_start) >= 1900 AND
extract(YEAR FROM sc.taken_end) <= 2009 AND
m.station_id = s.id AND
m.taken BETWEEN sc.taken_start AND sc.taken_end AND
m.category_id = sc.category_id
GROUP BY
extract(YEAR FROM m.taken)
ORDER BY
extract(YEAR FROM m.taken)
) LOOP
SELECT array_append( v_year_taken, i.year_taken ) INTO v_year_taken;
SELECT array_append( v_amount, i.amount::double precision ) INTO v_amount;
END LOOP;
RAISE NOTICE '%', v_year_taken;
RAISE NOTICE '%', v_amount;
RETURN climate.plr_corr_kendall( v_year_taken, v_amount );
END;
$BODY$
LANGUAGE 'plpgsql' VOLATILE
COST 100;
テスト
次のように関数をテストします。
SELECT
*
FROM
climate.analysis_vector();
結果
番号:-0.0578900910913944