Chargement, liste, et en utilisant des modules R et fonctions PL / R
-
05-10-2019 - |
Question
J'éprouve des difficultés avec:
- Liste des packages R et fonctions disponibles pour PostgreSQL.
- Installation d'un paquet (tel que Kendall ) pour une utilisation avec PL / R
- Appeler une fonction R dans les PostgreSQL
Liste disponibles R Packages
Q.1. Comment savoir quels modules R ont été chargés?
SELECT * FROM r_typenames();
qui montre les types qui sont disponibles, mais qu'en est-vérifier si Kendall( X, Y )
est chargé? Par exemple, le documentation montre:
CREATE TABLE plr_modules (
modseq int4,
modsrc text
);
Cela semble permettre l'insertion d'enregistrements de dicter que Kendall
doit être chargé, mais le code suivant n'explique pas, syntaxiquement, comment assurer qu'il se charge:
INSERT INTO plr_modules
VALUES (0, 'pg.test.module.load <-function(msg) {print(msg)}');
Q.2. Quel serait le look ligne ci-dessus comme si vous essayez de charger Kendall
?
Q.3. est-il applicable?
Installation de packages R
Utilisation du gestionnaire de paquets « synaptique » les paquets suivants ont été installés:
r-base
r-base-core
r-base-dev
r-base-html
r-base-latex
r-cran-acepack
r-cran-boot
r-cran-car
r-cran-chron
r-cran-cluster
r-cran-codetools
r-cran-design
r-cran-foreign
r-cran-hmisc
r-cran-kernsmooth
r-cran-lattice
r-cran-matrix
r-cran-mgcv
r-cran-nlme
r-cran-quadprog
r-cran-robustbase
r-cran-rpart
r-cran-survival
r-cran-vr
r-recommended
Q.4. Comment puis-je savoir si Kendall est là-dedans?
Q.5. Dans le cas contraire, comment puis-je savoir quel paquet il est en
Q.6. Si ce n'est pas dans un emballage approprié pour l'installation avec apt-get
(aptitude
, synaptic
, dpkg
, ce que vous avez), comment dois-je procéder installer sur Ubuntu?
Q.7. Où sont les étapes d'installation documentées?
Appel de fonctions R
Je le code suivant:
EXECUTE 'SELECT '
'regr_slope( amount, year_taken ),'
'regr_intercept( amount, year_taken ),'
'corr( amount, year_taken ),'
'sum( measurements ) AS total_measurements '
'FROM temp_regression'
INTO STRICT slope, intercept, correlation, total_measurements;
Ce code appelle la fonction PostgreSQL corr
pour calculer la corrélation de Pearson sur les données. Idéalement, je voudrais faire ce qui suit (en passant corr
pour plr_kendall
):
EXECUTE 'SELECT '
'regr_slope( amount, year_taken ),'
'regr_intercept( amount, year_taken ),'
'plr_kendall( amount, year_taken ),'
'sum( measurements ) AS total_measurements '
'FROM temp_regression'
INTO STRICT slope, intercept, correlation, total_measurements;
Q.8. Dois-je plr_kendall
d'écrire moi-même?
Q.9 Où puis-je trouver un simples par exemple qui marche à travers:.
- Chargement d'un module de R dans PG.
- Ecrire une enveloppe de PG de la fonction de R désiré.
- Appeler l'emballage PG d'un SELECT.
Par exemple, seraient les deux dernières étapes ressembler à:
create or replace function plr_kendall( _float8, _float8 ) returns float as '
agg_kendall(arg1, arg2)
' language 'plr';
CREATE AGGREGATE agg_kendall (
sfunc = plr_array_accum,
basetype = float8, -- ???
stype = _float8, -- ???
finalfunc = plr_kendall
);
Et puis le SELECT
comme ci-dessus?
Merci!
La solution
Aperçu
Ces liste étapes comment appeler une fonction R de PostgreSQL en utilisant PL / R.
Prerequisties
Vous devez déjà avoir PostgreSQL, R et PL / R installé.
Étapes
- En R Nom du module (par exemple,
Kendall
) - Modifier à l'utilisateur de base de données:
sudo su - postgres
- Exécuter R
R
- Installer R Module (accepter
$HOME/R/x86_64-pc-linux-gnu-library/2.9/
):install.packages("Kendall", dependencies = TRUE)
- Choisissez un miroir CRAN, lorsque vous êtes invité.
- Créer le tableau suivant:
CREATE TABLE plr_modules ( modseq int4, modsrc text );
- Insérer dans cette table la directive R pour charger le module en question:
INSERT INTO plr_modules VALUES (0, 'library(Kendall)' );
- Redémarrez la base de données (ou
SELECT * FROM reload_plr_modules();
):sudo /etc/init.d/postgresql-8.4 restart
- Créer une fonction wrapper dans PostgreSQL:
CREATE OR REPLACE FUNCTION climate.plr_corr_kendall( double precision[], double precision[] ) RETURNS double precision AS $BODY$ Kendall(arg1, arg2) $BODY$ LANGUAGE 'plr' VOLATILE STRICT;
- Créer une fonction qui utilise la fonction enveloppe.
- Tester la nouvelle fonction.
Wrapper Fonction
Cette fonction effectue le travail de collecte de données à partir de la base de données et la création de deux matrices. Ces tableaux sont passés dans la fonction enveloppe de plr_corr_kendall
.
CREATE OR REPLACE FUNCTION climate.analysis_vector()
RETURNS double precision AS
$BODY$
DECLARE
v_year_taken double precision[];
v_amount double precision[];
i RECORD;
BEGIN
FOR i IN (
SELECT
extract(YEAR FROM m.taken) AS year_taken,
avg( m.amount ) AS amount
FROM
climate.city c,
climate.station s,
climate.station_category sc,
climate.measurement m
WHERE
c.id = 5148 AND
earth_distance(
ll_to_earth(c.latitude_decimal,c.longitude_decimal),
ll_to_earth(s.latitude_decimal,s.longitude_decimal)) <= 30 AND
s.elevation BETWEEN 0 AND 3000 AND
s.applicable AND
sc.station_id = s.id AND
sc.category_id = 1 AND
extract(YEAR FROM sc.taken_start) >= 1900 AND
extract(YEAR FROM sc.taken_end) <= 2009 AND
m.station_id = s.id AND
m.taken BETWEEN sc.taken_start AND sc.taken_end AND
m.category_id = sc.category_id
GROUP BY
extract(YEAR FROM m.taken)
ORDER BY
extract(YEAR FROM m.taken)
) LOOP
SELECT array_append( v_year_taken, i.year_taken ) INTO v_year_taken;
SELECT array_append( v_amount, i.amount::double precision ) INTO v_amount;
END LOOP;
RAISE NOTICE '%', v_year_taken;
RAISE NOTICE '%', v_amount;
RETURN climate.plr_corr_kendall( v_year_taken, v_amount );
END;
$BODY$
LANGUAGE 'plpgsql' VOLATILE
COST 100;
test
Test de la fonction comme suit:
SELECT
*
FROM
climate.analysis_vector();
Résultat
Un numéro: -0,0578900910913944