Sélection d'une ligne spécifique à partir d'une trame de données de rpy2

https://stackoverflow.com/questions/4355783

rpy2

08-10-2019
|

Question

Mon cadre de données sont des données d'enquête que j'ai obtenu d'un fichier .csv. L'une des colonnes est l'âge et je cherche à éliminer tous les répondants de moins de 18 ans. Je vais alors besoin de groupes d'âge isolés (18-24, 25-35, etc.) dans leurs propres dataframes que je peux faire des distributions de fréquences pour.

Le code R est assez simple :

x.sub <- subset(x.df, y > 2)

Mais je ne peux pas comprendre comment utiliser la fonction r () pour obtenir ma variable dataframe de python dans une déclaration de R. On se sent comme si il devrait y avoir une fonction .subset () dans la classe rpy2 de dataframe. Mais si elle existe, je ne peux pas le trouver.

La solution

Utilisation rpy2 2.2.0-dev (devrait être la même chose avec 2.1.x)

from rpy2.robjects.vectors import DataFrame
dataf = DataFrame.from_csvfile("my/file.csv")

dataf_subset = dataf.rx(dataf.rx2("age").ro >= 18, True)

Ce qu'un exemple exact n'est pas dans la documentation (et peut-être devrait être là), mais il est en train de constituer des éléments sont les suivants: éléments et extraction opérateurs R des vecteurs

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow