Sélection d'une ligne spécifique à partir d'une trame de données de rpy2
-
08-10-2019 - |
Question
Mon cadre de données sont des données d'enquête que j'ai obtenu d'un fichier .csv. L'une des colonnes est l'âge et je cherche à éliminer tous les répondants de moins de 18 ans. Je vais alors besoin de groupes d'âge isolés (18-24, 25-35, etc.) dans leurs propres dataframes que je peux faire des distributions de fréquences pour.
x.sub <- subset(x.df, y > 2)
Mais je ne peux pas comprendre comment utiliser la fonction r () pour obtenir ma variable dataframe de python dans une déclaration de R. On se sent comme si il devrait y avoir une fonction .subset () dans la classe rpy2 de dataframe. Mais si elle existe, je ne peux pas le trouver.
La solution
Utilisation rpy2 2.2.0-dev (devrait être la même chose avec 2.1.x)
from rpy2.robjects.vectors import DataFrame
dataf = DataFrame.from_csvfile("my/file.csv")
dataf_subset = dataf.rx(dataf.rx2("age").ro >= 18, True)
Ce qu'un exemple exact n'est pas dans la documentation (et peut-être devrait être là), mais il est en train de constituer des éléments sont les suivants: éléments et extraction opérateurs R des vecteurs