Die Auswahl einer bestimmten Zeile aus einem rpy2 Datenrahmen

https://stackoverflow.com/questions/4355783

rpy2

08-10-2019
|

Frage

Meine Datenrahmen Umfragedaten, dass ich aus einer CSV-Datei bekommen haben. Eine der Säulen ist das Alter, und ich bin auf der Suche alle Befragten unter 18 Jahren zu entfernen. Ich werde dann zu isolieren Altersgruppen benötigen (18-24, 25-35, usw.) in ihre eigenen Datenrahmen, dass ich für Häufigkeitsverteilungen tun kann.

Der R-Code ist einfach genug :

x.sub <- subset(x.df, y > 2)

Aber ich kann nicht herausfinden, wie die r () Funktion verwenden, um meinen Datenrahmen Variable aus Python in eine R Aussage. Es fühlt sich an, als ob es sollte eine .subset () Funktion in der rpy2 Dataframe-Klasse sein. Aber wenn es vorhanden ist, kann ich es nicht finden.

Lösung

Mit rpy2 2.2.0-dev (sollte das gleiche mit 2.1.x sein)

from rpy2.robjects.vectors import DataFrame
dataf = DataFrame.from_csvfile("my/file.csv")

dataf_subset = dataf.rx(dataf.rx2("age").ro >= 18, True)

Dass man genau Beispiel ist in der Dokumentation nicht (und kann sollte es sein), aber es ist enden Elemente sind: Extrahieren Elemente und R Operatoren auf Vektoren

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow