Pregunta

Quiero hacer el equivalente de este script R:

> csvData <- read.csv(file='/homes/ndeklein/test.csv', head=TRUE, sep='\t')
> csv = subset(csvData, !duplicated(id))

en rpy2. Sin embargo, si importo RPy2.Robjects como R, no reconoce RR ['! Duplicado'] (así):

import rpy2.robjects as R
csvData = R.r['read.csv'](file='/homes/ndeklein/test.csv', head=True, sep='\t')
csv = R.r['subset'](csvData, R.r['!duplicated']('id'))

¿Cómo puedo usar! Duplicada en RPY2?


editar:

R.r['duplicated']

¡Funciona, así que estoy buscando cómo hacer! trabajar en rpy2

¿Fue útil?

Solución

Recibí la respuesta de una lista de correo, en caso de que alguien más la necesite:

Usando r.r '!' en lugar de funciona R.R '! Duplicada'.

# getting the not sign of R
rnot = R.r['!']
# getting duplicated
duplicated = R.r['duplicated']
# get only the rows with unique ids and put it in a new matrix
csvUniqID = R.r['subset'](csvData,  rnot(duplicated(csvData[0])))
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top