R: Estandarizar usando funciones media y SD
-
11-12-2019 - |
Pregunta
Estoy tratando de hacer una transformación simple.He usado el siguiente código y funcionó bien:
data_stdz <- transform(data_header, z.v1 = v1+2)
Pero, no puedo obtener el siguiente código para trabajar:
data_stdz <- transform(data_header, z.v1 = (v1 - mean(v1))/(2*sd(v1))
También he intentado obtener la función media para trabajar:
data_stdz <- transform(data_header, z.v1 = mean(v1)
Pero, sigo recibiendo el siguiente error:
Error: unexpected symbol in:
"data_std2 <- transform(data_header, z.v1 = mean(v1)
data_std2"
Así que supongo que tiene algo que ver con la forma en que estoy usando la función media y SD, pero no he podido resolverlo.
Ejemplo de datos:
v1 v2 v3
6.7 3.8 1.2
6.3 3.2 1.2
6.1 2.6 1.6
7 2.4 1
NA NA NA
6.5 3.6 2.6
6.1 2.4 1.6
6 5.6 5.2
7 2.8 1
6.7 3.8 1.4
5.7 4.2 2.6
5.1 5.6 5
NA NA NA
Solución
Your problem is likely (in additon to what gavin said) the NAs. Use na.rm=TRUE
as in:
transform(data_header, z.v1 = (v1 - mean(v1, na.rm =T))/(2*sd(v1, na.rm =T)))
Otros consejos
Base R has the scale()
function for this purpose.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow