`aplicar` o `rowMeans` em vários conjuntos de colunas

https://stackoverflow.com/questions/20353209

25-08-2022
|

Pergunta

Desculpe, pessoal, não consigo ver a floresta por causa das árvores.Pesquisei muito mas não consegui encontrar uma solução.Quero, por exemplo, a média para cada unidade (potencialmente o rowMeans) de um subconjunto de variáveis em uma matriz (ou potencialmente um dataframe) em R.Gostaria de selecionar as colunas usando um vetor de indexação como em tapply, que eu chamei a1 no exemplo abaixo.

> set.seed(23958)
> (dat <- matrix(sample(0:3, 10, replace = TRUE), ncol = 5))
     [,1] [,2] [,3] [,4] [,5]
[1,]    2    3    0    2    1
[2,]    2    1    1    2    1

> set.seed(6112)
> (a1 <- sample(1:2, 5, replace = TRUE))
[1] 1 1 2 2 1

A solução neste exemplo deveria ser assim, mas é claro que gostaria de fazer isso de uma forma mais abrangente.Eu estava pensando que deveria usar uma função do apply família, mas não consegui descobrir qual.

> cbind(rowMeans(dat[, a1 == 1]), rowMeans(dat[, a1 == 2]))
         [,1] [,2]
[1,] 2.000000  1.0
[2,] 1.333333  1.5

Solução

Você ainda pode usar tapply aqui:

do.call(rbind,
          tapply(seq_len(ncol(dat)),a1,
           function(i)rowMeans(dat[,i])))

Outras dicas

Se você tresgatar seus dados, você pode usar by:

t(do.call(rbind,by(t(dat),a1,colMeans)))
          1   2
V1 2.000000 1.0
V2 1.333333 1.5

Você também pode usar o aggregate função:

t(aggregate(t(dat), list(a1), mean))

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow