Создание списка смежности из data.frame
Вопрос
У меня есть data.frame с 2 столбцами:Узел A, Узел B.Каждая запись во фрейме подразумевает ребро в графе между узлами A и B.
Должна быть хорошая однострочная строка для преобразования этого data.frame в список смежности.Какие-нибудь намеки?
Решение
Быстро и грязно ...
> edges <- data.frame(nodea=c(1,2,4,2,1), nodeb=c(1,2,3,4,5))
> adjlist <- by(edges, edges$nodea, function(x) x$nodeb)
> for (i in as.character(unique(edges$nodea))) {
+ cat(i, ' -> ', adjlist[[i]], '\n')
+ }
1 -> 1 5
2 -> 2 4
4 -> 3
> adjlist
edges$nodea: 1
[1] 1 5
------------------------------------------------------------
edges$nodea: 2
[1] 2 4
------------------------------------------------------------
edges$nodea: 4
[1] 3
Другие советы
С тех пор, как вы отметили это играграф, как насчет использования встроенной функциональности?
> g <- graph.data.frame( edges )
> adjlist <- get.adjedgelist(g)
Единственное предостережение заключается в том, что вершины индексируются нулем, что будет изменяться с помощью igraph 0.6.
> edges <- data.frame(nodea=c(1,2,4,2,1), nodeb=c(1,2,3,4,5))
> attach(edges)
> tapply(nodeb,nodea,unique)
$`1`
[1] 1 5
$`2`
[1] 2 4
$`4`
[1] 3
как бы вы вообще представили список смежности в R?ему нужны списки переменного размера для набора смежных узлов;итак, тогда вам нужно использовать list();но тогда какой смысл иметь это в R?
я могу придумать неубедительные трюки с функциями, подобными sapply, но они выполняют линейное сканирование для каждого узла.но поиграв 1 минуту, вот:список парных списков, где вторым элементом каждой пары является список смежности.результат более сумасшедший, чем структура данных на самом деле.
> edgelist=data.frame(A=c(1,1,2,2,2),B=c(1,2,2,3,4))
> library(plyr)
> llply(1:max(edgelist), function(a) list(node=a, adjacents=as.list(edgelist$B[edgelist$A==a])))
[[1]]
[[1]]$node
[1] 1
[[1]]$adjacents
[[1]]$adjacents[[1]]
[1] 1
[[1]]$adjacents[[2]]
[1] 2
[[2]]
[[2]]$node
[1] 2
[[2]]$adjacents
[[2]]$adjacents[[1]]
[1] 2
[[2]]$adjacents[[2]]
[1] 3
[[2]]$adjacents[[3]]
[1] 4
[[3]]
[[3]]$node
[1] 3
[[3]]$adjacents
list()
[[4]]
[[4]]$node
[1] 4
[[4]]$adjacents
list()