Вопрос
Я хотел бы выбрать строки на основе подмножеств их имен, например,
Если у меня есть следующие данные:
data <- structure(c(91, 92, 108, 104, 87, 91, 91, 97, 81, 98),
.Names = c("fee-", "fi", "fo-", "fum-", "foo-", "foo1234-", "123foo-",
"fum-", "fum-", "fum-"))
Как выбрать строки, соответствующие «Foo»?
Использование GREP () не работает:
grep('foo', data)
Возвращает:
integer(0)
Что я делаю неправильно? Или, есть ли лучший способ?
Спасибо!
Решение
Вам нужно grep имена свойство данных, а не свойство значений.
Для вашего примера используйте
> grep("foo",names(data))
[1] 5 6 7
> data[grep("foo",names(data))]
foo- foo1234- 123foo-
87 91 91
Один другой чистый способ сделать это использует кадры данных.
> data <- data.frame(values=c(91, 92, 108, 104, 87, 91, 91, 97, 81, 98),
names = c("fee-", "fi", "fo-", "fum-", "foo-", "foo1234-", "123foo-",
"fum-", "fum-", "fum-"))
> data$values[grep("foo",data$names)]
[1] 87 91 91
Другие советы
Используйте подмножество в сочетании с регулярными выражениями:
subset(your_data, regexpr("foo", your_data$your_column_to_match) > 0))
Если вы просто заботитесь о наборе данных с одним столбцом, я думаю, вам не нужно указывать имя столбца ...
Филипп
> grep("foo",names(data), value=T)
[1] "foo-" "foo1234-" "123foo-"
Если значение верно, он возвращает содержимое вместо указателя
Не связан с StackOverflow