Функции более высокого уровня в R - есть ли официальный оператор Compose или функция карри?
-
19-09-2019 - |
Вопрос
Я могу создать оператора Compose в R:
`%c%` = function(x,y)function(...)x(y(...))
Для использования так:
> numericNull = is.null %c% numeric
> numericNull(myVec)
[2] TRUE FALSE
Но я хотел бы знать, есть ли официальный набор функций для выполнения таких вещей и других операций, таких как карри, в R. В основном это, чтобы уменьшить количество кронштейнов, ключевых слов функций и т. Д. В моем коде.
Моя функция карри:
> curry=function(...){
z1=z0=substitute(...);z1[1]=call("list");
function(...){do.call(as.character(z0[[1]]),
as.list(c(eval(z1),list(...))))}}
> p = curry(paste(collapse=""))
> p(letters[1:10])
[1] "abcdefghij"
Это особенно приятно для заполнения EG:
> df = data.frame(l=sample(1:3,10,rep=TRUE), t=letters[1:10])
> aggregate(df$t,df["l"],curry(paste(collapse="")) %c% toupper)
l x
1 1 ADG
2 2 BCH
3 3 EFIJ
Который я нахожу гораздо более элегантным и редактируемым, чем:
> aggregate(df$t, df["l"], function(x)paste(collapse="",toupper(x)))
l x
1 1 ADG
2 2 BCH
3 3 EFIJ
В основном я хочу знать - это уже было сделано для R?
Решение
Стандартное место для функционального программирования в R теперь является functional
библиотека.
Из библиотеки:
Функциональный: карри, компонент и другие функции высшего порядка
Пример:
library(functional)
newfunc <- Curry(oldfunc,x=5)
Cran:https://cran.r-project.org/web/packages/functional/index.html
PS: эта библиотека заменяет ROxigen
библиотека.
Другие советы
Обе эти функции действительно существуют в а roxygen
упаковка (Смотрите исходный код здесь) от Питера Даненберга (первоначально основывался на Решение Байрона Эллиса на r-help):
Curry <- function(FUN,...) {
.orig = list(...);
function(...) do.call(FUN,c(.orig,list(...)))
}
Compose <- function(...) {
fs <- list(...)
function(...) Reduce(function(x, f) f(x),
fs,
...)
}
Обратите внимание на использование Reduce
функция, которая может быть очень полезна при попытке выполнять функциональное программирование в R. См. Map
а также Filter
).
И ваш пример карри (немного отличается от этого использования):
> library(roxygen)
> p <- Curry(paste, collapse="")
> p(letters[1:10])
[1] "abcdefghij"
Вот пример, чтобы показать полезность Compose
(Применяя три разных функции к буквам):
> Compose(function(x) x[length(x):1], Curry(paste, collapse=""), toupper)(letters)
[1] "ZYXWVUTSRQPONMLKJIHGFEDCBA"
И ваш последний пример будет работать так:
> aggregate(df[,"t"], df["l"], Compose(Curry(paste, collapse=""), toupper))
l x
1 1 ABG
2 2 DEFH
3 3 CIJ
Наконец, вот способ сделать то же самое с plyr
(также можно легко сделать с by
или же aggregate
Как уже показано):
> library(plyr)
> ddply(df, .(l), function(df) paste(toupper(df[,"t"]), collapse=""))
l V1
1 1 ABG
2 2 DEFH
3 3 CIJ
В Роксиген упаковка.
Найдено через этот разговор в архиве R Mail.
Более сложный подход требуется, если вы хотите, чтобы «имена» переменных проходили точнее.
Например, если вы делаете plot(rnorm(1000),rnorm(1000))
Тогда вы получите хорошие этикетки на ваших осях X- и Y-. Другой пример этого - data.frame
> data.frame( rnorm(5), rnorm(5), first=rpois(5,1), second=rbinom(5,1,0.5) )
rnorm.5. rnorm.5..1 first second
1 0.1964190 -0.2949770 0 0
2 0.4750665 0.8849750 1 0
3 -0.7829424 0.4174636 2 0
4 1.6551403 1.3547863 0 1
5 1.4044107 -0.4216046 0 0
Не то, чтобы Data.Frame назначил полезные имена для столбцов.
Некоторые реализации Curry могут не делать это должным образом, что приводит к нечитаемым именам столбцам и меткам сюжетов. Вместо этого я теперь использую что -то вроде этого:
Curry <- function(FUN, ...) {
.orig = match.call()
.orig[[1]] <- NULL # Remove first item, which matches Curry
.orig[[1]] <- NULL # Remove another item, which matches FUN
function(...) {
.inner = match.call()
.inner[[1]] <- NULL # Remove first item, which matches Curry
do.call(FUN, c(.orig, .inner), envir=parent.frame())
}
}
Это довольно сложно, но я думаю, что это правильно. match.call
Пойдет все аргументы, полностью запомнив, какие выражения определяют ARG (это необходимо для хороших ярлыков). Проблема в том, что он ловит слишком много аргументов - не только ...
но и FUN
. Анкет Это также помнит название функции, которую называется (Curry
).
Поэтому мы хотим удалить эти первые две записи в .orig
чтобы .orig
действительно просто соответствует ...
аргументы. Вот почему мы делаем .orig[[1]]<-NULL
Дважды - каждый раз удаляет запись и смещает все остальное влево.
Это завершает определение, и теперь мы можем сделать следующее, чтобы получить в яблочко так же, как и выше
Curry(data.frame, rnorm(5), rnorm(5) )( first=rpois(5,1) , second=rbinom(5,1,0.5) )
Последняя примечание на envir=parent.frame()
. Анкет Я использовал это, чтобы убедиться, что не будет проблемы, если у вас есть внешние переменные, называемые '.inner' или '.orig'. Теперь все переменные оцениваются в том месте, где называется карри.