Вопрос
Мне трудно реализовать функцию с помощью Rcpp
модуль с использованием cppFunction
.Мне нужно использовать что-то вроде R intersect
с двумя типами NumericVector и вернуть еще один NumericVector с результатом, как в R.
Этот документ оказал некоторую помощь, но, к сожалению, я в значительной степени новичок в C++.
Как я мог реализовать intersect
R-функция с cppFunction
?
Спасибо
Решение
Вероятно, вы захотите использовать что-то вроде unordered_set
реализовать intersect
:
Файл myintersect.cpp
:
#include <Rcpp.h>
using namespace Rcpp;
// Enable C++11 via this plugin (Rcpp 0.10.3 or later)
// [[Rcpp::plugins(cpp11)]]
// [[Rcpp::export]]
NumericVector myintersect(NumericVector x, NumericVector y) {
std::vector<double> res;
std::unordered_set<double> s(y.begin(), y.end());
for (int i=0; i < x.size(); ++i) {
auto f = s.find(x[i]);
if (f != s.end()) {
res.push_back(x[i]);
s.erase(f);
}
}
return Rcpp::wrap(res);
}
Мы можем загрузить функцию и проверить ее работу:
library(Rcpp)
sourceCpp(file="myintersect.cpp")
set.seed(144)
x <- c(-1, -1, sample(seq(1000000), 10000, replace=T))
y <- c(-1, sample(seq(1000000), 10000, replace=T))
all.equal(intersect(x, y), myintersect(x, y))
# [1] TRUE
Однако, похоже, этот подход гораздо менее эффективен, чем itersect
функция:
library(microbenchmark)
microbenchmark(intersect(x, y), myintersect(x, y))
# Unit: microseconds
# expr min lq median uq max neval
# intersect(x, y) 424.167 495.861 501.919 523.7835 989.997 100
# myintersect(x, y) 1778.609 1798.111 1808.575 1835.1570 2571.426 100
Не связан с StackOverflow